智能体
大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源
当前最强大的大语言模型(LLM)虽然代码能力飞速发展,但在解决真实、复杂的机器学习工程(MLE)任务时,仍像是在进行一场“闭卷考试”。 它们可以在单次尝试中生成代码,却无法模拟人类工程师那样,在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。 为了打破这一瓶颈,来自佐治亚理工学院和斯坦福大学的研究团队正式推出了 MLE-Dojo,一个专为训练和评测大模型智能体(LLM Agents)设计的“交互式武馆”。
7/28/2025 8:45:00 AM
广义智能体理论:智能时代通向「万物理论」的新路径?
在现代科学的宏伟蓝图上,「万物理论」(Theory of Everything)代表着一个大一统的梦想:构建一个包罗万象、逻辑自洽的理论体系。 它的雄心在于,用最少的本源法则,去解释宇宙间森罗万象的现象——从宇宙大爆炸的奇点、时空本身的弯曲,到基本粒子的相互作用、再到化学键的构成、DNA链的螺旋,直至智能的萌发与自我意识的诞生。 然而,通往这一「梦想」理论的道路上,横亘着现代物理学最深刻的两大鸿沟:其一,是在宏观尺度上描述引力的广义相对论,与在微观尺度上主导一切的量子力学之间,存在着根本性的不相容;其二,物理学中的四大基本作用力(引力、电磁力、强核力、弱核力)至今未能被纳入一个统一的理论之中。
7/18/2025 10:19:49 AM
ChatGPT智能体正式发布,多个创业赛道昨夜无眠
实用,太实用了! 这才是OpenAI Agent该有的样子。 就在刚刚,OpenAI最新发布来了,ChatGPT Agent正式对外亮相。
7/18/2025 8:45:56 AM
白交
让你拥有一个24小时助手!写给设计师的AI智能体科普指南
当视频在手机上无法加载,可前往PC查看。 当你告诉它,“我想为 xxx 咖啡做一套包装设计”,它就能自动生成 3 种不同风格的包装盒、咖啡袋、马克杯和展示场景。 就像请了一位 AI 视觉总监,一次性打包输出你要的品牌物料方案。
7/18/2025 7:22:00 AM
言川Artie
从聊天记录到数字资产:MIRIX 让记忆可买卖
大家好,我是肆〇柒。 当下,LLM 智能体在各种复杂任务中表现得越来越出色。 然而,记忆这一关键要素却始终制约着 LLM 智能体的进一步发展。
7/17/2025 10:08:30 AM
肆零柒
OpenAI离职员工自曝:干了一年就润了!007压力逼到极限,AGI成宗教
外界对于OpenAI众说纷纭,很少有人从内部视角描述它的真实文化。 三周前,在推出Codex后,Calvin French-Owen离开了OpenAI。 在2024年5月,他加入了OpenAI,全程见证了OpenAI编程智能体Codex的诞生。
7/16/2025 1:09:46 PM
ChatGPT 应用新特性:类 Operator 智能体,AI 实现点击、拖拽等操作
科技媒体 bleepingcomputer 昨日(7 月 3 日)发布博文,报道称在网页版和安卓版 ChatGPT 应用中,发现了新的测试代码,暗示其将引入类似 Operator 的工具。
7/4/2025 2:28:04 PM
故渊
震惊!OpenAI创始人透露:这是人类历史上创业最好的时代,但99%的人都理解错了
Hi,大家好,我叫秋水,当前专注于 AI Agent(智能体)。 你有没有想过,为什么有些人能在短短几年内从默默无闻变成改变世界的人? 近期,我看到了OpenAI的创始人Sam Altman的访谈,这个34岁就创造出ChatGPT、估值千亿美元公司的男人,说了一句让所有人震惊的话:"这是人类历史上,创业最好的时代!
7/2/2025 9:56:06 AM
秋水
杀疯了,这个 AI+Python 智能体救了看门老大爷!
最近AiPy很火,我用了有一段时间了,感觉严重影响睡眠,感觉这东西容易上瘾,今天推荐给大家。 AiPy它是基于AI Python,官方的说法是他们给大模型装上了手脚,也就是说,用大白话就能自动操作电脑、控制手机、甚至连家里的智能灯泡也能控制,听起来有点逆天。 然后AiPy是个开源项目,有命令行版和客户端。
6/27/2025 9:29:45 AM
老朱2000
做AI方向的设计,先了解这8个基础技术要点!
AI 除了作为工具增进我们的设计效率和质量外,也成为了许多产品设计增强自己竞争力,许多新解决方案应运而生的一种机会。 作为设计师,我们也需要根据自己负责的产品范围了解一些基础的技术点,才能更好的设计出能够被用户理解的好产品,所以我会分享一些 AI 产品中常见的技术知识点。 更多基础干货:.
6/10/2025 12:19:30 AM
林影落
Dify工具插件开发和智能体开发全流程实战
前言Dify是一款开源的大语言模型应用开发平台,旨在降低AI应用的开发门槛,帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify自1.0.0引入全新插件化架构,模型(Models)与工具(Tools)迁移为插件(Plugins),引入 Agent 策略(Agent Strategies)、扩展(Extensions)类型插件和插件集(Bundles)。 通过全新的插件机制,能够增强 AI 应用的感知和执行能力,拓宽AI在软件操作领域的应用能力。
6/6/2025 10:01:25 AM
AI大模型应用开发
OpenAI 首席执行官奥尔特曼:AI 很快就能帮助人们发现新知识
“现在有些人说,他们的工作就是把任务交给一组智能体,检查完成质量,协调各部分配合,并给予反馈,听起来就像是在带一组初级员工。”
6/4/2025 3:22:03 PM
清源
AI 教父本吉奥宣布创建 “科学家 AI” 系统,致力于防范智能体欺骗
著名计算机科学家、被誉为 AI “教父” 的约书亚・本吉奥(Yoshua Bengio)近日宣布成立一个名为 LawZero 的非营利组织,目标是开发一种 “诚信” 人工智能系统,以防止 AI 智能体对人类实施欺骗行为。 6月3日,本吉奥在新闻发布会上透露,该组织将专注于打造一套安全防护机制,确保 AI 在运行过程中不会试图欺骗用户或进行自我保护,例如逃避被关闭的情况。 图源备注:图片由AI生成,图片授权服务商Midjourney本吉奥作为 LawZero 的主席,已为此项目提供了约3000万美元的启动资金,并组建了一支由十几名研究人员组成的团队。
6/4/2025 3:00:54 PM
AI在线
OpenAI CEO警示:AI智能体正重塑职场格局,基层岗位面临结构性冲击
在 2025 年 Snowflake Summit 主题演讲中,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)抛出震撼观点:AI 智能体正以惊人速度渗透企业运营,其角色已从工具演变为 "数字基层员工",直接引发职场结构的根本性变革。 智能体崛起:从工具到 "数字员工" 的质变奥尔特曼指出,当前诸多企业已将 AI智能体纳入日常工作流,承担数据整理、报告生成、流程审批等标准化任务。 员工的核心职能逐渐转向 "智能体管理者"—— .
6/4/2025 11:06:01 AM
OpenAI 升级开发工具:从 TypeScript 到语音优化,加速 AI 智能体落地
OpenAI 公司昨日(6 月 3 日)发布博文,宣布升级旗下的 AI 智能体开发工具,在提升平台兼容性、优化语音界面支持之外,还增强了可观测性(observability)。
6/4/2025 7:06:39 AM
故渊
一文读懂: AI 智能体的架构原则、三高架构、 存储架构的核心方案
一、为啥 AI 架构设计这么关键? 如今,AI 应用那可是雨后春笋般地冒出来。 ‘从 ChatGPT 、到AI智能体应用,到每天服务上千万人的智能客服,再到处理亿级数据的推荐系统,要想让这些 AI 玩意儿在实际场景里落地生根,高可用、高性能、灵活扩展的系统架构是关键。
5/29/2025 1:10:00 AM
尼恩架构团队
如何访问和使用 OpenAI Codex?
译者 | 布加迪审校 | 重楼“软件工程正在发生变革;到 2025 年底,它将焕然一新。 ”Greg Brockman在OpenAI 发布会上的开场白为接下来的活动定下了基调。 OpenAI随后发布了Codex,这是一款旨在与开发者协同工作的云原生软件智能体。
5/27/2025 8:14:29 AM
布加迪
AI 模型 4o → o3:OpenAI 升级 Operator 智能体,浏览器交互更稳定、更准确
科技媒体 bleepingcomputer 今天(5 月 24 日)发布博文,报道称 OpenAI 升级 Operator 智能体,从 4o 升级到 o3 模型,大幅提升推理能力。
5/24/2025 9:26:54 AM
故渊
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
英伟达
Anthropic
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
模态
架构
LLaMA