智能体
OpenAI官方基准测试:承认Claude遥遥领先(狗头)
OpenAI承认Claude是最好的了(狗头)。 刚刚开源的新基准测试PaperBench,6款前沿大模型驱动智能体PK复现AI顶会论文,新版Claude-3.5-Sonnet显著超越o1/r1排名第一。 与去年10月OpenAI考验Agent机器学习代码工程能力MLE-Bnch相比,PaperBench更考验综合能力,不再是只执行单一任务。
4/3/2025 10:21:32 AM
量子位
关于大模型智能体意图识别不准确问题:function call 的缺陷
最近在研究大模型智能体也就是Agent的过程中,遇到了一个很严重的问题,直接影响到Agent的质量和效果;那就是意图识别不准确,也可以说是Agent的幻觉问题。 其产生的原因就在于大模型有时无法准确识别出用户意图,无法准确调用相应的函数。 意图识别不准确现在大模型技术在应用方面,主要有两大方向;其一就是大模型的创作能力,简单来说就是内容生成方面,如生成图片,文字,视频,也包括RAG等。
4/1/2025 12:10:00 PM
DFires
关于智能体 Agent 的实现技术之思维链和函数调用 (function call) 的思考
Agent技术也被业界称为智能体技术,本质上是使得大模型具备独立思考和解决问题的能力;被广泛应用于各种应用场景,而且也被称为是实现通用人工智能的一种技术手段。 但在此之前对于智能体的理解比较肤浅,而今天突然发现原来智能体没我们想象中的那么简单,也没想象中的那么复杂。 今天我们就从Agent的两个实现技术之思维链和函数调用来重新理解智能体。
3/27/2025 8:10:00 AM
AI探索时代
大厂实战!如何帮用户一小时轻松搭建智能体?
前言. 我们身处 AI 的浪潮中,智能体已在各行各业为大家带来便利,如基金经理可以利用智能体帮自己分析市场趋势、出租屋中介可以让智能体替自己回答咨询问题。 现在,在百度营销平台,广告主也可以搭建属于自己的品牌智能体,让品牌与用户能产生更直接的互动,从而激发品牌潜能,提升品牌影响力。
3/16/2025 6:55:51 AM
团队百度MEUX
OpenAI旨在通过扩展工具包开发智能体
随着企业对这项技术兴趣的提升,技术供应商纷纷急于推出工具以促进智能体的采用。 云巨头和软件巨头都已参与其中。 谷歌去年12月向企业客户介绍了其Agentspace服务,微软上周扩展了其AI代理产品组合,而AWS则于周一正式推出了AmazonBedrock上的多智能体协作功能。
3/12/2025 1:04:01 PM
Lindsey Wilkinson
Manus逼OpenAI开源智能体框架,网友:已从行业领导者变为跟随者
OpenAI又开源了,这次是一套智能体开发框架。 联网搜索、文件搜索、计算机使用(Computer Use),统统打包,GitHub 8小时上千星。 图片奥特曼认为其中的API是有史以来(并没有限定在OpenAI范围内)设计最完善、最实用的之一。
3/12/2025 11:34:35 AM
Manus是智能体的"DeepSeek时刻"?DeepSeek本尊怎么看?
Manus从一夜爆火到一码难求,市场开始出现不同的声音。 支持者认为,Manus是智能体的"DeepSeek时刻";反对者认为,Manus是一场精心策划的“炒作”。 Manus成色究竟如何,不妨来听听作为对标对象的DeepSeek的回答。
3/10/2025 12:00:00 AM
极客AI
离谱!OpenAI被曝博士级AI智能体2万美元/月,网友:DeepSeek快把价格打下去
什么样的AI,值得你花20000刀一个月? OpenAI告诉你:用我们的博士级AI智能体吧,它保管值! 今天这个消息,让所有人瞠目结舌:OpenAI的高管们计划发布三类智能体产品,价格分几档,最贵的一档月费高达2万美金。
3/6/2025 11:31:10 AM
新智元
OpenAI计划推2万美元包月的博士级智能体,你愿意买单吗?
近日,OpenAI计划推出一款“博士级研究智能体”,每月收费高达2万美元(约合人民币14.5万元),引发了科技界的广泛关注。 这款智能体旨在处理学术研究和软件开发中的复杂任务,其强大的处理能力和深度学习算法,将为用户提供前所未有的服务体验。 OpenAI试水高端智能体OpenAI此次推出的博士级智能体并非单一产品,而是其AI智能体产品线中的高端版本。
3/6/2025 10:47:02 AM
小菲
五分钟,构建国产数据库智能体
近期,圈里很多朋友,都尝试利用 DeepSeek 构建自己的智能体。 我也利用腾讯元器,将个人公众号内容做了个智能体,可以实现简单的问答。 那么延展来看,智能体除了可利用公众号内容,也可使用离线文件等方式来构建。
2/25/2025 7:49:36 AM
OpenAI博士级「超级智能体」即将登场?与ChatGPT深度集成,可操控计算机
就在刚刚,一则消息曝出,OpenAI已经在内部开始测试Operator,并将很快在ChatGPT macOS中推出。 这意味着,AI即将迎来一个「全新版本」的应用范式。 它不再仅仅是和你进行对话,被动式的给出参考答案来辅助你解决问题。
1/20/2025 3:32:41 PM
新智元
人类工作面临替代威胁:OpenAI 被曝本月将发“博士级”超级 AI 智能体
科技媒体 axios 昨日(1 月 19 日)发布博文,报道称 OpenAI 公司有望在 2025 年 1 月发布具备“博士级别”的超级 AI 智能体,用于执行复杂的人类任务。
1/20/2025 12:12:52 PM
故渊
我花30分钟训练一个“AI写作分身”,终于不用加班了......
更多AI写作干货:. 设计师的文案加速器:5个超好用的AI写作助手工具测评今天我要给大家介绍几款超级宝藏的 AI 写作助手工具,其中或许有大家所熟悉的产品。 阅读文章 .
12/19/2024 12:01:01 AM
言川Artie
企业智能体:为AI投资带来丰厚回报
基于AI的智能体当下可谓风头正劲。 最近几个月来,这个话题也已渗透到不少技术供应商的宣传和营销当中,包括Salesforce、Microsoft、ServiceNow、SAP、亚马逊云科技以及谷歌。 从多方面来讲,人们对AI智能体的关注有其道理:智能体代表着生成式AI的下一个发展阶段,有望进一步提高AI的自主性水平。
12/5/2024 2:50:31 PM
资讯热榜
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
保姆级教程!教你用Coze工作流2分钟生成优质文章
切斯基:Airbnb 暂缓接入 ChatGPT,AI 客服已用上通义千问
最强OCR竟然不是DeepSeek、Paddle!HuggingFace新作:六大顶尖开源OCR模型横评!继DS后又杀出匹黑马!
OpenAI、Oracle 再加码 AI 基建:150亿美元 Lighthouse 园区启动建设
独立开源大佬的疯狂实验:Claude Code蛮力出奇迹!40 分钟跑通 DeepSeek-OCR,我一行代码都没写
AI赋能,重塑零售:详解零售巨头塔吉特的业务转型策略
OpenAI 内部警示:ChatGPT Atlas 面临“即时注入”安全威胁
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
AI for Science
腾讯
Stable Diffusion
Agent
苹果
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
RAG
AI视频
生成
大语言模型
Sora
工具
百度
具身智能
GPU
华为
计算
字节跳动
AI设计
搜索
AGI
大型语言模型
视频生成
场景
深度学习
架构
DeepMind
编程
生成式AI
视觉
预测
Transformer
AI模型
伟达
特斯拉
Copilot