智能
o3曝智商高达157,比肩爱因斯坦碾压99%人类!陶哲轩水平AI或出现
o3智商竟有157,堪比爱因斯坦? 今天,一张OpenAI模型智商图,在全网传遍了。 基于编程竞赛Codeforces排名评分图中清晰可见,能够达到o3智商水平的人类大约占比仅有0.0075%。
12/24/2024 12:19:45 PM
新智元
震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短
今天,大模型公司 Anthropic 的一篇 137 页长论文火了! 该论文探讨了大语言模型中的「伪对齐」,通过一系列实验发现:Claude 在训练过程中经常假装有不同的观点,而实际上却保持了其原始偏好。 这一发现说明了大模型可能具备了类似于人类的属性与倾向。
12/19/2024 1:30:00 PM
机器之心
面壁智能获新一轮数亿元融资,高效端侧智能持续引领行业发展
近日,面壁智能完成新一轮数亿元融资,本轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投,北京市人工智能产业投资基金与清科创投跟投,万甲资本担任本轮独家财务顾问。 本轮融资完成后,面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局,以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业,为用户创造具体可感知的价值。 面壁智能是以「高效为第一性原理」的大模型公司。
12/11/2024 9:17:00 AM
新闻助手
简单了解大模型(LLM)智能体,传统软件工程思维依然适用
说到大模型应用的理想态,我相信很多人都可以想到《钢铁侠》里面的贾维斯,可以根据环境、天气、对手火力等情况,给钢铁侠提供决策指导或者自主决策。 大模型Agent就是人们希望借助大模型实现的类似于贾维斯一样智能助手能力,它具备环境感知能力、自主理解、决策制定以及行动执行的能力。 在实现Agent架构过程中,有很多思维方式和传统软件工程思维是相似的。
11/14/2024 10:48:37 AM
春哥大魔王
Claude 接管人类电脑编程:程序员沸腾、OpenAI 反击,智能体大战一触即发
AI 接管人类电脑,未来已来! Claude 自主操控电脑,从编程到科研无所不能,代表着万能 API。 另一边,OpenAI 内部加急研发多智能体 AI,已经有了雏形。
10/25/2024 9:47:36 PM
问舟
OpenAI 多智能体 Swarm 陷争议,20 岁创始人自曝代码结构被抄袭
OpenAI 好不容易开源了一次,却被曝出剽窃?就在昨天,OpenAI 应用 AI 研究员 Shyamal Anadkat ,放出了全新多智能体框架 ——Swarm,瞬间在全网爆火。恰在几天前,OpenAI 还发布了智能体基准 MLE-bench,汇聚 75 个 Kaggle 竞赛,o1 首测便拿下 7 金。
10/13/2024 1:11:57 PM
远洋
Swarm 框架登场:OpenAI 第 3 阶段“敲门砖”,让专业的事交给专业的 AI 智能体做
科技媒体 marktechpost 昨日(10 月 11 日)发布博文,报道称 OpenAI 公司推出了 Swarm 框架,旨在解决开发者在多智能体系统编排中面临的复杂挑战。Swarm 框架通过简化智能体的协调、执行和测试过程,让开发者能够更高效地管理、互动多个 AI 智能体。OpenAI 朝 AI 第 3 阶段迈进根据 OpenAI 公布五级量表,最新推出的 o1 模型处于第二阶段,即所谓的“推理者”(reasoners),而开发 multi-agent 符合第三阶段的目标要求。
10/12/2024 4:07:51 PM
故渊
OpenAI 朝 AI 第 3 阶段迈进,正招募人才组建“多智能体”团队
OpenAI 在发布 o1 AI 模型之后,下一步会怎么走?该公司研究员诺姆・布朗(Noam Brown)在 X 平台给出了答案,组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表,最新推出的 o1 模型处于第二阶段,即所谓的“推理者”(reasoners),而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下:第一级:聊天机器人,具有会话语言的人工智能第二级:推理者,解决人类水平问题的人工智能第三级:智能体,能够代表用户采取行动的人工智能第四级:创新
9/21/2024 12:10:50 PM
故渊
2024AGI商业趋势大会最新嘉宾议程公布,相约深圳见证AI闪光时刻
2024年,AI的身影已经无处不在。在巨头的大模型竞技场之外,更广泛的创业者、开发者和个人玩家越来越关注用AI来解决具体的商业诉求,改善自己的工作流。作为业界期待的“下一个互联网”,乃至“超越移动互联网的平台式机会”,创业者们正在积极探索智能与营销、设计、硬件、金融、教育、医疗等具体行业和精准场景的结合。从文本到图像、音乐和视频;由知识问答到导购客服、代码辅助、情感陪伴,乃至导诊分诊、法律咨询、科研开发,用AI “重做一遍应用”的预言似乎正在变成现实。超级应用会在何处诞生?大模型凶猛,小而美的产品会有机会吗?那些完
8/12/2024 10:48:00 AM
新闻助手
港大马毅:现在的大模型只有「知识」,没有「智能」
导语:知识与智能是两个概念。 访谈 | 陈彩娴撰文丨马蕊蕾编辑丨陈彩娴当多数人将 Scaling Law(规模定律)作为信仰并投身其中时,马毅却选择了一条少有人走的路。 「模型无所谓大小,我们说正确的模型,主要看机制是否正确,这才是智能的本质。
7/9/2024 3:31:00 PM
马蕊蕾
牵手五大顶尖高校教授 “云阙智能”打造AIGC智囊团
大模型竞争已进入白热化阶段,盲目卷资源已不再是长久之计,AI 创业公司的可持续性和科学性则是更重要的考量因素。 在这一背景下,背靠强大高校,有科研能力、学术资源和充足的后备人才作为补充,变得愈发重要。 2024年5月8日,上海云阙智能科技有限公司(以下简称“云阙智能”)宣布成立AIGC学术顾问委员会,并邀请武汉大学新闻与传播学院副院长洪杰文教授、北京大学新闻与传播学院博士生导师胡泳教授、北京师范大学新闻传播学院院长张洪忠教授、复旦大学新闻学院副院长周葆华教授、广州大学新闻与传播学院博士生导师邹军教授等五大顶尖高校学者任委员会顾问。
5/8/2024 12:12:00 PM
王悦
GPT-4 化身黑客搞破坏,成功率 87%!OpenAI 要求保密提示词,网友复现 ing
91 行代码、1056 个 token,GPT-4 化身黑客搞破坏!测试成功率达 87%,单次成本仅 8.8 美元 (折合人民币约 63 元)。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括 GPT-4、GPT-3.5 和众多开源模型在内的 10 个模型。结果发现只有 GPT-4 能够在阅读 CVE 漏洞描述后,学会利用漏洞攻击,而其它模型成功率为 0。研究人员表示,OpenAI 已要求他们不要向公众发布该研究的提示词。网友们立马赶来围观了,有人还搞起了复现。这是怎么一回
4/21/2024 12:53:34 PM
清源
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
首月 1 美元,ChatGPT Team 会员美区 / 英区 / 欧洲区 / 澳洲区迎优惠
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
ChatGPT 语音功能升级,实时翻译对话更自然流畅
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊