智能

o3曝智商高达157，比肩爱因斯坦碾压99%人类！陶哲轩水平AI或出现

o3智商竟有157，堪比爱因斯坦？今天，一张OpenAI模型智商图，在全网传遍了。基于编程竞赛Codeforces排名评分图中清晰可见，能够达到o3智商水平的人类大约占比仅有0.0075%。

12/24/2024 12:19:45 PM

新智元

震惊！Claude伪对齐率竟能高达78％，Anthropic 137页长论文自揭短

今天，大模型公司 Anthropic 的一篇 137 页长论文火了！该论文探讨了大语言模型中的「伪对齐」，通过一系列实验发现：Claude 在训练过程中经常假装有不同的观点，而实际上却保持了其原始偏好。这一发现说明了大模型可能具备了类似于人类的属性与倾向。

12/19/2024 1:30:00 PM

机器之心

面壁智能获新一轮数亿元融资，高效端侧智能持续引领行业发展

近日，面壁智能完成新一轮数亿元融资，本轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投，北京市人工智能产业投资基金与清科创投跟投，万甲资本担任本轮独家财务顾问。本轮融资完成后，面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局，以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业，为用户创造具体可感知的价值。面壁智能是以「高效为第一性原理」的大模型公司。

12/11/2024 9:17:00 AM

新闻助手

简单了解大模型（LLM）智能体，传统软件工程思维依然适用

说到大模型应用的理想态，我相信很多人都可以想到《钢铁侠》里面的贾维斯，可以根据环境、天气、对手火力等情况，给钢铁侠提供决策指导或者自主决策。大模型Agent就是人们希望借助大模型实现的类似于贾维斯一样智能助手能力，它具备环境感知能力、自主理解、决策制定以及行动执行的能力。在实现Agent架构过程中，有很多思维方式和传统软件工程思维是相似的。

11/14/2024 10:48:37 AM

春哥大魔王

Claude 接管人类电脑编程：程序员沸腾、OpenAI 反击，智能体大战一触即发

AI 接管人类电脑，未来已来！ Claude 自主操控电脑，从编程到科研无所不能，代表着万能 API。另一边，OpenAI 内部加急研发多智能体 AI，已经有了雏形。

10/25/2024 9:47:36 PM

问舟

OpenAI 多智能体 Swarm 陷争议，20 岁创始人自曝代码结构被抄袭

OpenAI 好不容易开源了一次，却被曝出剽窃？就在昨天，OpenAI 应用 AI 研究员 Shyamal Anadkat ，放出了全新多智能体框架 ——Swarm，瞬间在全网爆火。恰在几天前，OpenAI 还发布了智能体基准 MLE-bench，汇聚 75 个 Kaggle 竞赛，o1 首测便拿下 7 金。

10/13/2024 1:11:57 PM

远洋

Swarm 框架登场：OpenAI 第 3 阶段“敲门砖”，让专业的事交给专业的 AI 智能体做

科技媒体 marktechpost 昨日（10 月 11 日）发布博文，报道称 OpenAI 公司推出了 Swarm 框架，旨在解决开发者在多智能体系统编排中面临的复杂挑战。Swarm 框架通过简化智能体的协调、执行和测试过程，让开发者能够更高效地管理、互动多个 AI 智能体。OpenAI 朝 AI 第 3 阶段迈进根据 OpenAI 公布五级量表，最新推出的 o1 模型处于第二阶段，即所谓的“推理者”（reasoners），而开发 multi-agent 符合第三阶段的目标要求。

10/12/2024 4:07:51 PM

故渊

OpenAI 朝 AI 第 3 阶段迈进，正招募人才组建“多智能体”团队

OpenAI 在发布 o1 AI 模型之后，下一步会怎么走？该公司研究员诺姆・布朗（Noam Brown）在 X 平台给出了答案，组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表，最新推出的 o1 模型处于第二阶段，即所谓的“推理者”（reasoners），而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下：第一级：聊天机器人，具有会话语言的人工智能第二级：推理者，解决人类水平问题的人工智能第三级：智能体，能够代表用户采取行动的人工智能第四级：创新

9/21/2024 12:10:50 PM

故渊

2024AGI商业趋势大会最新嘉宾议程公布，相约深圳见证AI闪光时刻

2024年，AI的身影已经无处不在。在巨头的大模型竞技场之外，更广泛的创业者、开发者和个人玩家越来越关注用AI来解决具体的商业诉求，改善自己的工作流。作为业界期待的“下一个互联网”，乃至“超越移动互联网的平台式机会”，创业者们正在积极探索智能与营销、设计、硬件、金融、教育、医疗等具体行业和精准场景的结合。从文本到图像、音乐和视频；由知识问答到导购客服、代码辅助、情感陪伴，乃至导诊分诊、法律咨询、科研开发，用AI “重做一遍应用”的预言似乎正在变成现实。超级应用会在何处诞生？大模型凶猛，小而美的产品会有机会吗？那些完

8/12/2024 10:48:00 AM

新闻助手

港大马毅：现在的大模型只有「知识」，没有「智能」

导语：知识与智能是两个概念。访谈 | 陈彩娴撰文丨马蕊蕾编辑丨陈彩娴当多数人将 Scaling Law（规模定律）作为信仰并投身其中时，马毅却选择了一条少有人走的路。「模型无所谓大小，我们说正确的模型，主要看机制是否正确，这才是智能的本质。

7/9/2024 3:31:00 PM

马蕊蕾

牵手五大顶尖高校教授 “云阙智能”打造AIGC智囊团

大模型竞争已进入白热化阶段，盲目卷资源已不再是长久之计，AI 创业公司的可持续性和科学性则是更重要的考量因素。在这一背景下，背靠强大高校，有科研能力、学术资源和充足的后备人才作为补充，变得愈发重要。 2024年5月8日，上海云阙智能科技有限公司（以下简称“云阙智能”）宣布成立AIGC学术顾问委员会，并邀请武汉大学新闻与传播学院副院长洪杰文教授、北京大学新闻与传播学院博士生导师胡泳教授、北京师范大学新闻传播学院院长张洪忠教授、复旦大学新闻学院副院长周葆华教授、广州大学新闻与传播学院博士生导师邹军教授等五大顶尖高校学者任委员会顾问。

5/8/2024 12:12:00 PM

王悦

GPT-4 化身黑客搞破坏，成功率 87%！OpenAI 要求保密提示词，网友复现 ing

91 行代码、1056 个 token，GPT-4 化身黑客搞破坏！测试成功率达 87%，单次成本仅 8.8 美元（折合人民币约 63 元）。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架，研究了包括 GPT-4、GPT-3.5 和众多开源模型在内的 10 个模型。结果发现只有 GPT-4 能够在阅读 CVE 漏洞描述后，学会利用漏洞攻击，而其它模型成功率为 0。研究人员表示，OpenAI 已要求他们不要向公众发布该研究的提示词。网友们立马赶来围观了，有人还搞起了复现。这是怎么一回

4/21/2024 12:53:34 PM

清源

AIGC用于智能写作的技术综述-达观数据

详细介绍AIGC用于智能写作的相关技术和达观数据的智能写作产品实践

1/13/2023 11:46:00 AM

达观数据

资讯热榜

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快宾州州立大学推出首个人工智能工程学位，抢占教育先机 Meta 新超级智能实验室遭遇离职潮，AI 人才流失引发担忧 DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜联合国成立人工智能咨询小组 OpenAI 将推出家长监控功能以应对青少年自杀悲剧「精而巧」的端侧大模型为何火了？在代理 AI 和物理 AI推动下，全球芯片市场预计将突破 1 万亿美元大关

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini 马斯克 AI创作智能体英伟达 Anthropic 论文代码训练算法 AI新词 Stable Diffusion 芯片 LLM 蛋白质开发者腾讯苹果 Claude 生成式 Agent AI for Science 神经网络 3D 机器学习研究生成 xAI 人形机器人 AI视频计算百度 Sora GPU AI设计华为工具大语言模型 RAG 搜索具身智能字节跳动大型语言模型场景深度学习预测视频生成伟达视觉 Transformer AGI 架构亚马逊神器推荐 Copilot DeepMind 特斯拉应用