AIGC宇宙 AIGC宇宙

模型

比甄嬛还狠!奥特曼「千面人设」被揭穿,MIT华人记者7年曝黑幕

OpenAI的「宫斗」往事,还有大瓜! 因为曝料实在太过惊人,奥特曼在相关书籍正式出版之前,否认三连,撇清关系。 但曝料人Karen Hao毕业于MIT,曝料过多家美国科技巨头的「黑幕」,因新闻报道获得多个奖项。
5/26/2025 9:07:00 AM

ChatGPT引爆教育革命,学习效果暴涨86.7%!

现在的学生,已经离不开各种AIGC工具了, 不论是写作业,还是生成笔记,或者通过阅读AI生成的摘要来读文献。 面对这些离不开AI的学生,老师和家长都开始担忧了,这样下去,孩子会不会越变越笨啊。 然而,最近一项发表在Nature子刊的研究,基于对59项研究对汇总(元分析)指出,ChatGPT的使用对提高K12(中小学生)的学习表现有显著的正向影响,对于培养学生解决复杂问题的能力也有所帮助。
5/26/2025 8:43:00 AM

不达目的不罢休,全球首次发现 OpenAI 模型工作时会破坏关机命令

Palisade Research 最近一项关于“危险 AI 能力”的研究显示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能够无视直接的关闭指令。OpenAI 在今年 4 月推出这些模型时表示,O3 和 o4-mini 是它们的“最智能模型”。
5/26/2025 8:05:30 AM
汪淼

​新基准评估语言模型的 “谄媚” 行为,GPT-4o 表现最为明显

最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。 前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示,GPT-4o 对用户的过度赞美令人感到困扰,这种行为不仅可能导致模型传播错误信息,还可能强化有害行为。 为了应对这一问题,斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了一项新基准,旨在测量大型语言模型(LLM)的谄媚程度。
5/23/2025 11:00:55 AM
AI在线

Claude4来袭!Anthropic推出"业界最强"AI模型,编程能力全面超越竞争对手

在首届开发者大会上,Anthropic推出了两款声称"业界最强"的AI模型,加剧了与OpenAI和谷歌的竞争Anthropic在周四举行的首届开发者大会上正式发布Claude4模型系列,包括Claude Opus4和Claude Sonnet4两款新模型。 该公司声称这些模型在多项流行基准测试中达到业界领先水平,专门针对编程任务进行了优化。 产品特性与定价策略新发布的Claude4系列具备分析大型数据集、执行长期任务和处理复杂操作的能力。
5/23/2025 9:00:55 AM
AI在线

Meta推出J1系列模型,最强“AI法官”上线

近日,Meta 公司发布了其全新 J1系列模型,这是一项旨在提升 AI 判断能力的创新技术。 通过结合强化学习和合成数据的训练方法,J1模型不仅在判断的准确性上取得显著进步,还在公平性方面表现出色。 此次发布的消息由科技媒体 marktechpost 报道,令人瞩目。
5/22/2025 4:00:55 PM
AI在线

​Meta 推出 “Llama 创业计划”,支持初创企业使用 AI 模型

Meta 公司近日宣布推出一项名为 “Llama 创业计划” 的新项目,旨在鼓励初创企业采用其 Llama AI 模型。 该计划为参与公司提供 “直接支持”,并在某些情况下提供资金支持。 任何在美国注册、融资少于1000万美元、拥有至少一名开发人员并正在开发生成式 AI 应用的公司,均可在5月30日前申请参与。
5/22/2025 4:00:55 PM
AI在线

24B模型编程超DeepSeek全家桶,32G内存苹果电脑就能跑,专门针对真实GitHub Issue训练

Mistral沉默好久,果然在憋大招。 刚刚发布最新开源编程模型Devstral,在软件工程任务上一举超过DeepSeek全家桶和Qwen3 235B。 并且参数只有24B,可以在单卡RTX4090甚至32G内存的Mac上运行。
5/22/2025 1:43:40 PM

OpenAI放大招!核心API支持MCP,一夜改变智能体开发

今天凌晨,OpenAI全资收购io的消息占据了大部分头条。 同时OpenAI也“悄悄地”放出了另外一个重磅消息,用于开发智能体的核心API——Responses API支持MCP服务。 传统方法,我们在开发智能体需要通过函数调用与外部服务交互,每次操作都涉及从大模型到后端再到外部服务的网络传输,导致多次跳转、延迟会很高,并增加扩展和管理的复杂性。
5/22/2025 8:55:03 AM

史上最强AI全家桶!谷歌Gemini 2.5双杀OpenAI,上架250美金天价VIP

谷歌又双叒叕搞事情啦! 昨天,谷歌推出了一款超强的编程智能体Jules,已进入全球测试阶段。 任何拥有Google账户的开发者都可以使用,提供每日5次免费任务。
5/21/2025 9:15:00 AM

CoT推理大溃败?哈佛华人揭秘:LLM一思考,立刻就「失智」

DeepSeek-R1火了,推理模型火了,思维链(Chain-of-Thought,CoT)火了! 模型很聪明,问题是:它还听你的话吗? 思维链很好,但代价呢?
5/21/2025 9:02:20 AM

OpenAI 新一代模型GPT-5将集成多项功能,致力于成为全能助手

在人工智能领域的最新动态中,OpenAI 研究副总裁 Jerry Tworek 近日在 Reddit 上透露了即将推出的下一代基础模型 ——GPT-5的最新信息。 这款新模型被形象地称为 “All in One”,将整合多个现有产品,包括 Codex、Operator、Deep Research 和 Memory,以减少用户在不同工具之间切换的繁琐。 在此次问答活动中,Tworek 分享了 Codex 的开发背景以及它在提升编程效率方面的成就。
5/19/2025 9:00:55 AM
AI在线

最新!OpenAI:GPT-5将实现大统一,Codex最佳实践是这样的

Codex发布后,OpenAI Codex在Reddit举行了AMA(Ask Me Anything)活动在这场 1 小时的 AMA 中,Codex 核心研发和研究负责人围绕 :为什么先推云端代理、CLI 为何用 TypeScript、未来多语言绑定与 IDE 插件、GPT-5 与 Operator 的整合、定价与 API 计划、安全沙箱、最佳实践 等问题给出了清晰路线图:Codex-1 目前是「云端沙箱 ChatGPT 原生入口」的研究预览,面向大仓库 测试驱动工作流效果最佳;CLI 走开源 API 计费,本体将在 Plus/Pro 长期集成并提供“弹性”付费;短期不会给代理外网,但已支持 --approval-mode full-auto;他们希望 10 年内实现“按规格即可落地可靠软件”,并把 Codex、Operator、Deep Research、Memory 等工具融合为一套完整代理体系详细 Q&ACodex产品定位与长期愿景1 .为什么先做云端本地 CLI 因单机算力与线程受限,只适合轻量任务;云端可并行跑多个容器并隔离风险,是先发形态10 年愿景:给出“合理规格说明”即可在可观时间内得到可靠软件;云端并行 沙箱是实现路径。 2 .GPT-5 与 Codex、Operator 等工具是什么关系?
5/19/2025 8:58:00 AM

ChatGPT的记忆机制被公开了

ChatGPT新版记忆功能居然被民间大佬逆向工程了! 能引用历史记录,甚至还能悄悄藏个人资料? 最近OpenAI推出了一项名为聊天历史记录的额外记忆功能,允许ChatGPT引用历史对话以进行个性化交互。
5/16/2025 10:17:54 AM

DeepSeek-V3 发布新论文,揭示低成本大模型训练的奥秘

近日,DeepSeek 团队发布了关于其最新模型 DeepSeek-V3的一篇技术论文,重点讨论了在大规模人工智能模型训练中遇到的 “扩展挑战” 以及与硬件架构相关的思考。 这篇长达14页的论文不仅总结了 DeepSeek 在开发 V3过程中的经验与教训,还为未来的硬件设计提供了深刻的见解。 值得注意的是,DeepSeek 的 CEO 梁文锋也参与了论文的撰写。
5/16/2025 9:00:55 AM
AI在线

OpenAI发布全新GPT-4.1模型,编程任务更得心应手

在人工智能领域的持续创新中,OpenAI 近日宣布对其 ChatGPT 聊天机器人进行重大升级,推出了最新的 GPT-4.1模型。 该模型从5月14日开始正式向用户开放,为 Pro、Plus 和 Team 用户提供了新的选择。 与此同时,Enterprise 和 Edu 用户也将于未来几周内陆续获得访问权限,确保更多用户能够体验这一先进技术。
5/15/2025 11:01:55 AM
AI在线

回应开发者!GPT 4.1正式上线ChatGPT,4o mini将退役默认模型!实测:非常快,半分钟跑出小游戏demo!

OpenAI表示:为了响应群众的呼声,原本API专供的GPT 4.1系列已经加入ChatGPT中。 GPT-4.1,将首先开放给 ChatGPT Plus、Pro 和 Team 的付费用户使用。 同时,GPT-4o mini也将“退役”,由GPT-4.1 mini接棒成为所有 ChatGPT 用户(包括免费用户)的默认模型。
5/15/2025 10:50:46 AM

刚刚,OpenAI开放GPT-4.1,100万上下文、代码能力超强

今天凌晨1点30,OpenAI宣布开放GPT-4.1,从今天开始可以在ChatGPT中使用。 GPT-4.1是一款专门针对编码任务和指令执行的模型,推理效率非常高,对于日常编码需求来说,是替代o3和o4-mini非常好的选择。 GPT-4.1是OpenAI发布的最新模型,其最大亮点之一就是支持100万tokens上下文,这也是OpenAI首次发布长窗口模型。
5/15/2025 9:16:00 AM