文章列表
一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器
AI性能的提升,一半靠模型,一半靠提示词。 最近,来自马里兰大学、MIT、斯坦福等机构联手验证,模型升级带来的性能提升仅占50%,而另外一半的提升,在于用户提示词的优化。 他们将其称之为「提示词适应」(prompt adaptation)。
8/18/2025 5:20:17 PM
AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行
AI能预测未来吗? 在《黑客帝国》里,先知能对Neo的未来做出预测。 以ChatGPT为代表的AI,则可以根据过去的语料来「预测下一个Token」。
8/18/2025 5:16:45 PM
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
OpenAI的AGI之路,总裁Greg Brockman在最新的访谈中说清楚了——技术层面,从文本生成转向强化学习的推理范式,在现实世界中试错并获取反馈;资源策略上,持续投入大规模计算资源;落地环节,把模型封装成Agent,将模型能力打包成为可审计的服务进程。 图片这场访谈由AI播客Latent Space主持,与Brockman探讨了OpenAI的AGI的整体技术路线与资源策略。 与此同时,OpenAI的落地布局,以及Brockman对未来的思考,也都随着访谈的进行浮出水面。
8/18/2025 5:14:41 PM
量子位
ChatGPT 移动应用收入已突破 20 亿美元,竞争对手远远落后
根据应用情报提供商 Appfigures 的最新分析,自2023年5月推出以来,OpenAI 的 ChatGPT 移动应用在全球消费者支出中已经达到了惊人的20亿美元。 这一收入数字是其竞争对手 Claude、Copilot 和 Grok 等的移动端终身消费总和的30倍。 图源备注:图片由AI生成,图片授权服务商Midjourney在2025年的这段时间里,ChatGPT 的移动应用已创造了13.5亿美元的收入,而2024年同期的收入仅为1.74亿美元,同比增长高达673%。
8/18/2025 3:31:53 PM
AI在线
从GPT-2到gpt-oss,深度详解OpenAI开放模型的进化之路
众所周知,OpenAI 并不够 Open,不仅研究论文发得越来越少,开源模型也是千呼万唤始出来。 其近日发布的两个 gpt-oss 开源模型已经吸引了无数关注,网上也已经出现了不少解读文章或视频。 近日,我们熟悉的 Sebastian Raschka 也发布了一篇深度技术博客,对 gpt-oss 进行了详细分析,并回顾了自 GPT-2 以来 AI 社区取得的进步;此外,他还将其与 Qwen 3 进行了比较。
8/18/2025 1:34:00 PM
机器之心
OpenAI ChatGPT 语音模式升级:调速和自定义指令来袭!
近日,OpenAI 对其 ChatGPT 网页应用进行了重大的更新,尤其是在语音模式方面。 新增加的 “语音速度” 选项,让用户能够更灵活地调节 ChatGPT 的语音说话速度。 用户可以通过一个滑块选择速度,范围从0.5倍速到2.0倍速,满足不同用户的需求。
8/18/2025 10:32:19 AM
AI在线
GPT-5遭用户吐槽 “垃圾”:缩放定律失效,AGI梦渐行渐远?
2025 年 8 月,OpenAI 终于推出备受期待的 GPT-5,但其表现并未如市场预期般带来 “革命性突破”,反而让 “AI 进步失速”“缩放定律失效” 的讨论再度升温。 GPT-5 实测:亮点有限,失望声四起YouTube播主 Mrwhosetheboss 的实测显示,GPT-5 并非全面领先:在创建象棋游戏时优于 . GPT-4o-mini-high,撰写视频脚本时强于 GPT-4o,且能根据任务自动匹配最优模型;但在生成 YouTube .
8/18/2025 9:57:30 AM
OpenAI突然"背叛"自己:推理与创作分家,万能AI时代终结?
83.3%对比13%——这不是什么投票结果,而是OpenAI两类模型在高级数学问题上的表现差距。 更震撼的是,表现更好的那个模型,在创意写作方面反而输给了"落后"的那个。 我花了一下午时间深挖OpenAI的最新技术文档,发现了一个颠覆认知的事实:OpenAI已经悄悄放弃了"万能AI"的路线,转向了一个更精妙的策略——让不同的模型专做不同的事。
8/18/2025 9:17:54 AM
阿丸笔记
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码
8月5日,在GPT-5发布前两天,OpenAI推出了它的两款开源权重大语言模型:gpt-oss-120b、gpt-oss-20b。 这是自2019年GPT-2,近六年来OpenAI首次发布开放权重的模型。 得益于巧妙的优化技术,这些模型甚至可以在本地设备上运行。
8/18/2025 9:15:00 AM
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷
大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。 这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。 一个最基础、却也最关键的问题是:在评判一个模型是否“入戏”之前,AI裁判能准确识别出对话中到底是谁在说话吗?
8/18/2025 9:00:00 AM
谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
大块头不等于大智慧。 这在生成式AI领域,已逐渐成为共识。 Gemma 3系列的成功就是一个很好的例证。
8/18/2025 8:57:00 AM
即梦保姆级教程!零基础1小时做出3个商业级作品(附提示词)
往期教程:案例 1:夏日防晒爆款海报——安热沙清凉防护战. 即梦功能:文生图 产品融合 | deepseek 功能:关键词文案优化1. 即梦中的 deepseek 使用.
8/18/2025 12:50:52 AM
ChatGPT或将引入广告!OpenAI高管首度松口,用户破7亿仍难盈利
OpenAI正在考虑为ChatGPT引入广告功能,这一消息在人工智能行业引发了广泛关注。 ChatGPT负责人Nick Turley在接受《The Verge》旗下《Decoder》节目采访时首次公开表态,称公司不排除添加广告的可能性。 Turley表示,虽然OpenAI目前没有明确的广告计划,但"保留选择权是明智的"。
8/15/2025 9:31:41 PM
AI在线
Nvidia 投资 5 亿美元,Cohere 公司估值达 68 亿美元
根据最近的报道,Cohere 公司今天宣布成功完成一轮5亿美元的融资。 这轮融资由 Radical Ventures 和 Inovia Capital 共同牵头,参与者还包括 Nvidia、AMD Ventures、Salesforce Ventures 等多个机构投资者。 此次融资使得 Cohere 的估值从此前的50亿美元增至68亿美元。
8/15/2025 9:31:41 PM
AI在线
AI大模型的版权风暴:行业巨头面临7500亿美元赔偿风险
近年来,随着人工智能技术的飞速发展,大型 AI 模型的训练数据来源问题日益成为业界关注的焦点。 许多知名企业在构建其 AI 模型时,似乎都选择了使用大量未授权的版权内容作为数据。 这一 “秘密配方” 引发了激烈的法律争论,并将硅谷的科技巨头们推上了风口浪尖。
8/15/2025 9:31:41 PM
AI在线
IDC:未来五年,中国生成式 AI 相关硬件支出将激增至 330 亿元
根据国际数据公司(IDC)发布的最新统计数据,随着中国生成式 AI 技术的快速发展,相关的网络硬件支出预计将在未来五年内大幅增长,从2023年的65亿元上升至2028年的330亿元。 这一趋势主要源于大模型商用的快速落地,预计到2024年下半年,中国日均 Token 消耗量将呈现爆发式增长,达到114.2万亿 Tokens。 这一数据并不包括通过海外 MaaS 平台进行的调用量。
8/15/2025 4:21:10 PM
AI在线
破天荒!OpenAI、Cursor多位开发大牛联手曝出GPT5提示词指南!晒官方系统提示词优化秘籍,最大化编程性能,工作流更可控
编辑 | 云昭上周,GPT-5 发布以后,不少网友对这个备受期待的新版本表示无力吐槽。 OpenAI 老板 Altman 在直播间宣称,GPT-5 在自主任务执行能力、编程、综合智能以及可控性方面都实现了显著飞跃。 然而,用户实际用起来却是:“降智”、“Token很快用完”的声讨一片。
8/15/2025 3:02:46 PM
云昭
OpenAI华人露头就被小扎挖!95后北大校友1个月前上直播,今天已是Meta人
又来了又来了,OpenAI华人工程师,果然露脸就被小扎挖(doge)。 这一次,主角是95后北大校友孙之清,上个月刚刚参与了ChatGPT Agent的发布直播。 当时就有不少网友调侃:发布会出镜就是在给Meta提供挖角名单。
8/15/2025 12:27:27 PM