AI
AI 为何能查天气、订机票?揭秘大模型背后的“神秘工具箱”
你有没有想过,为什么 AI 能回答“今天上海天气怎么样? ”这种实时问题,甚至帮你预订机票? 明明它的训练数据截止到去年,怎么会对现在的事情了如指掌?
7/15/2025 9:44:16 AM
红绿灯灯灯灯
最新 AGI 暴论:强化学习的「GPT-3 时刻」实现,还需要 1 万年?
最近,国外一家 AI 初创公司 Mechanize 的三位创始人联合撰文,提出一个大胆的判断:RL 或许要迎来属于它的 “GPT-3 时刻”,但还需要拥有相当于数千至上万年“模型处理任务所用时间”的训练。 在他们看来,当前的 RL 模型还存在明显短板,比如泛化能力差、难以适应新任务等,这种局面其实很像 GPT-3 出现之前的语言模型——能解决特定问题,但难以迁移和扩展。 为了解决这个问题,他们提出了一种新的训练范式,叫作“复制训练”(Replication Training):让模型在虚拟环境中模拟真实软件的操作过程,比如使用浏览器、编写代码、处理命令行任务等等。
7/14/2025 4:36:00 PM
郑佳美
马斯克的Grok 4敢说ChatGPT不敢说的话?AI"政治正确"的边界在哪
一个明显的趋势是,AI大模型正在分化成两个阵营:一边是"政治正确"的主流AI,另一边是"敢说真话"的挑战者。 7月9日晚,马斯克的xAI正式发布Grok 4,宣称要打造"最强AI模型",而且绝不做"觉醒AI"。 这场发布会有点特别。
7/14/2025 1:55:00 AM
阿丸笔记
奥尔特曼宣布延期 OpenAI 首个开源权重 AI 模型
AI在线 7 月 12 日消息,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)今天(7 月 12 日)在 X 平台发布推文,表示为进一步测试模型安全,将推迟发布其首个开源 AI 模型。 OpenAI 公司的首个开源 AI 模型上月已延期 1 次,原计划下周发布该模式,不过奥尔特曼表示为进一步的安全测试,选择再次延期,但并未公布新的发布时间点。 AI在线翻译奥尔特曼推文内容如下:我们曾计划下周发布我们的开源权重模型。
7/12/2025 3:50:01 PM
故渊
一文搞懂 | 大模型为什么出现幻觉?从成因到缓解方案
1、前言随着大模型(Large Language Models, 以下简称LLM)迅猛发展的浪潮中,幻觉(Hallucination)问题逐渐成为业界和学术界关注的焦点。 所谓模型幻觉,指的是模型在生成内容时产生与事实不符、虚构或误导性的信息。 比如,当你询问“世界上最长的河流是哪条?
7/11/2025 9:50:52 AM
火山引擎云安全
科普:AI 是如何理解问题的?它能像人类一样思考吗?
现有的AI推理的局限性在人类的日常生活中,我们并不需要把思维的每一步说出口或画出来才能思考。 比如:你在脑子里可以默默思考一篇文章的结构,或者在脑海中想象一下你家房间的布局。 思考这些都不需要真正动笔或动手去画。
7/10/2025 3:29:10 PM
AI拍档
下一代AI需要「思想微积分」!华人团队重磅揭秘,AI方法论三连发
AI的时代洪流滚滚向前,我们每个人都身处其中,感受着它的光荣与梦想,也承担着它的迷茫与代价。 一方面,是资本市场的狂欢盛宴。 OpenAI的估值冲向千亿美金,英伟达的市值超越众多老牌巨头,任何与「AI」沾边的概念都能轻易点燃投资者的热情。
7/10/2025 2:52:45 PM
新智元
闭源主力选手拥抱开源?OpenAI 被曝最快下周推开源 AI 模型,o3 mini 级推理能力
AI在线 7 月 10 日消息,科技媒体 The Verge 今天(7 月 10 日)发布博文,报道称 OpenAI 公司正酝酿推出开源 AI 模型,可能会加剧其和微软之间的分歧。 消息称 OpenAI 公司正和微软公司重新谈判,希望重组成为一家盈利性公司。 在此之际,OpenAI 正准备发布一个开源的大语言 AI 模型,这可能会在两家公司之间造成更大的隔阂。
7/10/2025 10:15:15 AM
故渊
OpenAI 迄今最大交易落地,65 亿美元完成收购前苹果首席设计师 Jony Ive 的初创公司 io
AI在线 7 月 10 日消息,OpenAI 公司昨日(7 月 9 日)发布公告,宣布已完成收购前苹果首席设计师 Jony Ive 创立的初创公司 io Products, Inc.。 AI在线曾于今年 5 月报道,OpenAI 公司以近 65 亿美元(AI在线注:现汇率约合 469.31 亿元人民币)的全股票交易,收购前苹果首席设计官 Jony Ive 联合创立的 AI 设备初创公司 io,这也是 OpenAI 公司历史上最大规模的收购。 最新消息称 io 的联合创始人 Scott Cannon、Evans Hankey 和 Tang Tan,以及约 50 名 io 的工程师、设计师和研究人员,现在都已加入 OpenAI。
7/10/2025 9:59:22 AM
故渊
Meta 高薪挖角 AI 人才之际,OpenAI 以低成本从底层构建人才梯队
AI在线 7 月 6 日消息,在硅谷激烈的人工智能(AI)竞争中,各公司纷纷以令人咋舌的薪酬待遇来吸引顶尖人才。 然而,OpenAI 却另辟蹊径,通过其独特的“研究员驻留计划”(residency program)来吸引和留住优秀人才。 据 Fortune 报道,该计划为期六个月,是一份全职带薪项目,主要面向来自物理学、神经科学等与 AI 相邻领域的研究人员,而非那些已经在 AI 研究领域深耕多年的专业人士。
7/6/2025 5:52:00 PM
远洋
ChatGPT 应用新特性:类 Operator 智能体,AI 实现点击、拖拽等操作
科技媒体 bleepingcomputer 昨日(7 月 3 日)发布博文,报道称在网页版和安卓版 ChatGPT 应用中,发现了新的测试代码,暗示其将引入类似 Operator 的工具。
7/4/2025 2:28:04 PM
故渊
刚刚,Ilya Sutskever宣布自任CEO:联创被Meta挖走了
Meta 的挖掘机,终于挖到了 Ilya 大神的头上。 周五凌晨,OpenAI 联合创始人 Ilya Sutskever(伊尔亚・苏茨克维)久违地在社交媒体发声。 我向我们的团队和投资者发送了以下信息:正如你们所知,Daniel Gross 在我们公司的时间已接近尾声,自 6 月 29 日起,他已正式退出 Safe .
7/4/2025 9:14:10 AM
机器之心
Meta-Think ≠ 记套路,多智能体强化学习解锁大模型元思考泛化
本文第一作者为上海交通大学计算机科学四年级博士生万梓煜,主要研究方向为强化学习、基础模型的复杂推理,通讯作者为上海交通大学人工智能学院温颖副教授和上海人工智能实验室胡舒悦老师。 团队其他成员包括来自英属哥伦比亚大学的共同第一作者李云想、Mark Schmidt 教授,伦敦大学学院的宋研、杨林易和汪军教授,上海交通大学的温潇雨,王翰竟和张伟楠教授。 引言最近,关于大模型推理的测试时间扩展(Test time scaling law )的探索不断涌现出新的范式,包括① 结构化搜索结(如 MCTS),② 过程奖励模型(Process Reward Model ) PPO,③ 可验证奖励 (Verifiable Reward) GRPO(DeepSeek R1)。
7/4/2025 8:53:00 AM
华为多路径推理破解大模型数学瓶颈,准确率超97%|ICML 2025
大模型越来越大,通用能力越来越强,但一遇到数学、科学、逻辑这类复杂问题,还是常“翻车”。 为破解这一痛点,华为诺亚方舟实验室提出全新高阶推理框架 ——思维森林(Forest-of-Thought,FoT)。 该方法借鉴人类“多角度思考、反复验证”的认知方式,打破传统LLM的线性推理范式,通过构建多棵并行推理树,引入动态自我修正机制与多视角共识决策策略。
7/4/2025 8:53:00 AM
重磅发现!大模型的「aha moment」不是装腔作势,内部信息量暴增数倍!
刘勇,中国人民大学,长聘副教授,博士生导师,国家级高层次青年人才。 长期从事机器学习基础理论研究,共发表论文 100 余篇,其中以第一作者/通讯作者发表顶级期刊和会议论文近 50 篇,涵盖机器学习领域顶级期刊 JMLR、IEEE TPAMI、Artificial Intelligence 和顶级会议 ICML、NeurIPS 等。 你肯定见过大模型在解题时「装模作样」地输出:「Hmm…」、「Wait, let me think」、「Therefore…」这些看似「人类化」的思考词。
7/4/2025 8:47:00 AM
大模型越反思越错,原来是长链推理通过自我说服加重幻觉 | 北邮
来自北京邮电大学的研究团队通过思维链审计实验,首次定量揭示了这一“越想越错”现象背后的元认知偏差:长链推理中的反思不是纠错机制,而是给幻觉颁发“理性证书”——模型为保持与用户提示语义一致,宁可篡改协议定义也不否定前提。 风险缺口:长链CoT放大“误差滚雪球”推理大模型(RLLMs)能把复杂问题拆解成几十步推理,再给出看似缜密的结论。 然而,随着推理链条变长,一个令人不安的趋势浮出水面——错误不再是偶发失误,而是沿链条滚雪球式放大。
7/4/2025 8:42:00 AM
Sam Altman的“温和奇点”已至:我们真的越过了AI的“事件视界”吗?
近日,OpenAI 的掌舵人 Sam Altman 在其个人博客上发表了一篇题为《The Gentle Singularity》(温和的奇点, )的重磅文章,再次将人工智能的未来推向了舆论的风口浪尖。 Altman 以其一贯的前瞻性视角,大胆宣称:“我们已越过事件视界;起飞已经开始。 人类已接近构建数字超级智能,而且至少到目前为止,它远没有看起来那么怪异。
7/4/2025 8:25:03 AM
白明的赞赏账户
新闻出版业危机:ChatGPT 引荐流量增长难抵 AI 搜索冲击
Similarweb报告显示,AI驱动的搜索结果导致新闻网站自然流量大幅下滑,2024年5月至2025年5月未转化为点击的搜索比例从56%升至69%。尽管ChatGPT对新闻网站的引荐流量增长25倍,但仍难弥补整体损失。#AI冲击新闻业# #ChatGPT#
7/3/2025 3:59:50 PM
远洋
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
Meta
微软
GPT
学习
图像
技术
Gemini
AI创作
马斯克
论文
Anthropic
代码
英伟达
算法
Stable Diffusion
智能体
训练
芯片
开发者
蛋白质
生成式
腾讯
苹果
AI新词
神经网络
3D
Claude
LLM
研究
生成
机器学习
计算
AI for Science
Sora
人形机器人
AI视频
xAI
AI设计
GPU
华为
百度
搜索
大语言模型
Agent
场景
字节跳动
预测
大型语言模型
深度学习
伟达
工具
Transformer
视觉
RAG
具身智能
神器推荐
亚马逊
Copilot
模态
AGI
LLaMA
文本
算力
驾驶