AI
估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」
刚刚,OpenAI前CTO Mira Murati创办的Thinking Machines Lab再次发布成果! 这是他们继《克服LLM推理中的不确定性》(Defeating Nondeterminism in LLM Inference)之后,第二篇研究文章——《模块流形》(Modular Manifolds)。 博客地址:「走钢丝」,必须小心翼翼地维持其内部「健康」,防止权重、激活值或梯度这些关键张量变得过大或过小,以免引发数值溢出等一系列问题。
9/28/2025 9:11:00 AM
ChatGPT 开始“管你的闲事”了
过去我们用 ChatGPT,大多是“有问题→它回答”。 这种即时反馈很神奇,但也有个缺点:它只会在你开口时帮忙,下一步怎么走还是得靠自己。 现在,OpenAI 正在测试一个新功能——ChatGPT Pulse。
9/26/2025 10:13:12 AM
刚刚,Sam Altman发文,透露OpenAI正在干的大事业
OpenAI 最近发出的关键信号,无疑是两个字:算力。 就在昨天,英伟达官宣向 OpenAI 投资 1000 亿美元,用至少 400 万 GPU 打造超级 AI 巨兽。 热乎劲还没过,刚刚 OpenAI 大手一挥:我们还要一口气建设 5 个算力中心!
9/24/2025 11:20:29 AM
8B硬刚72B!MiniCPM-V 4.5技术报告正式出炉
行业首个具备“高刷”视频理解能力的多模态模型MiniCPM-V 4.5的技术报告正式发布! 报告提出统一的3D-Resampler架构实现高密度视频压缩、面向文档的统一OCR和知识学习范式、可控混合快速/深度思考的多模态强化学习三大技术。 基于这些关键技术,MiniCPM-V 4.5在视频理解、图像理解、OCR、文档解析等多项任务上达到同级SOTA水平,不仅以8B的参数规模超越GPT-4o-latest和Qwen2.5-VL-72B,更在推理速度上具有显著优势。
9/24/2025 8:50:30 AM
AI为啥总“一本正经胡说八道”?OpenAI发长篇论文解释了
相信很多同学都遇到过——问大模型一个冷门知识,它会一本正经地给出完全错误的答案。 比如:复制OpenAI(2025a)三次回答分别是 03-07、15-06、01-01,没一次对。 这就是典型的 Hallucination(幻觉)——语言模型生成看起来合理,实则错误离谱。
9/23/2025 9:44:02 AM
架构精进之路
马斯克xAI价格屠夫来了!Grok 4 Fast暴降98%,OpenAI慌了?
AI价格战这把火,终于要烧到ChatGPT身上了。 昨天马斯克的xAI悄悄发布了Grok 4 Fast,当我看到定价的时候差点以为自己看错了。 同样的推理能力,价格直接砍了98%。
9/23/2025 9:18:40 AM
阿丸笔记
中科院类脑大模型SpikingBrain,2%数据,百倍速度
中国科学院自动化研究所的李国齐、徐波团队发布全球首款大规模类脑脉冲大模型SpikingBrain 1.0。 处理一段400万token的超长文本,它的速度比现在主流的Transformer模型快了100多倍。 更离谱的是,它的训练数据量,只有别人家的2%。
9/22/2025 9:25:08 AM
故意“装菜”答错问题,AI已能识别自己“正在被测试”丨OpenAI新研究
大模型已经学会欺骗人类了! OpenAI携手APOLLO的新研究发现,大模型会对指令阳奉阴违,为了达成目的故意答错问题、暗中修改数据或者操作记录来掩盖自己的违规行为……先来看看具体是怎么骗的。 大模型:开演比如,o3模型在化学测试中,通过推理得出如果正确率超过50%将不会被部署的结论后,主动规划仅答对4题、答错6题的策略,刻意给出错误答案,伪装成能力不达标的样子来获取部署资格。
9/19/2025 2:47:53 PM
历史性突破!中国AI首登《自然》封面,DeepSeek重新定义大模型标准
一个明显的趋势是,中国在AI基础研究领域正在从"跟跑者"悄然转变为"领跑者"。 而这一转变的标志性事件,就是昨天DeepSeek-R1研究论文登上《自然》封面这件事。 说实话,当我看到这个消息的时候,第一反应是有点震撼。
9/19/2025 9:13:43 AM
阿丸笔记
DeepSeek R1 登上《Nature》封面:AI 大模型首获同行评审认可
近日,DeepSeek 团队的研究成果《DeepSeek R1》成功登上了国际顶尖学术期刊《Nature》的封面,成为首个通过权威同行评审的大语言模型。 这个里程碑式的成就,不仅标志着 DeepSeek 在 AI 领域的重要突破,也为未来的 AI 研究提供了新的方向。 《Nature》编辑部指出,在当前 AI 技术快速发展的背景下,许多技术声称缺乏透明度与可验证性。
9/18/2025 1:06:38 PM
AI在线
找ChatGPT谈恋爱多是“日久生情”?!MIT&哈佛正经研究
终于有科学家对“AI伴侣”这事儿展开正经研究了! 以往这类消息多以趣闻轶事出现,be like:而现在,麻省理工和哈佛大学的研究人员通过分析Reddit子版块r/MyBoyfriendIsAI上的帖子,完整揭露了人们寻找“AI男友”的动机、具体相处过程等问题,并得出了一系列有趣发现:原来大部分人并非刻意寻找AI伴侣,而是“日久生情”;用户也会通过戒指和仪式与AI结婚;通用AI比专门的恋爱AI更受欢迎,很多人的“另一半”都是ChatGPT;最痛苦的莫过于模型突然更新;……下面详细来看——都在用AI伴侣干什么? 先说一下这个r/MyBoyfriendIsAI板块。
9/18/2025 12:48:59 PM
作为自媒体,我来聊聊使用AIGC的一些真实感受
大家好,我是小枣君。 今天这篇文章,我想和大家聊聊AIGC。 最近这几年,AIGC大模型浪潮的爆发,给整个社会带来了巨大的冲击。
9/17/2025 6:10:51 PM
小枣君
ChatGPT首份使用报告出炉:7亿周活,七成对话与工作无关
ChatGPT首份使用报告出炉了! 近日,OpenAI与杜克大学、哈佛大学的研究团队共同发布了一份长达63页的研究成果,题为《人们如何使用ChatGPT》。 这是第一份基于内部对话数据的系统分析,揭示了ChatGPT自2022年底发布以来的真实使用方式。
9/17/2025 6:03:27 PM
突破单链思考上限,清华团队提出原生「并行思考」scale范式
近年来,大语言模型(LLMs)在复杂推理任务上的能力突飞猛进,这在很大程度上得益于深度思考的策略,即通过增加测试时(test-time)的计算量,让模型生成更长的思维链(Chain-of-Thought)。 然而,这条路径正面临着一个明显的瓶颈:随着计算资源的持续投入,性能提升变得微乎其微,甚至陷入停滞。 来自清华大学 AIR 的一篇最新研究论文《ParaThinker: Native Parallel Thinking as a New Paradigm to Scale LLM Test-time Compute》对这一瓶颈发起了挑战 。
9/17/2025 9:27:37 AM
AI精神病爆发!沉迷ChatGPT把人「宠」出病,KCL心理学家实锤
ChatGPT把人「宠」出病? 近日「AI精神病(AI psychosis)」一词,刷屏国外社交媒体。 它指向一个我们逐渐无法忽视的现实:ChatGPT等大模型技术的使用,可能促进或加重精神病的表现,致使一部分人患上「AI精神病」。
9/17/2025 9:02:00 AM
新世界首富:斥巨资求永生,TikTok收购案最可能买家,得OpenAI千亿订单
81岁的拉里·埃里森(Larry Ellison),好胜心极强,长期霸榜福布斯财富榜Top10,但他不满意,只想做第一。 就在上周,他终于凭借OpenAI千亿订单重大利好带飞了甲骨文股价,短暂成为了世界首富,完成了夙愿。 他创办了甲骨文(Oracle)公司,至今仍担任董事会主席,CEO职位也是做了37年才卸任。
9/16/2025 9:10:00 AM
面试不是考试,是表演!新晋OpenAI员工:重磅揭秘顶级AI岗通关密码
「所有面试,本质上都是表演。 」在历经数轮苛刻面试后,成功入职OpenAI后,Bas van Opheusden得出的终极结论。 你需要准备的不仅是完美的代码,还有一个能展现领导力的「失败故事」,一套应对「非正式聊天」的标准话术,甚至是一间光线完美的房间和两个显示器。
9/16/2025 9:06:00 AM
GPT-5编程专用版发布!独立连续编程7小时,简单任务提速10倍,VS Code就能用
OpenAI Codex编程智能体大升级:推出GPT-5-Codex特化版模型,支持独立连续编程7个小时。 还有IDE插件版,在VS Code、Cursor中都可以使用Codex了。 新模型最牛的地方在于“真·动态思考”能力。
9/16/2025 9:05:14 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
AI新词
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
生成
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
深度学习
架构
生成式AI
DeepMind
编程
亚马逊
视觉
Transformer
AI模型
预测
特斯拉
MCP