AIGC宇宙 AIGC宇宙

AI

震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?

一直以来,预训练,都是大模型训练过程中最花钱的部分。 比如,在DeepSeek V3中,它的成本占比就超过95%。 谁能在这里节省算力,就等于赚了。
9/8/2025 8:59:00 AM

只收AI人才,OpenAI认证直通大厂!全球AI招聘平台,1000万人持证上岗

在全球职场社交的牌桌上,LinkedIn坐了快二十年,几乎没有真正的挑战者。 直到9月4日,OpenAI公布了「AI就业平台 AI技能认证」两项计划。 它试图用AI直接撮合招聘与求职,并用可验证的技能认证作为通行证。
9/5/2025 1:51:01 PM
新智元

DeepSeek正开发高级AI Agent模型,硬刚OpenAI

彭博消息,DeepSeek正在开发一款更高级的AI Agent模型,皆在与OpenAI等美国企业竞争。 据知情人士透露,这款AI Agent可在用户指令极少的情况下,帮助用户执行多步骤任务。 他们补充称,该系统还能基于自身过往行动进行学习并持续优化。
9/5/2025 9:03:46 AM

AI也邪修!Qwen3改Bug测试直接搜GitHub,太拟人了

大模型也会玩信息差了。 Qwen3在基准测试中居然学会了钻空子。 FAIR研究员发现Qwen3在SWE-Bench Verified测试中,不按常理修bug,反而玩起了信息检索大法。
9/5/2025 9:02:00 AM

DeepSeek大招曝光?梁文锋督战超级智能体:能自主学习,或年底发布

DeepSeek再次叫板OpenAI? 就在今天,彭博社爆料出重磅内幕消息:DeepSeek憋了一个超级大招——真正的AI智能体(AI Agent)! DeepSeek R1过去的开源之王今年1月,DeepSeek R1模型以仅数百万美元的成本,在多项基准测试中,实现了对标甚至超越OpenAI顶尖产品的表现。
9/5/2025 9:01:40 AM

OpenAI发布企业AI浪潮领先指南:十大核心洞察

自2022年11月ChatGPT横空出世以来,GenAI的发展速度之快,甚至连其创造者之一——OpenAI——也承认“很难跟上”。 OpenAI今天发布了一份新报告《Staying Ahead in the Age of AI: A Leadership Guide》(在AI时代保持领先:领导力指南),总结了其与大型知名企业合作的经验,包括制药巨头Moderna、化妆品公司Estée Lauder、协作平台Notion,以及跨国金融服务公司BBVA。 这份报告提出了五项指导原则——对齐、激活、放大、加速、治理,其中,报告为各行业企业的技术决策者提炼出10个关键要点:1.
9/4/2025 2:24:17 PM
Carl

美团 LongCat-Flash 这个5600亿参数的懒AI,竟然比勤奋的模型跑得更快?

昨天晚上刷朋友圈,看到一个做AI的朋友发了条动态:"我们公司又烧了几百万训练大模型,结果推理速度还是慢得像老牛拉车。 "下面一堆同行在评论区哭穷,说什么GPU成本太高、训练时间太长、推理延迟要命。 正当大家集体吐槽的时候,美团悄悄放了个大招——LongCat-Flash。
9/4/2025 12:16:47 PM
大数据AI智能圈

工具集成推理(TIR)的认知革命:当大模型学会“与工具协同思考”

大家好,我是肆〇柒。 今天,我们要深入探讨的是一项由腾讯与清华大学联合研究的前沿成果。 这项论文《Understanding Tool-Integrated Reasoning》,首次从形式化证明的角度,系统性地揭示了工具集成推理(TIR)为何能从根本上扩展大语言模型的能力边界。
9/4/2025 9:36:04 AM
肆零柒

OpenAI免费开放ChatGPT Projects,3大功能太香了

今天凌晨3点50,OpenAI宣布向免费版ChatGPT开放Projects(项目)功能。 Projects功能最早发布于2024年的12月14日,也就是「AIGC开放社区」为大家介绍OpenAI连续12天技术直播的第7天。 自发布以来Projects一直是用户最喜欢的功能之一,不过是付费用户的专属,现在终于免费开放了。
9/4/2025 9:13:22 AM

推理大模型机制解析!为什么Qwen3要把脑子一分为二?

近期,Qwen3模型的一个重大转变,让整个行业都在重新思考一个根本问题:推理大模型到底应该什么时候思考,什么时候直接给答案? 这已不再是技术问题,也是关乎AI产品体验的核心议题...Qwen3的"分家"背后:理想很丰满,现实很骨感回到今年4月,Qwen3刚发布时,阿里团队雄心勃勃地推出了"混合思考模式"。 听起来很美好:一个模型既能快速响应简单问题,又能深度思考复杂任务。
9/4/2025 1:00:00 AM
大数据AI智能圈

大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背

训练大模型时,有时让它“记性差一点”,反而更聪明! 大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。 为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(Goldfish Loss)。
9/3/2025 2:02:08 PM

Anthropic 融资 130 亿美元,估值飙升至 1830 亿美元

近日,人工智能公司 Anthropic 宣布成功完成了一轮130亿美元的融资,交易后估值达到惊人的1830亿美元。 此次融资的领头投资方是知名投资公司 ICONIQ。 尽管科技行业在支出方面面临一些挑战和不确定性,但对于人工智能初创企业的投资热情依然高涨。
9/3/2025 10:01:50 AM
AI在线

刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大

今天,网信办《人工智能生成合成内容标识办法》正式生效。 其中,第四条要求:对符合要求的AI生成合成内容添加显式标识。 紧跟最新政策,DeepSeek出手了。
9/2/2025 10:17:07 AM

美团首个开源大模型正式发布!LongCat-Flash-Chat能否撼动AI格局?

美团正式发布并开源了自己的首个大语言模型——LongCat-Flash-Chat。 说实话,这个消息让我挺意外的。 美团,这个我们天天用来点外卖、叫车的平台,突然宣布要在AI大模型领域正面挑战OpenAI、Anthropic这些巨头。
9/2/2025 10:05:33 AM
阿丸笔记

被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序

直到现在,GPT-5的升级,仍然被很多人低估了! 一方面是,很多人没有看透OpenAI发布GPT-5背后的真正原因。 GPT-5的「突破」不在性能,而是模型「自带路由」和思考配额分发下的「单位token经济学」。
9/1/2025 2:55:00 AM
新智元

亿万富翁丹・洛布减持台积电,转投另一家万亿人工智能公司

根据《华尔街日报》的报道,亿万富翁投资者丹・洛布近日减持了其在半导体制造公司(TSMC)的股份,出售了近29% 的持股,转而增持了另一家万亿市值的人工智能(AI)公司。 根据第三方的季度13F 文件,这一动向引发了市场的广泛关注。 图源备注:图片由AI生成,图片授权服务商Midjourney在过去的一年里,洛布的投资基金 Third Point 积极减持 TSMC 股票。
8/29/2025 6:27:05 PM
AI在线

数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!

大模型时代,模型、数据与各种「参数/脚本/许可证」等ML资产爆炸式增长,但真正能被发现、复用、合规使用的比例并不高,这正在成为AI生产力落地的「隐形天花板」。 以知名开源平台HuggingFace为例,平台目前托管超过150万个模型,每月还在新增约10万个模型,总数据存储量高达17PB。 然而超过半数的模型缺乏基本文档说明,不到8%的模型拥有明确的许可证。
8/29/2025 9:16:00 AM

一场「狼人杀」,考倒了一堆大模型

人工智能越来越像人,但“像人”到底意味着什么? 除了会解题、写文,它是否也能理解人类那种充满个性的推理方式? 比如在一场狼人杀游戏中,有人逻辑缜密、有人直觉敏锐、有人擅长伪装。
8/28/2025 1:49:00 PM
郑佳美