AI
震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?
一直以来,预训练,都是大模型训练过程中最花钱的部分。 比如,在DeepSeek V3中,它的成本占比就超过95%。 谁能在这里节省算力,就等于赚了。
9/8/2025 8:59:00 AM
只收AI人才,OpenAI认证直通大厂!全球AI招聘平台,1000万人持证上岗
在全球职场社交的牌桌上,LinkedIn坐了快二十年,几乎没有真正的挑战者。 直到9月4日,OpenAI公布了「AI就业平台 AI技能认证」两项计划。 它试图用AI直接撮合招聘与求职,并用可验证的技能认证作为通行证。
9/5/2025 1:51:01 PM
新智元
DeepSeek正开发高级AI Agent模型,硬刚OpenAI
彭博消息,DeepSeek正在开发一款更高级的AI Agent模型,皆在与OpenAI等美国企业竞争。 据知情人士透露,这款AI Agent可在用户指令极少的情况下,帮助用户执行多步骤任务。 他们补充称,该系统还能基于自身过往行动进行学习并持续优化。
9/5/2025 9:03:46 AM
AI也邪修!Qwen3改Bug测试直接搜GitHub,太拟人了
大模型也会玩信息差了。 Qwen3在基准测试中居然学会了钻空子。 FAIR研究员发现Qwen3在SWE-Bench Verified测试中,不按常理修bug,反而玩起了信息检索大法。
9/5/2025 9:02:00 AM
DeepSeek大招曝光?梁文锋督战超级智能体:能自主学习,或年底发布
DeepSeek再次叫板OpenAI? 就在今天,彭博社爆料出重磅内幕消息:DeepSeek憋了一个超级大招——真正的AI智能体(AI Agent)! DeepSeek R1过去的开源之王今年1月,DeepSeek R1模型以仅数百万美元的成本,在多项基准测试中,实现了对标甚至超越OpenAI顶尖产品的表现。
9/5/2025 9:01:40 AM
OpenAI发布企业AI浪潮领先指南:十大核心洞察
自2022年11月ChatGPT横空出世以来,GenAI的发展速度之快,甚至连其创造者之一——OpenAI——也承认“很难跟上”。 OpenAI今天发布了一份新报告《Staying Ahead in the Age of AI: A Leadership Guide》(在AI时代保持领先:领导力指南),总结了其与大型知名企业合作的经验,包括制药巨头Moderna、化妆品公司Estée Lauder、协作平台Notion,以及跨国金融服务公司BBVA。 这份报告提出了五项指导原则——对齐、激活、放大、加速、治理,其中,报告为各行业企业的技术决策者提炼出10个关键要点:1.
9/4/2025 2:24:17 PM
Carl
美团 LongCat-Flash 这个5600亿参数的懒AI,竟然比勤奋的模型跑得更快?
昨天晚上刷朋友圈,看到一个做AI的朋友发了条动态:"我们公司又烧了几百万训练大模型,结果推理速度还是慢得像老牛拉车。 "下面一堆同行在评论区哭穷,说什么GPU成本太高、训练时间太长、推理延迟要命。 正当大家集体吐槽的时候,美团悄悄放了个大招——LongCat-Flash。
9/4/2025 12:16:47 PM
大数据AI智能圈
工具集成推理(TIR)的认知革命:当大模型学会“与工具协同思考”
大家好,我是肆〇柒。 今天,我们要深入探讨的是一项由腾讯与清华大学联合研究的前沿成果。 这项论文《Understanding Tool-Integrated Reasoning》,首次从形式化证明的角度,系统性地揭示了工具集成推理(TIR)为何能从根本上扩展大语言模型的能力边界。
9/4/2025 9:36:04 AM
肆零柒
OpenAI免费开放ChatGPT Projects,3大功能太香了
今天凌晨3点50,OpenAI宣布向免费版ChatGPT开放Projects(项目)功能。 Projects功能最早发布于2024年的12月14日,也就是「AIGC开放社区」为大家介绍OpenAI连续12天技术直播的第7天。 自发布以来Projects一直是用户最喜欢的功能之一,不过是付费用户的专属,现在终于免费开放了。
9/4/2025 9:13:22 AM
推理大模型机制解析!为什么Qwen3要把脑子一分为二?
近期,Qwen3模型的一个重大转变,让整个行业都在重新思考一个根本问题:推理大模型到底应该什么时候思考,什么时候直接给答案? 这已不再是技术问题,也是关乎AI产品体验的核心议题...Qwen3的"分家"背后:理想很丰满,现实很骨感回到今年4月,Qwen3刚发布时,阿里团队雄心勃勃地推出了"混合思考模式"。 听起来很美好:一个模型既能快速响应简单问题,又能深度思考复杂任务。
9/4/2025 1:00:00 AM
大数据AI智能圈
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
训练大模型时,有时让它“记性差一点”,反而更聪明! 大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。 为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(Goldfish Loss)。
9/3/2025 2:02:08 PM
Anthropic 融资 130 亿美元,估值飙升至 1830 亿美元
近日,人工智能公司 Anthropic 宣布成功完成了一轮130亿美元的融资,交易后估值达到惊人的1830亿美元。 此次融资的领头投资方是知名投资公司 ICONIQ。 尽管科技行业在支出方面面临一些挑战和不确定性,但对于人工智能初创企业的投资热情依然高涨。
9/3/2025 10:01:50 AM
AI在线
刚刚,DeepSeek最新发文!V3/R1训练细节全公开,信息量巨大
今天,网信办《人工智能生成合成内容标识办法》正式生效。 其中,第四条要求:对符合要求的AI生成合成内容添加显式标识。 紧跟最新政策,DeepSeek出手了。
9/2/2025 10:17:07 AM
美团首个开源大模型正式发布!LongCat-Flash-Chat能否撼动AI格局?
美团正式发布并开源了自己的首个大语言模型——LongCat-Flash-Chat。 说实话,这个消息让我挺意外的。 美团,这个我们天天用来点外卖、叫车的平台,突然宣布要在AI大模型领域正面挑战OpenAI、Anthropic这些巨头。
9/2/2025 10:05:33 AM
阿丸笔记
被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序
直到现在,GPT-5的升级,仍然被很多人低估了! 一方面是,很多人没有看透OpenAI发布GPT-5背后的真正原因。 GPT-5的「突破」不在性能,而是模型「自带路由」和思考配额分发下的「单位token经济学」。
9/1/2025 2:55:00 AM
新智元
亿万富翁丹・洛布减持台积电,转投另一家万亿人工智能公司
根据《华尔街日报》的报道,亿万富翁投资者丹・洛布近日减持了其在半导体制造公司(TSMC)的股份,出售了近29% 的持股,转而增持了另一家万亿市值的人工智能(AI)公司。 根据第三方的季度13F 文件,这一动向引发了市场的广泛关注。 图源备注:图片由AI生成,图片授权服务商Midjourney在过去的一年里,洛布的投资基金 Third Point 积极减持 TSMC 股票。
8/29/2025 6:27:05 PM
AI在线
数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!
大模型时代,模型、数据与各种「参数/脚本/许可证」等ML资产爆炸式增长,但真正能被发现、复用、合规使用的比例并不高,这正在成为AI生产力落地的「隐形天花板」。 以知名开源平台HuggingFace为例,平台目前托管超过150万个模型,每月还在新增约10万个模型,总数据存储量高达17PB。 然而超过半数的模型缺乏基本文档说明,不到8%的模型拥有明确的许可证。
8/29/2025 9:16:00 AM
一场「狼人杀」,考倒了一堆大模型
人工智能越来越像人,但“像人”到底意味着什么? 除了会解题、写文,它是否也能理解人类那种充满个性的推理方式? 比如在一场狼人杀游戏中,有人逻辑缜密、有人直觉敏锐、有人擅长伪装。
8/28/2025 1:49:00 PM
郑佳美
资讯热榜
量大管饱!我整理了10个好用到爆的即梦4.0进阶玩法
AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注
ChatGPT能随便连MCP了!对话就能开发票、帮退款…奥特曼的野心毕露:将OpenAI打造成全能型平台!开发者:太危险了不敢用
为什么 LangChain ReAct 机制值得关注 ?
姚顺雨离职OpenAI,「亿元入职腾讯」传闻引爆AI圈,鹅厂辟谣了
微软与 OpenAI 战略转变,探索新合作伙伴关系
聚焦结构化注意力,探索提升多模态大模型文档问答性能
狠人研究公开!ChatGPT底层记忆系统终于被逆向了!没有RAG!用户设备信息、使用习惯统统存下来,用户知识记忆是新的研究热点!
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型