AI
32B 稠密模型推理能力超越 R1?秘密 AI 团队发布推理小模型 AM-Thinking-v1
在大模型竞速进入推理能力深水区的 2025 年,一支神秘的团队悄然登场。 他们不是来自一线大厂的 AI Lab,也没有高调预热和融资造势,而是在 Hugging Face 低调开源了一款 32B 的推理模型:AM-Thinking-v1。 令人惊讶的是,这个中等规模的稠密模型,在多个关键推理评测中击败了 DeepSeek-R1,并与超大规模的 MoE 模型Qwen3-235B-A22B、Seed1.5-Thinking 不相上下。
5/15/2025 2:39:00 PM
郑佳美
首次披露!DeepSeek V3 发布软硬一体协同训练论文,公开“降成本”秘诀
就在刚刚,DeepSeek团队发布最新论文《洞察 DeepSeek-V3:规模的挑战和对AI架构硬件的思考》。 论文链接:,论文采用了双重视角——跨越硬件架构和模型设计,通过研究这种协同作用,探索 DeepSeek-V3 如何实现经济高效的大规模训练和推理。 随着 OpenAI o1/o3、DeepSeek-R1、Claude-3.7 Sonnet 等先进模型的出现,大规模架构和上下文推理的进步强调了对更快、更高效推理的需求。
5/15/2025 2:32:00 PM
郑佳美
谷歌AlphaEvolve发布!Gemini自进化AI破解数学难题,优化芯片与数据中心,训练速度飙升32.5%!
谷歌DeepMind发布了一项颠覆性研究成果——AlphaEvolve,一款结合Gemini大语言模型与进化算法的AI编码代理。 这款系统不仅能自动发现和优化复杂算法,还在谷歌的数据中心、芯片设计和AI训练中展现了惊人实力,甚至助力Gemini模型自我优化,堪称AI领域的“左脚踩右脚”式突破。 AIbase深入剖析这一技术里程碑,揭示其核心原理与广泛影响。
5/15/2025 2:00:45 PM
AI在线
新一代开源3D模型 Step1X-3D 亮相,AI行业新动向引关注
近日,科技领域迎来了一款全新的开源3D 大模型 —— 阶跃星辰 Step1X-3D。 该模型的发布,标志着 AI 技术的又一次重大进步,尤其是在3D 建模和推理能力方面。 该模型不仅开源,且针对开发者提供了多种实用的功能,极大地促进了创新和研究的可能性。
5/15/2025 11:02:25 AM
AI在线
谷歌 DeepMind 推出 AlphaEvolve:AI 首次打破数学56年纪录,优化自身训练系统
谷歌 DeepMind 今日发布 AlphaEvolve,一款具备自我进化能力的人工智能代理,它不仅能自主发明复杂的计算机算法,还已广泛应用于谷歌的数据中心、芯片设计和 AI 模型训练中,取得了显著成果。 AlphaEvolve 将 Gemini 大语言模型与进化式优化方法结合,自动测试、改进并提升整个代码库,而不仅限于单一函数。 该系统已在内部悄然运行一年多,提升了计算资源调度效率、加速了模型训练,并在数学研究上实现了突破。
5/15/2025 11:01:54 AM
AI在线
AI+数据智能体的三大支点:数据治理、知识库和大模型
当销售部喊出"业绩增长15%",财务部却坚称"只有8%"。 会议室里争论不休,时间流逝,竞争对手已经抢占先机。 你不禁自问:明明砸了千万建设数据系统,为何企业依然深陷数据内耗?
5/15/2025 9:56:32 AM
大数据AI智能圈
OpenAI 升级 ChatGPT AI 聊天机器人,GPT-4.1 编程专家模型登场
OpenAI 官方账号在 X 平台发布推文,宣布将于昨日(5 月 14 日)开始,在 ChatGPT AI 聊天机器人中,引入 GPT-4.1 模型。
5/15/2025 6:15:38 AM
故渊
Sam Altman重磅揭秘:OpenAI未来将打造AI操作系统,语音+定制模型引爆未来!
OpenAI首席执行官Sam Altman在最新访谈中分享了OpenAI的高速发布节奏、产品战略及未来愿景。 他明确表示,OpenAI致力于打造操作系统级别的AI平台,通过小团队运作、算法创新和语音技术突破,引领AI行业迈向新高度。 AIbase观察到,Altman对年轻一代使用ChatGPT的独特方式尤为关注,凸显了AI从工具向生活核心的转变趋势。
5/14/2025 5:00:52 PM
AI在线
OpenAI CEO 奥尔特曼畅想未来:构建类似操作系统的 AI 产品
OpenAI CEO萨姆・奥尔特曼在红杉资本活动上提出颠覆性AI构想:未来模型将整合用户一生数据,成为智能“人生操作系统”。他坦言当前技术尚未达标,但强调这是唯一方向。#AI未来式# #OpenAI新野心#
5/14/2025 4:50:38 PM
远洋
谷歌重磅AI代理即将上线!从任务到文档一键搞定,开发效率飙升3倍!
最近,谷歌正积极开发一款名为“软件开发生命周期AI代理”(Software Development Lifecycle AI Agent)的创新工具,预计未来可能集成至Gemini生态()。 该代理旨在为软件工程师提供端到端的开发支持,覆盖从任务响应到代码文档化的全流程,堪称“全天候数字同事”。 AIbase观察到,这一消息在2025年5月13日引发开发者社区热议,被认为是谷歌在AI驱动开发工具领域的又一重大布局。
5/14/2025 3:00:52 PM
AI在线
英伟达发布新 RL 范式:受 DeepSeek-R1 启发,重塑 AI 模型外部工具能力
英伟达联合推出 Nemotron-Research-Tool-N1 系列模型,受 DeepSeek-R1 启发,采用新型强化学习(RL)范式,强化模型推理能力。
5/14/2025 2:03:30 PM
故渊
法律AI独角兽Harvey拥抱Anthropic与谷歌模型,打破OpenAI独家依赖
备受瞩目的法律人工智能工具 Harvey 近日宣布战略调整,未来将整合 Anthropic 和谷歌的领先基础模型,结束了此前完全依赖 OpenAI 技术的局面。 值得注意的是,Harvey 曾是 OpenAI 初创基金的明星投资项目之一,该基金旨在扶持基于 AI 技术(特别是 OpenAI 自研技术)的公司。 尽管 Harvey 强调不会放弃 OpenAI,只是增加了更多模型和云服务选项,但此举无疑对 OpenAI 的竞争对手来说是一次重要的胜利。
5/14/2025 10:01:02 AM
AI在线
谷歌I/O2025:AI 眼镜原型震撼亮相,Gemini 助力无界面计算新时代
在即将到来的2025年谷歌 I/O 大会上,科技界的目光将再次聚焦于谷歌。 此次大会定于5月20日至21日举行,谷歌已经暗示将展示一款备受期待的 AI 智能眼镜原型。 这款眼镜不仅搭载微型显示屏,还配备了谷歌最新的 Gemini 人工智能助手,标志着无界面计算的新纪元。
5/14/2025 9:01:03 AM
AI在线
OpenAI 高管:AI 未来可自主生成知识,商业与科研迎来革命
Pachocki强调,AI通过无监督预训练和强化学习(RLHF)构建“世界模型”,并将其转化为实用助手。他还预测,到本世纪末,AI将在自主研究领域取得重大进展,甚至可能在今年内实现近乎自主的软件开发。
5/13/2025 1:46:00 PM
故渊
OpenAI 扩展 ChatGPT AI 深度研究连接器,集成微软 OneDrive 和 SharePoint
OpenAI 昨日(5 月 12 日)更新 ChatGPT 日志文件,宣布面向 ChatGPT Plus、Pro 和 Team 用户(EEA、瑞士和英国除外),扩展 ChatGPT AI 聊天机器人深度研究连接器,集成微软 OneDrive 和 SharePoint。
5/13/2025 10:25:31 AM
故渊
OpenAI推出深度研究报告一键导出PDF功能
人工智能领域的领军企业OpenAI宣布,为其ChatGPT深度研究(Deep Research)工具新增了一项重要功能——一键将深度研究报告导出为PDF。 此功能不仅提升了研究报告的实用性,还进一步推动了AI在企业场景中的落地应用。 功能亮点:完整保留格式,专业输出OpenAI的深度研究工具能够通过多步骤网络搜索和信息整合,生成包含引用、表格和图片的详尽报告。
5/13/2025 10:01:02 AM
AI在线
AI训练的反直觉发现:添加"有毒"数据反而能造就更好的语言模型?
"当坏数据能够创造出好模型,AI训练领域又一个传统观念被颠覆"你有没有听说过这样一个说法:垃圾进,垃圾出? 在AI大语言模型的训练中,这一直是个不言自明的准则。 工程师们花费大量时间和资源过滤训练数据,移除那些含有有毒、有害或不适当内容的文本,以防止模型学习和生成这些内容。
5/13/2025 2:22:00 AM
无影寺
OpenAI命悬一线,微软连夜割肉!跪求OpenAI千万别分手
OpenAI和微软,快要闹崩了! 面对着想要上市的OpenAI,不惜割肉续命,绝不能让自己的130亿投资打水漂。 英国金融时报刚刚曝出,OpenAI和微软,正在重新协商数十亿美元的合作条款。
5/12/2025 6:26:55 PM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
AI新词
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
具身智能
生成
百度
Sora
工具
GPU
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
深度学习
架构
生成式AI
DeepMind
编程
亚马逊
视觉
Transformer
AI模型
预测
特斯拉
MCP