开源

马斯克掀桌子了，最强开源大模型诞生！Grok-2近万亿参数性能首曝

什么？马斯克终于开源了Grok-2！一大早，xAI正式官宣，向所有人开源Grok-2！

8/25/2025 9:10:00 AM

OpenAI重磅发布gpt-oss系列开源大模型：媲美 GPT-4o

不论你是独立开发者、企业还是研究机构，现在都可以免费拥有一款与 GPT-4o 接近实力的语言模型。开源但不“阉割”：媲美 GPT-4o，运行成本极低OpenAI 在这次发布中非常有诚意：gpt-oss-120b：在核心推理任务上已接近 GPT-4o-mini，支持 128k 上下文，单卡 80GB GPU 可跑。 gpt-oss-20b：性能对标 GPT-3.5（o3-mini），仅需 16GB 显存，可部署于消费级设备、本地推理、离线使用等场景。

8/7/2025 2:05:40 PM

AI大模型应用开发

百元级硬件流畅运行百亿参数大模型！上交&本智激活开源端侧原生大模型

AI的下一个战场，不在云端，而在你的口袋里。 iPhone、华为、三星、小米、OPPO等各大手机厂商几乎都在将大模型塞进手机，端侧AI已然成为兵家必争之地。背后的逻辑清晰而坚定：最懂你的AI，必须能安全地访问你的个人数据——邮件、照片、日程，而这一切的前提，就是将计算留在本地，将隐私还给用户。

7/28/2025 9:06:00 AM

Le Chat全方面对标ChatGPT，欧洲AI新贵穷追不舍

最近几个月，由谷歌和 Meta 前研究人员建立的欧洲的 AI 初创公司 Mistral AI 有些躁动不安。他们接连发布了好些个开源模型，覆盖不同的领域，包含号称「世界上最优秀」的 OCR 模型、「对标 Claude」的多模态模型、首个推理大模型 Magistral 以及两天前发布的「全球最佳」的开源语音模型 Voxtral。这样似乎也很难让这位欧洲 AI「新贵」感到满意，他们还想在应用层面好好地卷一卷 OpenAI。

7/18/2025 9:39:57 AM

月之暗面开源 Kimi-K2：万亿参数，超强Agent，全线 SOTA

2023年成立的中国AI初创公司月之暗面，刚刚发布了其最新重量级产品Kimi-K2。这是一款参数规模高达一万亿的开源大模型，以挑战GPT-4.1和Claude Sonnet 4为目标。 Kimi-K2没有配备专门的“推理模块”，却依然在多个关键领域打破性能壁垒，这一策略让人想起早前Deepseek的发布。

7/17/2025 7:12:45 AM

大数据文摘

五个月估值120亿！OpenAI前CTO自曝首个多模态AI，竟要免费开源

OpenAI前CTO初创，又拿到新融资了！一早，Mira Murati官宣由a16z领投20亿美元融资，至此，Thinking Machines Lab估值120亿美元。同时，英伟达、AMD、Accel、ServiceNow等多家明星风投也参与了本次融资。

7/16/2025 9:44:29 AM

从封闭到放开：百度开源文心 4.5 全家桶，多项基准上领先 Deepseek，行业天花板再抬高

百度突然宣布，将旗下最新的大语言模型文心大模型4.5（ERNIE 4.5）全系列开源，震动整个AI行业。此次开源采用Apache 2.0许可协议，意味着全球开发者不仅可以免费下载和使用，也可以自由修改与商用。图片这标志着百度战略方向的重大转变。

7/3/2025 4:27:26 PM

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

近日，百度正式宣布开源其文心大模型4.5系列，共推出了十款模型，包括47B、3B 激活参数的混合专家（MoE）模型，以及0.3B 参数的稠密型模型。此次开源不仅实现了预训练权重的完整公开，还提供了推理代码，标志着百度在大模型领域的重大进展。这些新发布的模型可以在飞桨星河社区、Hugging Face 等平台上下载和部署，同时，百度智能云千帆大模型平台也提供了相应的 API 服务。

6/30/2025 3:00:50 PM

AI在线

网页编程众测排名：DeepSeek-R1超越Claude 4加冕全球第一

编程王者Claude地位不稳了？？大模型竞技场最新战报出炉，DeepSeek新版R1拿下网页编程第一，小胜Claude Opus 4。

6/17/2025 5:14:01 PM

Anthropic重磅开源！“电路追踪”工具解锁AI大脑，揭秘大模型决策全过程

近年来，大语言模型（LLM）的快速发展为人工智能领域带来了前所未有的突破，但其内部决策过程却常常被视为“黑盒子”，难以捉摸。 5月29日，AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具，为破解大模型的内部工作机制提供了全新视角。这一工具不仅能帮助研究人员深入探索AI的“思考”过程，还为推动更透明、可控的AI发展迈出了重要一步。

5/30/2025 10:01:14 AM

AI在线

刚刚，新版DeepSeek-R1正式开源！直逼o3编程强到离谱，一手实测来了

就在今天凌晨，新版DeepSeek-R1正式开源了！ DeepSeek-R1-0528模型权重已上传到HuggingFace，不过模型卡暂未更新。项目地址：，DeepSeek-R1完成了超进化，编码能力强到离谱，而且思考时间更长了。

5/29/2025 9:04:51 AM

字节开源Dolphin，高精度文档图像解析大模型，创新先分析后解析新范式

在数字时代，从扫描文档、图片等非结构化数据中高效、准确地提取结构化信息，是人工智能领域长期面临的挑战。无论是复杂的表格、交织的文本段落，还是难以识别的数学公式，都对文档解析技术提出了严苛要求。传统的解决方案往往依赖于多个专业模型的串联，不仅集成成本高昂，还容易在处理过程中累积误差。

5/26/2025 4:46:38 PM

贝塔街的万事屋

OpenAI深夜开源HealthBench，60个国家合力开发5000段真实对话

今天凌晨1点30，OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。与以往测试集不同的是，该测试集的5000段核心测试对话，全部由来自60个国家/地区的26个专业262名医生打造，极大增强了该测试集的难度、真实性以及丰富度。并且采用了多轮对话测试，而不是简单的答题或选择题模式。

5/13/2025 9:08:00 AM

Copilot上大分，仅数天，陶哲轩的估计验证工具卷到2.0！刚刚又发数学形式化证明视频

本周二，我们报道了菲尔兹奖得主陶哲轩的一个开源项目 —— 在大模型的协助下编写了一个概念验证软件工具，来验证涉及任意正参数的给定估计是否成立（在常数因子范围内）。在项目中，他开发了一个用于自动（或半自动）证明分析中估计值的框架。估计值是 X≲Y（在渐近记法中表示 X=O (Y)）或 X≪Y（在渐近符号中表示 X=o (Y)）形式的不等式。

5/12/2025 9:05:00 AM

阿里巴巴开源 ZeroSearch 搜索引擎：训练成本大幅降低 80%

近日，阿里巴巴推出了一款名为 ZeroSearch 的开源创新大模型搜索引擎，这一新工具通过强化学习框架，极大地提高了搜索能力，并且在训练过程中不需要与真实搜索引擎互动。 ZeroSearch 的核心优势在于它能够利用大型预训练模型的知识，快速生成相关内容，并且可以动态控制生成内容的质量。与传统的搜索引擎相比，ZeroSearch 的训练成本显著降低。

5/9/2025 9:00:59 AM

AI在线

DeepSeek-Prover-V2-671B 模型开源，数学推理领域迎来新突破

中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮，正式发布其最新开源模型 DeepSeek-Prover-V2-671B。这一拥有6710亿参数的超大规模语言模型，专为数学推理和问题解决设计，展现了 DeepSeek 在高效 AI 开发上的持续创新能力。根据社交媒体上的最新讨论，这一模型被认为是 DeepSeek 在数学领域的重要里程碑，或将推动全球 AI 研究与应用的进一步发展。

4/30/2025 6:00:51 PM

AI在线

Meta 召开首届 LlamaCon 大会，意在对抗 OpenAI

Meta 在其位于加州门洛帕克的总部举行了首届人工智能开发者大会 ——LlamaCon。在此次大会上，Meta 推出了一款面向消费者的 AI 聊天机器人应用程序，并发布了一个开发者 API，允许用户在云端访问 Llama 模型。这些新产品旨在扩大 Meta 开源 Llama AI 模型的采用率，但实际上，Meta 的真正动机可能是超越 OpenAI。

4/30/2025 11:00:50 AM

AI在线

微软发布全球首个1-bit大模型：内存缩至0.4 GB，参数只有0和±1，性能追平全精度

微软的BitNet b1.58 2B4T 的技术报告悄然上线。其实在开源社区里，关于极致低比特量化的大模型早就有各种传闻，这次微软研究院终于亮出底牌。 ——全球首个原生1-bit、规模高达20亿参数的开源大模型。

4/23/2025 12:11:40 PM

文摘菌

资讯热榜

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快宾州州立大学推出首个人工智能工程学位，抢占教育先机 Meta 新超级智能实验室遭遇离职潮，AI 人才流失引发担忧 DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜联合国成立人工智能咨询小组「精而巧」的端侧大模型为何火了？在代理 AI 和物理 AI推动下，全球芯片市场预计将突破 1 万亿美元大关 OpenAI 将推出家长监控功能以应对青少年自杀悲剧

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini 马斯克 AI创作智能体英伟达 Anthropic 论文代码训练算法 AI新词 Stable Diffusion 芯片 LLM 蛋白质开发者腾讯苹果 Claude 生成式 Agent AI for Science 神经网络 3D 机器学习研究生成 xAI 人形机器人 AI视频计算百度 Sora GPU AI设计华为工具大语言模型 RAG 搜索具身智能字节跳动大型语言模型场景深度学习预测视频生成伟达视觉 Transformer AGI 架构亚马逊神器推荐 Copilot DeepMind 特斯拉应用

开源

马斯克掀桌子了，最强开源大模型诞生！Grok-2近万亿参数性能首曝

OpenAI重磅发布gpt-oss系列开源大模型：媲美 GPT-4o

百元级硬件流畅运行百亿参数大模型！上交&amp;本智激活开源端侧原生大模型

Le Chat全方面对标ChatGPT，欧洲AI新贵穷追不舍

月之暗面开源 Kimi-K2：万亿参数，超强Agent，全线 SOTA

五个月估值120亿！OpenAI前CTO自曝首个多模态AI，竟要免费开源

从封闭到放开：百度开源文心 4.5 全家桶，多项基准上领先 Deepseek，行业天花板再抬高

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

网页编程众测排名：DeepSeek-R1超越Claude 4加冕全球第一

Anthropic重磅开源！“电路追踪”工具解锁AI大脑，揭秘大模型决策全过程

刚刚，新版DeepSeek-R1正式开源！直逼o3编程强到离谱，一手实测来了

字节开源Dolphin，高精度文档图像解析大模型，创新先分析后解析新范式

OpenAI深夜开源HealthBench，60个国家合力开发5000段真实对话

Copilot上大分，仅数天，陶哲轩的估计验证工具卷到2.0！刚刚又发数学形式化证明视频

阿里巴巴开源 ZeroSearch 搜索引擎：训练成本大幅降低 80%

DeepSeek-Prover-V2-671B 模型开源，数学推理领域迎来新突破

​Meta 召开首届 LlamaCon 大会，意在对抗 OpenAI

微软发布全球首个1-bit大模型：内存缩至0.4 GB，参数只有0和±1，性能追平全精度

百元级硬件流畅运行百亿参数大模型！上交&本智激活开源端侧原生大模型

Meta 召开首届 LlamaCon 大会，意在对抗 OpenAI