理论

Gemini Canvas 全民玩疯了！免费可用！谷歌：我们的TPU烫麻了，简直火上浇油！皮查伊：我们是SOTA！氛围编程来了

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）自Gemini2.5 Pro发布后，被OpenAI的“吉卜力”画风成功“阻击”的谷歌，逆势火了一把。 4月1日凌晨，谷歌发布了“Google Gemini Canvas”，引起了社媒用户的疯狂转发。图片从提示到原型只需几分钟，任何人都可以使用Canvas进行编码和创作。

4/2/2025 12:23:06 PM

云昭

DeepSeek-V3击败R1开源登顶！杭州黑马撼动硅谷AI霸主，抹去1万亿市值神话

DeepSeek依然很能打，春节余波还在扩散！据AI产品分析平台aitools.xyz统计，DeepSeek每月新增网站访问量超过了ChatGPT。作为异军突起的现象级产品，DeepSeek的增长速度除了创造AI产品的增长奇迹，更是重新定义了全球的AI竞赛格局。

4/2/2025 9:21:00 AM

新智元

DeepSeek R1本地训练全流程实操指南，手把手教你打通其“任督二脉”

作者 | asher许多关于 DeepSeek R1 的复现文章，主要聚焦在“rewards的设计、训练指标的变化、benchmark测评”这些内容，但是对于“本地训练”这个开启深度探索的关键前置步骤，却很少有人深挖。可能有人觉得，照着readme操作就能轻松训练了吧？太天真啦！

4/2/2025 9:00:00 AM

腾讯技术工程

OpenAI重新开源！第一弹就推理模型，还不限制商用，“冲着DeepSeek来的” 关注前沿科技量子位 2025年04月01日 08:38

一夜之间，OpenAI更新三大动向，开源、融资、用户暴增。第一，将开源一个具备推理能力的大语言模型，包含参数权重那种。上一次这样开源还是6年前推出GPT-2。

4/2/2025 8:40:00 AM

量子位

人工智能应用就是大模型能力+场景，基于大模型构建应用，首先要了解大模型的能力圈

在关于大模型应用方面，虽然也了解和应用过其中的一些技术；但经过这段时间的实践和思考发现，对大模型应用的认识还很浅显，因此在此记录一下自己的思考。大模型应用的思考大模型作为人工智能应用的底座技术，所有应用场景和技术都是构建在大模型之上；但很多时候我们都搞错了一件事，那就是我们没有搞清楚大模型能力和其它技术的关联和区别。因此，在这里我们要搞清楚一个概念，那就是大模型能力；所谓大模型的能力，就是模型开发人员怎么把模型做的更好更强，其中设计到模型的设计，训练等；具体有神经网络架构，模型蒸馏等等。

4/2/2025 8:40:00 AM

DFires

随着OpenAI每小时新增一百万用户，企业AI主导地位的竞争进入新阶段

这一里程碑式的投资凸显了AI日益上升的重要性，也标志着企业技术格局的转变。有了如此庞大的资金储备，OpenAI在与谷歌、AWS等巨头的较量中，将有更强的持久力，在与合作伙伴微软的敏感关系中也将拥有更大的筹码，更不用说还有资金与Anthropic和马斯克创办的新公司xAI等强劲对手抗衡。在这轮融资结束之前，OpenAI是否有资金继续在顶级行列中竞争，仍是个未知数。

4/2/2025 7:00:00 AM

Matt Marshall

「DeepSeek-V3 技术解析」：无辅助损失函数的负载均衡

在混合专家模型（MoE）的实践中，负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。传统的均衡策略往往需要引入复杂的辅助损失函数，不仅增加了训练的复杂度，还可能干扰模型的核心学习目标。工程师们在提升模型效率的道路上，一直苦苦追寻着一个优雅而高效的平衡解决方案。

4/2/2025 2:17:00 AM

追求卓越的

大模型应用的能力分级

对大模型应用的能力分级就像给学生打分一样，能让我们更清楚它的本事有多大。能力分级能帮我们设定目标，知道AI现在能干什么，未来还要学什么。有了统一的分级方式，大家就能公平比较不同AI的水平，推动技术进步。

4/2/2025 1:25:00 AM

曹洪伟

DeepSeek-R1之后推理模型发展如何？Raschka长文梳理后R1时代14篇重要论文

近日，Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。在过去的几周里，研究人员推出了许多改进推理的新策略，包括扩展简单测试 - 时间规模化（S1）、关联思维链（Chain of Associated thoughts）、Inner Transformer 等方法。不仅如此，还有来自腾讯实验室的研究人员探索了 Thoughts Are All Over the Place，通过衡量不正确答案中的 token 效率来鼓励模型对每条推理路径进行更深入的探索；来自美国马里兰大学和橡树岭国家实验室等机构联合提出了 Recurrent Block，通过重复调用同一个循环体的方式，在推理阶段可以迭代任意多次；以及来自美国 Zoom 视频通讯公司的研究团队提出了 Chain of Draft（CoD），基于更接近人类推理的提示策略提出了草稿图，这是一种优先考虑效率和推理的提示词策略。

4/1/2025 4:14:00 PM

机器之心

关于大模型智能体意图识别不准确问题：function call 的缺陷

最近在研究大模型智能体也就是Agent的过程中，遇到了一个很严重的问题，直接影响到Agent的质量和效果；那就是意图识别不准确，也可以说是Agent的幻觉问题。其产生的原因就在于大模型有时无法准确识别出用户意图，无法准确调用相应的函数。意图识别不准确现在大模型技术在应用方面，主要有两大方向；其一就是大模型的创作能力，简单来说就是内容生成方面，如生成图片，文字，视频，也包括RAG等。

4/1/2025 12:10:00 PM

DFires

GPT-2后首次！OpenAI将开源带推理能力的开源权重模型！网友：能比DeepSeek R1强吗？

出品 | 51CTO技术栈（微信号：blog51cto）奥特曼发布X文，宣布了一个重磅推理开源权重模型：长话短说：我们即将在未来几个月发布一个强大的开源语言模型，具备推理能力，并希望与开发者交流如何让它更有用：！我们计划发布自 GPT-2 以来的首个开源语言模型。我们已经考虑了很久，但之前有其他优先事项。

4/1/2025 10:35:37 AM

AI算法 | 如何训练自己的大模型？

1、第一阶段：二次预训练模型选择与转换在开始训练之前，需要选择一个合适的基础模型。本文以LLaMA-7B为例，简单介绍下。为了方便后续的操作，将LLaMA-7B模型转换为Hugging Face格式。

4/1/2025 9:54:09 AM

Goldma

打工人自救指南：Manus+DeepSeek+Coze破局AI淘汰

前言2025年的中国AI竞技场中，三股技术浪潮正深度重构普通人的生存法则——DeepSeek让普通人年也能享受硅谷级智囊服务；Manus让小微企业人力成本直降70%（简历筛选、财务核算等）；Coze的智能体孵化出了新兴职业（智能体架构师、智能体调教师等）。当人们还在争论AI是否替代人类时，这三个现象级工具已悄然定义了智能技术的三种进化路径：认知突破、执行闭环与生态革命。这场技术革命的核心分野，在于三者对人类能力的增强坐标差异：• DeepSeek强化认知维度：用强化学习与模型蒸馏技术，将专业决策的颗粒度细化至人类难以企及的层级（如投资策略模拟准确率达97.3%）；• Manus重构执行范式：通过规划-执行-验证（PEV）架构，替代HR筛选、财务核算等流程性工作，实现企业人力成本大幅度降低；• Coze激活创新生态：其插件市场增长率达200%，催生“智能体调教师”“智能体架构师”等新职业，让技术民主化从口号变为现实。

4/1/2025 9:49:06 AM

后端小肥肠

OpenAI要Open了！奥特曼开源首个推理模型，ChatGPT一小时暴增百万用户

OpenAI终于要Open AI了！一大早，奥特曼郑重官宣，「未来几个月，将开源一款强大的推理模型」。这是自GPT-2以来，OpenAI首个开源的模型。

4/1/2025 9:46:08 AM

新智元

刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

虽然又被GPT-4o吉卜力生图的光芒掩盖了，但毫无疑问，上周的另一技术核弹Gemini 2.5 Pro，也是无可争议的强！在试用过程中，网友们逐渐发现，这个模型真的强到发指。在门萨Norway的IQ测试中，它已经突破了130。

4/1/2025 9:17:00 AM

新智元

OpenAI重新开源！第一弹就推理模型，还不限制商用，“冲着DeepSeek来的”

4/1/2025 8:45:15 AM

DeepSeek能否超越ChatGPT？营销人员应该关注什么

在关于创业的商业课程中，初创企业进入市场时面临一个战略决策，即要与竞争对手保持同步。对于一项新产品，你必须快速推向市场，或者为市场带来与众不同的东西。如今，AI初创企业面临着比大多数初创企业更短的跑道来做出这一选择，因为当前领导者之间的竞争依然激烈——包括Perplexity、Claude、谷歌的Gemini和OpenAI的ChatGPT。

4/1/2025 7:00:00 AM

Pierre DeBois

C#玩转AIGC：手搓一个ChatGPT级代码补全插件，VS2025插件开发实录

在AIGC（人工智能生成内容）蓬勃发展的当下，开发者们不断探索其在软件开发流程中的创新应用。其中，代码补全功能借助AIGC技术，能够显著提升编程效率。本文将详细记录如何使用C#开发一个类似ChatGPT级别的代码补全插件，并将其集成到VS2025中，同时附上开源项目地址及性能测试报告。

4/1/2025 2:00:00 AM

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能 DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！ ChatGPT 语音功能升级，实时翻译对话更自然流畅支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足苹果将 ChatGPT 和其他 AI 模型引入 Xcode “程序员炸锅”！Claude一夜撤离 Windsurf，OpenAI 收购遭"精准狙击"

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 LLM Copilot 算力工具驾驶 API 大型语言模型应用 RAG 亚马逊

理论