理论

Gemini-2.0夺冠！全球首个几何推理专项评测出炉，淘天集团出品

多模态大模型几何解题哪家强？首个从几何原理视角出发，全面评估多模态大模型几何解题能力的双语综合基准来了！ GeoSense，系统评测多模态大模型在几何原理识别和应用中的表现，评测基准的数据和评测代码均已开源。

4/28/2025 2:04:03 PM

量子位

华人博士用ChatGPT治病，比医生靠谱？OpenAI联创点赞

ChatGPT居然帮人治好了医生都搞不定的病！华人博士@Yuchenj_UW分享了自己的神奇经历，并感叹：AI就像超能力。我第一次真正相信AI可能会取代医生。

4/28/2025 2:02:08 PM

新智元

轮到“OpenAI帮”上场了！15家由前员工创办的明星创业公司

编辑 | 云昭曾经硅谷有“PayPal帮”，现在轮到“OpenAI帮”登场了。作为ChatGPT背后的公司，OpenAI无疑是当前AI领域最炙手可热的玩家。过去两年，OpenIAI的发展可以用“独占鳌头”来形容，估值迅速飙升至3000亿美元，当然公司的迅速发展往往伴随着剧烈的人员动荡。

4/28/2025 11:57:12 AM

云昭

奥特曼自曝：改版后的GPT-4o谄媚过头了，系情绪价值拉满后的结果，实测：大厂薅开源羊毛有错吗？没错！能被薅说明项目有价值

2个多小时前，OpenAI CEO 奥特曼发推表示：最新版 GPT-4o 在最近几次更新后出现了“过度谄媚”的交互个性倾向（即使其中有好的部分），并承诺将尽快在一周内推出修复方案。自3月27日吉卜力风格大火以来，GPT-4o在 4 月 25 日也迎来了新一波的更新，重点改进其记忆存储时机的选择机制，并显著增强其在科学、技术、工程及数学（STEM）领域的问题解决能力。 OpenAI在此期间对GPT-4o的对话响应模式进行了细微调整，使其在交互中更加主动，并能更精准地引导对话达成有效结论。

4/28/2025 10:39:18 AM

大模型重复生成内容：根因剖析与优化策略

前言最近在调试大模型应用过程中，遇到了如下问题：复制大模型首次生成内容与「重新生成」两次返回的内容近乎完全相同，几乎没有体现出任何差异性。面对这种情况，造成大模型输出高度相似的原因是什么呢？我们又该采取怎样的调整策略，才能使重新生成的内容与前次存在明显差异，提升输出的多样性呢？

4/28/2025 2:22:00 AM

张张

Encoder-free无编码器多模态大模型EVEv2模型架构、训练方法浅尝

基于视觉编码器的MLLM的基本构成：MLLM通常由预训练的模态编码器、预训练的LLM和一个连接它们的模态接口三个模块组成。模态编码器(如：CLIP-ViT视觉编码器、Whisper音频编码器等)将原始信息（如图像或音频）压缩成更紧凑的表示。预训练的LLM则负责理解和推理处理过的信号。

4/28/2025 2:03:00 AM

余俊晖

o3猜照片位置深度思考6分48秒全程高能，范围精确到“这么近那么美”

ChatGPT新玩法，让程序员大佬Simon Willison直呼太反乌托邦了，像科幻突然变成现实：只需一张照片，靠带图深度思考就能猜出地理位置。图片这种玩法很简单，随手拍一张风景，没有任何明显的地标即可，也不需要复杂的提示词，只需要问“猜猜这张照片是在哪里拍的？ ”（需要o3/o4-mini的带图思考，先关闭所有记忆功能）。

4/28/2025 1:01:00 AM

MCP 服务器很危险！这里有安全使用指南！

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）MCP 这次真的火了！自从Anthropic于 2024 年 11 月推出以来，它有望成为“将 AI 助手连接到数据所在系统的新标准”。截至目前，该协议已被 OpenAI、微软和谷歌等公司迅速采用；各大供应商纷纷推出 MCP 服务器，希望在 AI 代理工作流程中不失时机。

4/27/2025 7:37:31 PM

云昭

GPT-4o偷偷升级，变身聊天鬼才！新版STEM智力飙升，生图却惨遭削弱？

OpenAI又默默地更新了模型。前一天，奥特曼发文称更新后的GPT-4o，在智力和个性方面有了很大的提升。图片在更新公告中，GPT-4o还优化了保存记忆的时间，增强了STEM领域问题解决能力。

4/27/2025 3:40:02 PM

新智元

突发！Anthropic对逆向工程者提下架通知，引开发者强烈不满

编辑｜云昭大洋彼岸，两款“代理”编码工具在开发者中的口碑突然发生了逆转！众所周知，近期OpenAI的Codex CLI和Anthropic 的Claude Code正在激烈竞争，风头皆盛。不过由于后者长期主打开发赛道，所以Claude在开发者的口碑一直很好。

4/27/2025 9:26:08 AM

云昭

美国政府「AI行动计划」万言书发布！ OpenAI与Anthropic呼吁联手封锁中国AI

AI战打到现在，下一步怎么走？ 4月25日，美国网络与信息技术研究与发展（NITRD）公开了美国各界就「AI行动计划」提交的全部书面意见。网站链接：，在现在这届政府是行不通了，现在，特朗普政府需要一个全新的AI行动计划，继续保持美国的AI领先地位。

4/27/2025 9:17:00 AM

新智元

OpenAI、谷歌等一线大模型科学家公开课，斯坦福CS 25春季上新！

在斯坦福，有一门专门讲 Transformer 的课程，名叫 CS 25。这门课曾经邀请过 Geoffrey Hinton、Andrej Karpathy 以及 OpenAI 的 Hyung Won Chung、Jason Wei 等一线大模型研究科学家担任讲师，在 AI 社区引起广泛关注。最近，这门课又上新了。

4/27/2025 8:40:00 AM

机器之心

一日一技：如何快速生成大模型工具调用的JSON Schema

在使用大模型的工具调用时，我们需要编写JSON Schema，例如下图的tools字段的值：图片这个Schema写起来非常麻烦，括号太多了，看着眼花。不信你肉眼看看，你需要几秒钟才能分清楚type: "object"跟哪个字段在同一层级？这个Schema有没有什么办法自动生成呢？

4/27/2025 7:57:50 AM

kingname

如何用DeepSeek+Cursor加速开发微信小程序（实战级指南）

一、工具链核弹级组合1. 双AI引擎配置复制技术协同原理：• Cursor：实时代码生成/缺陷修复（相当于AI程序员）• DeepSeek：业务逻辑设计/架构优化（相当于CTO）2. 环境闪电部署复制二、小程序开发加速流水线1.

4/27/2025 2:25:00 AM

架构师秋天

大模型应用系列：两万字解读MCP

MCP通过建立统一的工具连接规范，为Agent开发提供了标准化接入框架。该协议不仅简化了Agent与多样化系统的集成过程，还显著扩展了Agent的任务处理能力，使开发者能够更高效地构建具备复杂功能的智能体，实现从基础查询到业务决策的多层次应用。那么，如何进一步理解MCP呢？

4/27/2025 2:22:00 AM

曹洪伟

OpenAI 可能刚刚终结了 Claude

OpenAI 最近简直是在疯狂输出。就在这短短一周，他们一口气推出了三款全新模型、开源了一款代码工具、大幅降价，甚至还准备以30亿美元收购一款 IDE。为什么这么急？

4/27/2025 12:00:25 AM

前端小智

OpenAI研究员绿卡被拒！GPT-4.5幕后科学家流浪温哥华，美国AI圈炸锅

大数据文摘出品又刷到OpenAI相关新闻，本来以为是模型升级或者什么AI炫技，结果这次主角不是GPT-4.5，也不是神秘的GPT-5，而是一个让人有点无力的现实：OpenAI核心AI研究员Kai Chen，绿卡申请被拒，即将被迫离开美国。说实话，这种新闻在今天的AI圈子里，居然比模型benchmark还......。绿卡被拒：美国AI“人才引擎”熄火？

4/27/2025 12:00:01 AM

文摘菌

太争气了！百度的底气，李彦宏的决心：3万卡国产自研集群；一口气九个重磅发布，全方位支持MCP，百度在大模型应用时代的出招与押注

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）4月25日，一年一度的百度开发者大会会场如约到来，这是中国国内首家AI巨头在后DeepSeek时代的全新产品的公开亮相。进入2025以后，李彦宏带领下的百度正在如何思考新的AI应用形态？百度在AI应用爆发时代都做了哪些准备？

4/25/2025 1:51:49 PM

云昭

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能 DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟 ChatGPT 语音功能升级，实时翻译对话更自然流畅肝了30小时，Flux Kontext是我用过最稳、最能干活的AI图像模型！谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊