AIGC宇宙 AIGC宇宙

理论

Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品

多模态大模型几何解题哪家强? 首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码均已开源。
4/28/2025 2:04:03 PM
量子位

华人博士用ChatGPT治病,比医生靠谱?OpenAI联创点赞

ChatGPT居然帮人治好了医生都搞不定的病! 华人博士@Yuchenj_UW分享了自己的神奇经历,并感叹:AI就像超能力。 我第一次真正相信AI可能会取代医生。
4/28/2025 2:02:08 PM
新智元

轮到“OpenAI帮”上场了!15家由前员工创办的明星创业公司

编辑 | 云昭曾经硅谷有“PayPal帮”,现在轮到“OpenAI帮”登场了。 作为ChatGPT背后的公司,OpenAI无疑是当前AI领域最炙手可热的玩家。 过去两年,OpenIAI的发展可以用“独占鳌头”来形容,估值迅速飙升至3000亿美元,当然公司的迅速发展往往伴随着剧烈的人员动荡。
4/28/2025 11:57:12 AM
云昭

奥特曼自曝:改版后的GPT-4o谄媚过头了,系情绪价值拉满后的结果,实测:大厂薅开源羊毛有错吗?没错!能被薅说明项目有价值

2个多小时前,OpenAI CEO 奥特曼发推表示:最新版 GPT-4o 在最近几次更新后出现了“过度谄媚”的交互个性倾向(即使其中有好的部分),并承诺将尽快在一周内推出修复方案。 自3月27日吉卜力风格大火以来,GPT-4o在 4 月 25 日也迎来了新一波的更新,重点改进其记忆存储时机的选择机制,并显著增强其在科学、技术、工程及数学(STEM)领域的问题解决能力。 OpenAI在此期间对GPT-4o的对话响应模式进行了细微调整,使其在交互中更加主动,并能更精准地引导对话达成有效结论。
4/28/2025 10:39:18 AM

大模型重复生成内容:根因剖析与优化策略

前言最近在调试大模型应用过程中,遇到了如下问题:复制大模型首次生成内容与「重新生成」两次返回的内容近乎完全相同,几乎没有体现出任何差异性。 面对这种情况,造成大模型输出高度相似的原因是什么呢? 我们又该采取怎样的调整策略,才能使重新生成的内容与前次存在明显差异,提升输出的多样性呢?
4/28/2025 2:22:00 AM
张张

Encoder-free无编码器多模态大模型EVEv2模型架构、训练方法浅尝

基于视觉编码器的MLLM的基本构成:MLLM通常由预训练的模态编码器、预训练的LLM和一个连接它们的模态接口三个模块组成。 模态编码器(如:CLIP-ViT视觉编码器、Whisper音频编码器等)将原始信息(如图像或音频)压缩成更紧凑的表示。 预训练的LLM则负责理解和推理处理过的信号。
4/28/2025 2:03:00 AM
余俊晖

o3猜照片位置深度思考6分48秒全程高能,范围精确到“这么近那么美”

ChatGPT新玩法,让程序员大佬Simon Willison直呼太反乌托邦了,像科幻突然变成现实:只需一张照片,靠带图深度思考就能猜出地理位置。 图片这种玩法很简单,随手拍一张风景,没有任何明显的地标即可,也不需要复杂的提示词,只需要问“猜猜这张照片是在哪里拍的? ”(需要o3/o4-mini的带图思考,先关闭所有记忆功能)。
4/28/2025 1:01:00 AM

MCP 服务器很危险!这里有安全使用指南!

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP 这次真的火了! 自从Anthropic于 2024 年 11 月推出以来,它有望成为“将 AI 助手连接到数据所在系统的新标准”。 截至目前,该协议已被 OpenAI、微软和谷歌等公司迅速采用;各大供应商纷纷推出 MCP 服务器,希望在 AI 代理工作流程中不失时机。
4/27/2025 7:37:31 PM
云昭

GPT-4o偷偷升级,变身聊天鬼才!新版STEM智力飙升,生图却惨遭削弱?

OpenAI又默默地更新了模型。 前一天,奥特曼发文称更新后的GPT-4o,在智力和个性方面有了很大的提升。 图片在更新公告中,GPT-4o还优化了保存记忆的时间,增强了STEM领域问题解决能力。
4/27/2025 3:40:02 PM
新智元

突发!Anthropic对逆向工程者提下架通知,引开发者强烈不满

编辑 | 云昭大洋彼岸,两款“代理”编码工具在开发者中的口碑突然发生了逆转! 众所周知,近期OpenAI的Codex CLI和Anthropic 的Claude Code正在激烈竞争,风头皆盛。 不过由于后者长期主打开发赛道,所以Claude在开发者的口碑一直很好。
4/27/2025 9:26:08 AM
云昭

美国政府「AI行动计划」万言书发布! OpenAI与Anthropic呼吁联手封锁中国AI

AI战打到现在,下一步怎么走? 4月25日,美国网络与信息技术研究与发展(NITRD)公开了美国各界就「AI行动计划」提交的全部书面意见。 网站链接:,在现在这届政府是行不通了,现在,特朗普政府需要一个全新的AI行动计划,继续保持美国的AI领先地位。
4/27/2025 9:17:00 AM
新智元

OpenAI、谷歌等一线大模型科学家公开课,斯坦福CS 25春季上新!

在斯坦福,有一门专门讲 Transformer 的课程,名叫 CS 25。 这门课曾经邀请过 Geoffrey Hinton、Andrej Karpathy 以及 OpenAI 的 Hyung Won Chung、Jason Wei 等一线大模型研究科学家担任讲师,在 AI 社区引起广泛关注。 最近,这门课又上新了。
4/27/2025 8:40:00 AM
机器之心

一日一技:如何快速生成大模型工具调用的JSON Schema

在使用大模型的工具调用时,我们需要编写JSON Schema,例如下图的tools字段的值:图片这个Schema写起来非常麻烦,括号太多了,看着眼花。 不信你肉眼看看,你需要几秒钟才能分清楚type: "object"跟哪个字段在同一层级? 这个Schema有没有什么办法自动生成呢?
4/27/2025 7:57:50 AM
kingname

如何用DeepSeek+Cursor加速开发微信小程序(实战级指南)

一、工具链核弹级组合1. 双AI引擎配置复制技术协同原理:• Cursor:实时代码生成/缺陷修复(相当于AI程序员)• DeepSeek:业务逻辑设计/架构优化(相当于CTO)2. 环境闪电部署复制二、小程序开发加速流水线1.
4/27/2025 2:25:00 AM
架构师秋天

大模型应用系列:两万字解读MCP

MCP通过建立统一的工具连接规范,为Agent开发提供了标准化接入框架。 该协议不仅简化了Agent与多样化系统的集成过程,还显著扩展了Agent的任务处理能力,使开发者能够更高效地构建具备复杂功能的智能体,实现从基础查询到业务决策的多层次应用。 那么,如何进一步理解MCP呢?
4/27/2025 2:22:00 AM
曹洪伟

OpenAI 可能刚刚终结了 Claude

OpenAI 最近简直是在疯狂输出。 就在这短短一周,他们一口气推出了三款全新模型、开源了一款代码工具、大幅降价,甚至还准备以30亿美元收购一款 IDE。 为什么这么急?
4/27/2025 12:00:25 AM
前端小智

OpenAI研究员绿卡被拒!GPT-4.5幕后科学家流浪温哥华,美国AI圈炸锅

大数据文摘出品又刷到OpenAI相关新闻,本来以为是模型升级或者什么AI炫技,结果这次主角不是GPT-4.5,也不是神秘的GPT-5,而是一个让人有点无力的现实:OpenAI核心AI研究员Kai Chen,绿卡申请被拒,即将被迫离开美国。 说实话,这种新闻在今天的AI圈子里,居然比模型benchmark还......。 绿卡被拒:美国AI“人才引擎”熄火?
4/27/2025 12:00:01 AM
文摘菌

太争气了!百度的底气,李彦宏的决心:3万卡国产自研集群;一口气九个重磅发布,全方位支持MCP,百度在大模型应用时代的出招与押注

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)4月25日,一年一度的百度开发者大会会场如约到来,这是中国国内首家AI巨头在后DeepSeek时代的全新产品的公开亮相。 进入2025以后,李彦宏带领下的百度正在如何思考新的AI应用形态? 百度在AI应用爆发时代都做了哪些准备?
4/25/2025 1:51:49 PM
云昭