文章列表
DeepMind夺得IMO官方「唯一」金牌,却成为OpenAI大型社死现场
刚刚,谷歌 DeepMind 宣布,其新一代 Gemini 进阶版模型在 IMO 竞赛中正式达到金牌得主水平,成功解决了六道超高难度试题中的五道,拿下 35 分(满分 42 分),成为首个获得奥赛组委会官方认定为金牌的AI系统。 更重要的是,该系统首次证明人工智能无需依赖专业编程语言,仅通过自然语言理解即可攻克复杂数学难题。 谷歌 DeepMind 首席执行官哈萨比斯在社交媒体平台 X 上强调:这是官方结果!
7/22/2025 1:22:00 PM
机器之心
Cursor 新定价方案引发用户强烈不满
最近,Cursor 的开发商 nysphere 推出了每月 200 美元的高端订阅计划,但这不仅仅是新增了昂贵套餐,还在悄悄削弱了现有的 Pro 计划。 曾经承诺的 500 次请求保障,如今被标榜为“无限请求”却伴随着随意的限流规则。 据 Cursor 用户反馈,新推出的 “Ultra” 计划提供了比 20 美元的 Pro 方案高 20 倍的 AI 模型使用额度,但 Pro 用户的体验却大打折扣,甚至被描述为“完全无法生成内容”。
7/22/2025 12:58:26 PM
前端小智
OpenAI 亲自下场!全能ChatGPT Agent发布,Manus们危险了
昨天,OpenAI在凌晨正式推出了全新的“ChatGPT Agent”,这一产品整合了此前的Operator和DeepResearch两大系统。 图片Operator善于网页互动,能像人一样浏览网站、点击按钮、填写表单,但它读文章太慢,需要慢慢滚动。 DeepResearch擅长信息挖掘,能从全网抓取材料、整合分析并生成研究报告,但它基本不会和网页互动。
7/22/2025 11:56:26 AM
35分斩金!Gemini 成首个 IMO 认证 AI 金牌 ,OpenAI 未获许可强蹭 IMO 热度
Gemini Deep Think正式跨入国际数学奥林匹克(IMO)金牌行列。 谷歌DeepMind宣布,其搭载Deep Think模式的先进版本Gemini,在2025年IMO中斩获35分,成功达到了金牌标准。 这一成绩来自对6道题中的5道完美解答,评分标准、比赛时间、参赛流程与人类选手完全一致。
7/22/2025 11:53:05 AM
中国AI新王者?Kimi K2正在突破Claude的编程壁垒
一个明显的趋势是,中国的开源AI模型正在悄悄改写全球AI竞争格局。 继DeepSeek引发硅谷震动后,Moonshot AI刚刚发布的Kimi K2,再次证明了这个判断。 这次真的不一样了。
7/22/2025 11:38:38 AM
阿丸笔记
OpenAI:ChatGPT 平均每天要收到用户 25 亿条提示词
AI在线 7 月 22 日消息,OpenAI 今日向美媒 Axios 透露,ChatGPT 平均每天要收到用户发送的 25 亿条提示词(Prompts),其中 3.3 亿条来自美国用户。 作为对比,谷歌母公司 Alphabet 没有公开每日搜索数据,但 Axios 援引匿名消息源显示,谷歌每年接收约 5 万亿次查询,平均每日大约有 140 亿次搜索。 独立研究机构 NP Digital 的 SEO Neil Patel 估计,所有用户在谷歌的日均搜索次数大约是 137 亿次,而 SparkToro 和 Datos 则认为这一数字可能达到 164 亿次。
7/22/2025 10:41:19 AM
潞源(实习)
并行革命,32倍吞吐量跃升!英伟达Helix架构突破百万Token推理瓶颈
想象一个使用大模型的任务,需要一次处理百万字符的文档,例如从百科全书中获取信息,或是分析数百页的法律卷宗,异或追踪持续数月的对话记录,都需要越来越长的上下文。 而大模型生成的每个词都需要扫描存储在所谓的KV缓存中存储的过去标记。 反复读取这个缓存会消耗GPU内存带宽。
7/22/2025 10:40:00 AM
AI时代设计师的未来在哪里?阿里D20峰会揭秘这6个机遇方向!
大家好,我是姝斐,今年 7 月,我又如期参加了阿里巴巴举办的设计界顶级盛会-D20 全球设计院长峰会。 大会汇聚了清华大学、中国美术学院等设计顶级学府的院长、行业内做出大成果的企业高管,他们都结合实际落地项目案例一一对行业做了非常深刻的剖析分享,让我们看到了在 AI 时代,原来 AI 已经落地到如此成熟惊人的地步,AI 已经不再是一个口号,而是实实在在给我们带来了便捷与红利,下面我将分享几点本次峰会给我带来的冲击思考。 更多D20的干货:一、设计师要积极拥抱变化.
7/22/2025 8:03:51 AM
姝斐suphie
AIGC、RAG、Agent、Function Call、MCP 到底啥关系?一次讲明白!
Hello,大家好,我是 Sunday。 最近很多同学特别关注 AI 相关的领域。 但是,AI 技术发展太快了,AIGC、RAG、Agent、Function Call、MCP 等等的各种热词层出不穷的。
7/22/2025 1:55:00 AM
程序员Sunday
奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法
AI在线 7 月 21 日消息,今年年初,中国人工智能初创企业 DeepSeek 凭借其推出的 R1 模型在生成式人工智能领域崭露头角。 该模型在数学、科学和编程等多个领域超越了 OpenAI 的 o1 推理模型,且开发成本仅为 OpenAI 的一小部分。 对此,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)在接受彭博社采访时表示:“DeepSeek 团队非常有才华,做了很多很棒的事情,我认为他们没有找到比我们更高效的方法。
7/21/2025 8:24:18 PM
远洋
Anthropic 联合创始人:团队成员极具使命感,Meta 天价薪酬也挖不动
AI在线 7 月 21 日消息,在当前人工智能(AI)领域竞争日益激烈的情况下,大型科技公司纷纷向顶尖人才抛出巨额薪酬的橄榄枝。 人工智能公司 Anthropic 的联合创始人本杰明・曼恩(Benjamin Mann)在接受《Lenny's Podcast》采访时明确表示,即使是像 Meta 这样的科技巨头提供的巨额薪酬,也无法吸引他们团队成员的加入。 曼恩指出,与其他 AI 初创公司相比,Anthropic 受到人才被挖角的影响相对较小,原因在于团队成员们具有强烈的使命感,他解释道:“他们收到这些巨额薪酬的邀约后,会这样想:‘当然,我不会离开。
7/21/2025 7:28:41 PM
远洋
IMO怒斥OpenAI自封夺金,“91位评委均未参与评分”,网友:炒作无下限
OpenAI声称新模型获得IMO金牌不到24小时,剧情就出现了大反转! 多位IMO官方人士和学界大佬纷纷发声,直指OpenAI的做法“粗鲁且不恰当”。 IMO主办方要求AI公司在闭幕式一周后再公布结果,让关注的焦点留在参赛的青少年上,然而OpenAI偏偏选择在闭幕式刚结束就急不可耐地宣布了成绩。
7/21/2025 2:27:44 PM
OpenAI拿IMO金牌是火了,但惹怒大批人:抢发炒作,抢学生风头
就在上个周末,Sam Altman 大张旗鼓地宣布,OpenAI 的一款未公开实验性大语言模型在 2025 年国际数学奥林匹克竞赛(IMO)中达到了金牌水平,得分 35/42,成功跻身全球顶尖数学竞赛选手行列。 有意思的是,据报道不止 OpenAI,谷歌 DeepMind 在这次比赛中,也拿到了 IMO 金牌。 但相比 OpenAI 的高调官宣,这次谷歌显得有点低调。
7/21/2025 1:27:00 PM
机器之心
OpenAI被曝IMO金牌「造假」,陶哲轩怒揭内幕!
OpenAI夺下IMO金牌,最新大瓜又来了。 昨日,因内部审核流程,谷歌DeepMind研究员在评论区,暗讽OpenAI抢先发布测试结果。 图片原来,事情并非那么简单。
7/21/2025 11:48:54 AM
新智元
没有高质量的数据库加持,大模型只是 “空中楼阁”
2023年,ChatGPT的横空出世让全球惊叹于大模型的智能水平。 自此,国内也掀起了新一轮的大模型热潮,首先,百度发布了文心一言,紧接着,阿里、腾讯、华为、京东等大厂先后入局,更值得一提的是,大模型热度的居高不下,也吸引了不少创业公司的加入,零一万物、Kimi、面壁智能....随着两年时间的发展,如今大模型的智能水平早已不可同日而语,从在自然语言处理领域实现与人类流畅对话,到在图像视频领域精准识别各类物体,从最初简单的问答,到快速且精准地解决生活、工作、学习等在各场景中遇到的问题,大模型的表现也在不断刷新我们的认知。 然而,这些卓越表现并非凭空而来,大模型的强大背后,离不开高质量数据库的坚实支撑。
7/21/2025 11:05:04 AM
超 346 款生成式 AI 完成备案:DeepSeek 上线 20 天全球日活跃用户即突破 3000 万
AI在线 7 月 21 日消息,据央视新闻报道,中国互联网络信息中心(CNNIC)在京发布第 56 次《中国互联网络发展状况统计报告》(以下简称《报告》)。 AI在线从《报告》获悉,2025 年上半年,生成式人工智能产品实现了从技术到应用的全方位进步,产品数量迅猛增长,应用场景持续扩大。 一是我国在人工智能领域影响力显著提升。
7/21/2025 10:28:45 AM
浩渺
代码碾压一切!OpenAI神秘模型o3-alpha一夜刷屏,却遭41岁大神绝地反杀
OpenAI果然藏了一手。 昨天夜里,一个名为「o3-alpha-responses-2025-07-17」的神秘模型被爆出。 网友们疯狂测试后,得出一致结论,这个模型强得离谱。
7/21/2025 9:19:00 AM
ICML'25 |大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降
人们越来越意识到,大语言模型(LLM)里「找信息」这件事,并不是简单地翻字典,而和「写信息」的能力紧紧绑在一起。 一般认为,给模型塞入更长的上下文就能让它找得更准,不过上下文内部存在「互相干扰」,但这种现象却很少被研究。 为了看清这个问题,弗吉尼亚大学和纽约大学神经科学中心研究人员借用了心理学里的「前摄干扰」(proactive interference)概念:先出现的信息会妨碍我们回忆后来更新的内容。
7/21/2025 9:09:00 AM