理论

LLM能理解数学吗？最新研究揭露大模型数学推理的致命缺陷

你有没有想过，那些在聊天中侃侃而谈的AI大模型，遇到数学题时会是什么样子？就像一个平时很会聊天的朋友，突然被问到复杂的数学问题时支支吾吾的样子。最近有研究团队专门研究了这个问题，结果发现了一些让人意外的真相。

5/27/2025 1:27:00 AM

无影寺

拆解OpenAI最大对手的杀手锏：为什么会是MCP？

坦白说，很多人曾与a16z的观察者持相同观点：GPT Wrapper凭借其优雅的抽象层设计，理应成为智能体通信协议的事实标准。但MCP的逆袭轨迹颠覆了所有预测——这个最初仅为Claude Desktop打造隐私优先本地化集成的协议，竟在短短三个月内完成了从边缘工具到生态基石的跃迁。这验证了网络效应铁律：协议价值永远锚定在已有生态密度。

5/27/2025 1:25:00 AM

曹洪伟

RAG系列：问题优化 - 意图识别&同义改写&多视角分解&补充上下文

在实际业务场景中，知识库不会只有单一领域的知识，可能会存在多个领域的知识，如果对用户问题不提前做领域区分，在对基于距离的向量数据库进行检索时，可能会检索出很多与用户问题不属于同一个领域的文档片段，这样的上下文会存在较多的噪音或者不准确的信息，从而影响最终的回答效果。另一方面知识库中涵盖的知识表达形式也是有限的，但用户的提问方式却是千人千面的，用户遣词造句的方式以及描述问题的角度可能会与向量数据库中存储的文档片段存在差异，这就可能导致用户问题和知识库之间不能很好匹配，从而降低检索效果。为了解决此问题，我们可以对用户问题进行查询增强，比如对用户问题进行意图识别、同义改写、多视角分解以及补充上下文，通过这几个查询增强方式来更好地匹配知识库中的文档片段，提升检索效果和回答效果。

5/27/2025 12:40:00 AM

燃哥讲AI

基于图的 RAG 方法总结（GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG）

在自然语言处理领域，检索增强生成（RAG）技术通过结合外部知识库与语言模型，显著提升了模型在知识密集型任务中的表现。近年来，基于图结构的 RAG 方法成为研究热点，通过引入知识图谱的实体关系建模能力，有效解决了传统 RAG 在多跳推理、长文本理解和全局语义捕捉中的局限性。本文详细分析五种代表性方法：GraphRAG、GraphReader、LightRAG、HippoRAG和KAG ，从实现细节、优缺点及适用场景展开对比。

5/27/2025 12:15:00 AM

Goldma

字节跳动 AdaCoT：基于强化学习的自适应推理触发方法（万字）

大家好，我是肆〇柒。在当下，大型语言模型（LLM）凭借其强大的语言理解和生成能力，在众多领域展现出了巨大的潜力。然而，尽管 LLM 在处理常规任务时表现出色，但在面对复杂推理任务时，却常常暴露出明显的短板。

5/26/2025 5:16:51 PM

肆零柒

字节开源Dolphin，高精度文档图像解析大模型，创新先分析后解析新范式

在数字时代，从扫描文档、图片等非结构化数据中高效、准确地提取结构化信息，是人工智能领域长期面临的挑战。无论是复杂的表格、交织的文本段落，还是难以识别的数学公式，都对文档解析技术提出了严苛要求。传统的解决方案往往依赖于多个专业模型的串联，不仅集成成本高昂，还容易在处理过程中累积误差。

5/26/2025 4:46:38 PM

贝塔街的万事屋

比甄嬛还狠！奥特曼「千面人设」被揭穿，MIT华人记者7年曝黑幕

OpenAI的「宫斗」往事，还有大瓜！因为曝料实在太过惊人，奥特曼在相关书籍正式出版之前，否认三连，撇清关系。但曝料人Karen Hao毕业于MIT，曝料过多家美国科技巨头的「黑幕」，因新闻报道获得多个奖项。

5/26/2025 9:07:00 AM

ChatGPT引爆教育革命，学习效果暴涨86.7%！

现在的学生，已经离不开各种AIGC工具了，不论是写作业，还是生成笔记，或者通过阅读AI生成的摘要来读文献。面对这些离不开AI的学生，老师和家长都开始担忧了，这样下去，孩子会不会越变越笨啊。然而，最近一项发表在Nature子刊的研究，基于对59项研究对汇总（元分析）指出，ChatGPT的使用对提高K12（中小学生）的学习表现有显著的正向影响，对于培养学生解决复杂问题的能力也有所帮助。

5/26/2025 8:43:00 AM

如何使用Google Gemini模型完成计算机视觉任务？

译者 | 李睿审校 | 重楼自从人工智能聊天机器人兴起以来，Google Gemini脱颖而出，已经成为推动智能系统进化的主要参与者之一。除了强大的会话能力之外，Gemini还释放了计算机视觉实际应用的潜力，让它们能够看到、解释和描述周围的世界。本文将逐步讲解如何利用Google Gemini完成计算机视觉任务，其中包括如何设置环境，发送带有指令的图像以及解释模型的输出以进行对象检测、字幕生成和OCR，还将探讨数据注释工具（例如YOLO中使用的工具），为自定义训练场景提供上下文。

5/26/2025 8:36:25 AM

李睿

OpenAI没做到，DeepSeek搞定了！开源引爆推理革命

DeepSeek-R1引爆了LLM推理革命。至今，过去一百多天了，引发了持续复制DeepSeek-R1的热潮。 DeepSeek-R1的秘籍在于强化学习微调算法：群体相对策略优化（Group Relative Policy Optimization，GRPO）。

5/26/2025 4:00:00 AM

新智元

AI搜索大战爆发，苹果要"斩断"谷歌200亿美元生命线？

又有大瓜可以吃了！刚刚，苹果公司放了一颗重磅炸弹，让谷歌瞬间慌了神！ 5月份，苹果服务高级副总裁埃迪·库透露，苹果正在积极探索将AI搜索引擎集成到Safari浏览器中，甚至明确表示，OpenAI、Perplexity AI和Anthropic的Claude AI等工具，最终可能会取代谷歌搜索。

5/26/2025 1:30:00 AM

小李哥

AI实战派：解密DeepSeek企业级项目！AI不是炫技，而是回归需求的必然答案

嘉宾 | 陈亮、张云波主持人 | 薛彦泽撰稿 | 李美涵在AI创业的浪潮里，最迷人的地方莫过于人人都知道这里是风口，却仍然能够各自找到属于自己的机会点。在众多试图乘上AI风口的创业者中，亨宝科技的CEO张云波和AI创智坊的主理人陈亮无疑是特别的存在。张云波早年投身于鸿蒙生态，今年年初就敏锐捕捉到DeepSeek大模型兴起的契机，迅速将注意力投向AI领域的应用开发。

5/23/2025 6:28:04 PM

李美涵

大语言模型究竟为何会在对话中“迷失”

译者 | 张哲刚审校 | 重楼微软研究院和 Salesforce的一篇新论文发现，即使是功能最强大的大型语言模型，如果面临的指令是分阶段而非一次性给出，往往也会表现不佳。该文作者运行六项任务进行研究，最终发现：当提示被拆分成多个回合时，大语言模型的性能平均下降了39%。单轮次对话（左图）可获得最佳结果，但对最终用户而言显得并不自然。

5/23/2025 8:18:52 AM

张哲刚

赌赢就是iPhone2.0，赌输下一个AI Pin！OpenAI史上最大收购案：65亿刀，苹果旧将集结！网友：真赌徒，钱少但人疯

编辑 | 云昭用“疯狂买买买”来形容5月的OpenAI，再不为过！要是有“AI初创公司求并购直播间”，OpenAI 妥妥的拿下“榜一大哥”！先是30亿美金拿下AI编码市场老二Windsurf，一度被外界认为是OpenAI最大的收购案，紧接着又开始为自己的产品部门花重金聘任了新的 CEO，Simo。

5/22/2025 5:09:15 PM

云昭

24B模型编程超DeepSeek全家桶，32G内存苹果电脑就能跑，专门针对真实GitHub Issue训练

资讯热榜

印度创新试点：AI 聊天机器人助力电子商务购物新方式两部门联合发布《政务领域人工智能大模型部署应用指引》大力推动AI技术应用软银贷款50亿美元助力AI投资，孙正义押注未来科技！ OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型 OpenAI Sora 引爆 App Store“山寨潮”:30万次下载!苹果审核机制遭质疑马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升前DeepMind大神创业一年估值飙至80亿美元：Reflection AI要做美国版DeepSeek Sora2公布提示词指南！直接抄作业能玩一整天！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画数据机器人大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文代码 LLM 算法 Stable Diffusion 芯片腾讯苹果 AI for Science Claude Agent 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具 RAG 大语言模型 Sora 华为 GPU 计算具身智能 AI设计字节跳动搜索大型语言模型 AGI 场景深度学习视频生成架构预测视觉 DeepMind 伟达 Transformer 编程神器推荐 AI模型亚马逊 MCP

理论

LLM能理解数学吗？最新研究揭露大模型数学推理的致命缺陷

拆解OpenAI最大对手的杀手锏：为什么会是MCP？

RAG系列：问题优化 - 意图识别&同义改写&多视角分解&补充上下文

基于图的 RAG 方法总结（GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG）

字节跳动 AdaCoT：基于强化学习的自适应推理触发方法（万字）

字节开源Dolphin，高精度文档图像解析大模型，创新先分析后解析新范式

比甄嬛还狠！奥特曼「千面人设」被揭穿，MIT华人记者7年曝黑幕

ChatGPT引爆教育革命，学习效果暴涨86.7%！

如何使用Google Gemini模型完成计算机视觉任务？

OpenAI没做到，DeepSeek搞定了！开源引爆推理革命

AI搜索大战爆发，苹果要"斩断"谷歌200亿美元生命线？

AI实战派：解密DeepSeek企业级项目！AI不是炫技，而是回归需求的必然答案

大语言模型究竟为何会在对话中“迷失”

赌赢就是iPhone2.0，赌输下一个AI Pin！OpenAI史上最大收购案：65亿刀，苹果旧将集结！网友：真赌徒，钱少但人疯

24B模型编程超DeepSeek全家桶，32G内存苹果电脑就能跑，专门针对真实GitHub Issue训练

AI也能当情感大师？腾讯发布最新AI社交智能榜单，最新版GPT-4o拿下第一

突发！OpenAI以64亿美元，收购iPhone设计师公司io

OpenAI放大招！核心API支持MCP，一夜改变智能体开发

理论

LLM能理解数学吗？最新研究揭露大模型数学推理的致命缺陷

拆解OpenAI最大对手的杀手锏：为什么会是MCP？

RAG系列：问题优化 - 意图识别&同义改写&多视角分解&补充上下文

基于图的 RAG 方法总结（GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG）

字节跳动 AdaCoT：基于强化学习的自适应推理触发方法（万字）

字节开源Dolphin，高精度文档图像解析大模型，创新先分析后解析新范式

比甄嬛还狠！奥特曼「千面人设」被揭穿，MIT华人记者7年曝黑幕

ChatGPT引爆教育革命，学习效果暴涨86.7%！

如何使用Google Gemini模型完成计算机视觉任务？

OpenAI没做到，DeepSeek搞定了！开源引爆推理革命

AI搜索大战爆发，苹果要"斩断"谷歌200亿美元生命线？

AI实战派：解密DeepSeek企业级项目！AI不是炫技，而是回归需求的必然答案

大语言模型究竟为何会在对话中“迷失”​

赌赢就是iPhone2.0，赌输下一个AI Pin！OpenAI史上最大收购案：65亿刀，苹果旧将集结！网友：真赌徒，钱少但人疯

24B模型编程超DeepSeek全家桶，32G内存苹果电脑就能跑，专门针对真实GitHub Issue训练

AI也能当情感大师？腾讯发布最新AI社交智能榜单，最新版GPT-4o拿下第一

突发！OpenAI以64亿美元，收购iPhone设计师公司io

OpenAI放大招！核心API支持MCP，一夜改变智能体开发

大语言模型究竟为何会在对话中“迷失”