理论

o3崛起，但推理模型离「撞墙」只剩一年？

最多一年，推理模型就会撞上训练算力的「天花板」。 OpenAI的o3这样的推理模型，诞生还不到一年，能力已经突飞猛进。 OpenAI的研究人员非常乐观地认为，这种趋势会持续下去。

6/3/2025 8:26:00 AM

为什么非要做Agent？我用传统方法也能实现啊！

"我硬编码10分钟就能搞定的功能，你用Agent折腾半天还不稳定，图啥？ " 技术群里，老王又开始质疑我们的Agent项目了。作为一个写了15年代码的资深工程师，他的话很有代表性。

6/3/2025 6:39:54 AM

大数据AI智能圈

AI大模型踩过的坑，每一个都价值千万

看着你们公司几十台服务器嗡嗡作响，显卡温度报警声此起彼伏，老板又在催问"大模型什么时候能上线？ " 这个熟悉的场景，是不是让你想起了那句话——"理想很丰满，现实很骨感"。训练一个千亿参数的大模型，好比盖一栋摩天大楼。

6/3/2025 6:30:05 AM

大数据AI智能圈

基于Gemini与Qdrant构建生产级RAG管道：设计指南与代码实践

一、RAG技术的核心价值与应用场景在人工智能领域，检索增强生成（Retrieval-Augmented Generation, RAG）正成为解决大语言模型（LLM）知识更新滞后、生成内容不可追溯等问题的关键技术。传统的微调（Fine-Tuning）方法将知识固化在模型参数中，难以应对动态领域的快速变化；而RAG通过将检索与生成解耦，实现了知识的实时更新与可追溯性，尤其适用于政策频繁变动、对准确性要求极高的场景，如医疗、法律和航空管理。本文以构建机场智能助理为例，结合Google的Gemini多模态模型与Qdrant向量数据库，详细阐述如何设计并实现一个高可靠、可扩展的生产级RAG管道。

6/3/2025 2:55:00 AM

大模型之路

阿里发布 QwenLong-L1 超长文本杀器！已开源、支持 120k 长上下文、具备“翻书回溯”能力

业界普遍认为AI上下文越长越好，但这存在一个核心矛盾：模型能“吞下”海量信息，却难以真正“消化”。面对长文，它们会忘记要点、无法深入推理，这已成为一大瓶颈。例如，AI 能记住第1页的内容，同时理解第100页的观点，并将两者联系起来进行推理吗？

6/3/2025 12:00:09 AM

专治AI生图「人脸崩坏」，8倍速碾压GPT！新版FLUX.1多方位刷新SOTA

用AI生成&编辑图片时，想生成一套完整故事模板，结果主角「变脸」比翻书还快，这可怎么办？别慌，全新图像模型FLUX.1 Kontext来了！支持上下文内图像生成，可以同时使用文本和图像进行提示，并能够无缝提取和修改视觉概念，从而生成新的、连贯的图像。

5/30/2025 2:28:10 PM

新智元

博士级AI智能体写的论文，首次登上顶会ACL！人类作者只是监工

有个叫Zochi的AI系统写了一篇研究论文，并且被顶级学术会议ACL 2025的主会场接受了！ ACL是自然语言处理（NLP）领域里最顶尖的会议之一。 Zochi是Intology AI开发的首个博士级智能体，就像一个从头到尾完成科学研究「AI科学家」。

5/30/2025 9:15:00 AM

AI仅凭“自信”学会推理，浙大校友复刻DeepSeek长思维链涌现，强化学习无需外部奖励信号

复刻DeepSeek-R1的长思维链推理，大模型强化学习新范式RLIF成热门话题。 UC Berkeley团队共同一作Xuandong Zhao把这项成果称为：大模型无需接触真实答案，仅通过优化自己的信心，就能学会复杂推理。具体来说，新方法完全不需要外部奖励信号或标注数据，只需使用模型自身的置信程度作为内在奖励信号。

5/30/2025 9:05:00 AM

DeepSeek免费超越GPT-4？

DeepSeek 最新发布了 R1-0528 版本，这次更新的最大亮点是"深度思考"能力大幅提升。很简单：进入 DeepSeek 官网、APP 或小程序，在对话界面开启"深度思考"功能即可。图片API 接口也同步更新，调用方式保持不变。

5/30/2025 7:40:56 AM

程序员NEO

DeepSeek-R1小升级！体验后有被惊艳到

今年1月，DeepSeek-R1横空出世，凭借在性能和成本方面展现出的巨大优势，迅速成为全球人工智能(AI)领域瞩目的焦点。时隔四个月，这款大模型迎来了小升级。 5月28日，DeepSeek正式发布了R1的最新版本——DeepSeek-R1-0528。

5/30/2025 6:57:53 AM

万人在看，用Deepseek根据需求定制化写文档并导出，你一定用的上！

需求分析前几天工程立项，主要批量写功能点用于新一年的工程预算。但是工作量大，共计20000 行左右,要求3天之内完成。图片文档主要结构及表头信息如下（提供模版部分字段）图片由于工作量太大，手工敲需要消耗大量的人力，于是借助deepseek大模型实现，让AI帮忙干活。

5/30/2025 2:10:00 AM

微微一笑

一文教你玩转 RAG 大模型应用开发

Part.1.RAG这么火，你会用吗？自从大模型技术走向市场以来，“幻觉”现象总是对用户造成困扰，而RAG（Retrieval-Augmented Generation，检索增强生成）技术正在成为解决这一难题的利器。国内众多科技大厂在实践RAG技术时都取得了阶段性的成果。

5/30/2025 1:00:00 AM

三笠

全面解读：新版R1低调升级！编程强到起飞直追o3-high，支持30分钟以上长思考，推理、写作都进化了！

出品 | 51CTO技术栈（微信号：blog51cto）DeepSeek 于 5 月 28 日晚间在微信平台低调宣布——R1 模型完成“小版本试升级”！图片这波有多低调呢？ DeepSeek 又是“0 宣发”出手，连一句英文公告都没有。

5/29/2025 1:05:32 PM

伊风

AI 大脑如何被 “套路”?— 揭秘大模型提示词攻防

在人工智能技术爆发式发展的当下，大模型（Large Language Models, 以下简称LLM）凭借其强大的自然语言处理能力，广泛渗透于智能助手、内容创作、代码生成等诸多关键领域，深度重塑着人们的生活与工作范式。然而，随着 LLM 应用场景的持续拓展与深化，一系列严峻的安全挑战接踵而至，其中提示词攻击已逐渐演变为威胁人工智能系统安全的核心隐患，亟待深入剖析与应对。一、提示词攻击定义与影响提示词攻击是指攻击者精心构思并输入恶意构造的文本内容，意图干扰和操纵LLM的内部运行逻辑，使其偏离既定的正常行为模式。

5/29/2025 10:32:32 AM

大模型应用防火墙

模型吞噬代码，Agent重构世界：当AI Agent与模型协同进化

大家好，我是肆〇柒。 AI 圈的进化速度之快，已是不争的事实。去年，MCP（模型上下文协议）发布，随后 AI Coding 赛道愈发热闹，Cursor、Cline、Devin、MGX 等产品层出不穷。

5/29/2025 9:57:38 AM

肆零柒

刚刚，新版DeepSeek-R1正式开源！直逼o3编程强到离谱，一手实测来了

就在今天凌晨，新版DeepSeek-R1正式开源了！ DeepSeek-R1-0528模型权重已上传到HuggingFace，不过模型卡暂未更新。项目地址：，DeepSeek-R1完成了超进化，编码能力强到离谱，而且思考时间更长了。

5/29/2025 9:04:51 AM

一文读懂： AI 智能体的架构原则、三高架构、存储架构的核心方案

一、为啥 AI 架构设计这么关键？如今，AI 应用那可是雨后春笋般地冒出来。 ‘从 ChatGPT 、到AI智能体应用，到每天服务上千万人的智能客服，再到处理亿级数据的推荐系统，要想让这些 AI 玩意儿在实际场景里落地生根，高可用、高性能、灵活扩展的系统架构是关键。

5/29/2025 1:10:00 AM

尼恩架构团队

Meta闪电分拆AI帝国！Llama团队一劈为二：一边狂卷AGI，一边死磕OpenAI

2025 年 5 月，据 Axios 报道，Meta 正式将其 AI 部门拆分为两个独立方向：面向消费者的AI产品团队，以及追求通用人工智能（AGI）的“AGI Foundations”基础组。过去几年，Meta在AI领域的策略始终被认为偏“研究导向”：大模型Llama的发布频率、论文产出数量、开源社区活跃度，都表现出一种“与学界赛跑”的姿态。但与此同时，用户端产品的AI体验却始终模糊——Llama虽强，却“藏”在模型库里，普通用户几乎无感。

5/28/2025 6:41:37 PM

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能 DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟 ChatGPT 语音功能升级，实时翻译对话更自然流畅肝了30小时，Flux Kontext是我用过最稳、最能干活的AI图像模型！谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊

理论