系统

大模型推理学习新范式！ExGRPO框架：从盲目刷题到聪明复盘

大模型在强化学习过程中，终于知道什么经验更宝贵了！来自上海人工智能实验室、澳门大学、南京大学和香港中文大学的研究团队，最近提出了一套经验管理和学习框架ExGRPO——通过科学地识别、存储、筛选和学习有价值的经验，让大模型在优化推理能力的道路上，走得更稳、更快、更远。实验结果显示，与传统的在线策略RLVR（基于可验证奖励的强化学习）方法相比，ExGRPO在不同基准上均带来了一定程度的性能提升。

10/23/2025 2:05:35 PM

lya震撼发声！OpenAI前主管亲证：AGI已觉醒，人类还在装睡

「这真正史上最棒的一天」！ Ilya的一句话，又引爆了全网。图片一时间，网友们纷纷猜测，难道AGI真的在内部实现了吗？

10/15/2025 9:36:52 AM

新智元

RAG系统的“聪明药”：如何用反馈回路让你的AI越用越聪明？

大家好，我是你们的AI技术侃侃而谈小能手。今天我们来聊聊RAG（Retrieval-Augmented Generation，检索增强生成）系统的进化之路——如何让它像喝了聪明药一样，越用越聪明，越聊越懂你。你是不是也有这样的体验？

7/1/2025 8:37:13 AM

许泽宇

靠C#年入百万：开发DeepSeek爆文生成系统，日更50篇的源码解剖

在内容创作领域，流量就是财富密码。如何高效产出吸引眼球的爆文，成为众多创作者和内容机构的核心诉求。借助当下先进的AI技术，结合强大的C#开发能力，一套能够日更50篇爆文的DeepSeek爆文生成系统应运而生，为从业者打开了年入百万的大门。

3/31/2025 12:22:25 AM

conan

DeepSeek突袭公布成本利润率：545%

五连开源后，DeepSeek还有One More Thing！就在刚刚，DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。重点包括，优化吞吐量和延迟的方法：跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计：每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细节，一起来看官方原文↓更大的吞吐，更低的延迟DeepSeek-V3/R1推理系统的优化目标是：更大的吞吐，更低的延迟。

3/3/2025 8:21:00 AM

量子位

生成式 AI“上车”，大众高尔夫、途观、帕萨特等海外版车型现已支持 ChatGPT

当地时间 21 日，大众汽车宣布配备新一代信息娱乐系统的车型现已加入对 ChatGPT 的支持。在欧洲地区，引入 ChatGPT 的车型包括纯电动 ID.系列、新款高尔夫、新款途观、新款帕萨特，用户可通过车辆内置 IDA 语音助手访问 ChatGPT。据介绍，AI“上车”之后带来的体验远远超出以往，用户可以要求汽车直接读出搜索结果，或使用自然语言与汽车进行交互。例如，接入 ChatGPT 的车机可以提供旅游景点信息、报道过去的足球比赛或帮助解决数学问题。驾驶员只需用自然语言与助手交谈，无需将视线从道路上移开。与现有

6/22/2024 12:05:43 PM

清源

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程 Gemini 3重磅发布，我连夜整理了3大核心亮点与5种免费用方法！如何去除AI绘画的油腻感？这2个实用方法别错过！ Nano Banana Pro深度测评！中文字生成和多图融合能力太强了！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体马斯克 Gemini Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法 AI for Science 苹果 Agent Claude 芯片腾讯 Stable Diffusion 蛋白质开发者 xAI 具身智能生成式神经网络机器学习 3D 人形机器人 AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为计算字节跳动 AI设计 AGI 大型语言模型搜索生成式AI 视频生成场景 DeepMind 深度学习特斯拉 AI模型架构 MCP 亚马逊 Transformer 编程视觉预测