大模型

AI仅凭“自信”学会推理，浙大校友复刻DeepSeek长思维链涌现，强化学习无需外部奖励信号

复刻DeepSeek-R1的长思维链推理，大模型强化学习新范式RLIF成热门话题。 UC Berkeley团队共同一作Xuandong Zhao把这项成果称为：大模型无需接触真实答案，仅通过优化自己的信心，就能学会复杂推理。具体来说，新方法完全不需要外部奖励信号或标注数据，只需使用模型自身的置信程度作为内在奖励信号。

5/30/2025 9:05:00 AM

一文教你玩转 RAG 大模型应用开发

Part.1.RAG这么火，你会用吗？自从大模型技术走向市场以来，“幻觉”现象总是对用户造成困扰，而RAG（Retrieval-Augmented Generation，检索增强生成）技术正在成为解决这一难题的利器。国内众多科技大厂在实践RAG技术时都取得了阶段性的成果。

5/30/2025 1:00:00 AM

三笠

在人工智能技术爆发式发展的当下，大模型（Large Language Models, 以下简称LLM）凭借其强大的自然语言处理能力，广泛渗透于智能助手、内容创作、代码生成等诸多关键领域，深度重塑着人们的生活与工作范式。然而，随着 LLM 应用场景的持续拓展与深化，一系列严峻的安全挑战接踵而至，其中提示词攻击已逐渐演变为威胁人工智能系统安全的核心隐患，亟待深入剖析与应对。一、提示词攻击定义与影响提示词攻击是指攻击者精心构思并输入恶意构造的文本内容，意图干扰和操纵LLM的内部运行逻辑，使其偏离既定的正常行为模式。

5/29/2025 10:32:32 AM

大模型应用防火墙

模型吞噬代码，Agent重构世界：当AI Agent与模型协同进化

大家好，我是肆〇柒。 AI 圈的进化速度之快，已是不争的事实。去年，MCP（模型上下文协议）发布，随后 AI Coding 赛道愈发热闹，Cursor、Cline、Devin、MGX 等产品层出不穷。

5/29/2025 9:57:38 AM

肆零柒

实测 Google Veo 3：AI 视频终于能开口“说话”了（附白嫖攻略+提示词技巧）

大家好，我是言川。 Google 在上周还整了个大活：在 I/O 大会上正式发布了全新的视频生成模型——Veo 3。说实话，当我第一次看到它的演示视频时，脑子里冒出来的第一个词就是：离谱。

5/29/2025 7:57:37 AM

言川Artie

Meta闪电分拆AI帝国！Llama团队一劈为二：一边狂卷AGI，一边死磕OpenAI

2025 年 5 月，据 Axios 报道，Meta 正式将其 AI 部门拆分为两个独立方向：面向消费者的AI产品团队，以及追求通用人工智能（AGI）的“AGI Foundations”基础组。过去几年，Meta在AI领域的策略始终被认为偏“研究导向”：大模型Llama的发布频率、论文产出数量、开源社区活跃度，都表现出一种“与学界赛跑”的姿态。但与此同时，用户端产品的AI体验却始终模糊——Llama虽强，却“藏”在模型库里，普通用户几乎无感。

5/28/2025 6:41:37 PM

中国石油发布3000亿参数昆仑大模型，助力智能化油气全产业链

中国石油天然气集团有限公司在北京正式发布了其最新的3000亿参数昆仑大模型。这一重大成果标志着中国在大模型技术领域的又一次重要突破，体现了中央企业在人工智能领域的快速发展和创新能力。新的昆仑大模型相比于2024年11月发布的700亿参数版本有了显著提升。

5/28/2025 5:00:50 PM

AI在线

多模态大模型不会画辅助线？最新评估得分：o3仅25.8%，远低于人类82.3%

多模态时代应如何评估模型的视觉输出能力？来自清华大学、腾讯混元、斯坦福大学、卡耐基梅隆大学等顶尖机构的研究团队联合发布了RBench-V：一款针对大模型的视觉推理能力的新型基准测试。过去的评估基准主要集中于评估多模态输入和纯文本推理过程。

5/28/2025 11:43:48 AM

告别卡脖子，华为黑科技破局！昇腾推理加速1.6倍打破LLM降智魔咒

LLM发展到今天，下一步该往哪个方向探索？显然，如今最明显的一个问题就是，大模型的参数规模还是太大了——DeepSeek-V3的参数为671B，Llama 3.1系列最大为405B，GPT-4o为200B，Claude 3.5 Sonnet为175B。参数规模在不断增长，高昂的计算成本和推理延迟，该怎么破？

5/28/2025 8:51:00 AM

知识图谱、大模型与幻觉：自然语言处理的视角

摘要大型语言模型（LLMs）已经彻底改变了基于自然语言处理（NLP）的应用，包括自动化文本生成、问答系统、聊天机器人等。然而，它们面临一个重大挑战：产生幻觉，即模型生成听起来合理但实际上错误的内容。这削弱了信任，并限制了LLMs在不同领域的适用性。

5/28/2025 1:50:00 AM

KGGPT

DeepSeek-V3：硬件与模型的完美统协，奏响 AI 高效新乐章

大家好，我是肆〇柒。 DeepSeek-V3 曾经一度备受全球瞩目，从 V3 发布至今，这一开源模型已经在众多企业场景中成功落地。然而，在落地过程中，由于其复杂的工程细节，相信许多团队也遇到了不少挑战。

5/28/2025 1:20:00 AM

肆零柒

基于大模型的智能问答系统

在构建基于大模型的智能问答系统时，LangChain 提供了一个强大的框架，支持各种模块来帮助开发者构建更复杂、更智能的语言处理应用。以下是构建此类系统的一些关键组件和步骤。模型接入：使用 LangChain 支持的模型，通过 API 接入外部模型，或利用 api-for-open-llm 框架调用本地llm模型。

5/28/2025 1:00:00 AM

耗子

两岁的Llama，最初的14位作者已跑了11个！Mistral成最大赢家

Meta 开源 Llama 模型家族帮助该公司制定了 AI 战略，某种程度上也改变了全世界的大模型格局。然而，令人意想不到的是，短短几年，Llama 的初创者们大多已经转投他处。在 2023 年发表的那篇具有里程碑意义的论文《 LLaMA: Open and Efficient Foundation Language Models 》中，Llama 被推向世界，当时论文共有 14 位作者。

5/27/2025 3:37:46 PM

舍弃自回归！国内团队打造纯扩散多模态大模型LLaDA-V，理解任务新SOTA

本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。游泽彬和聂燊是中国人民大学高瓴人工智能学院的博士生，导师为李崇轩副教授。该研究基于团队前期发布的、首个性能比肩 LLaMA 3 的 8B 扩散大语言模型 LLaDA。

5/27/2025 3:35:02 PM

Llama 论文作者“出逃”，14人团队仅剩3人，法国独角兽 Mistral 成最大赢家

他们大多去向了 Mistral，这家总部位于巴黎的 AI 初创公司，正在用“开源速度”反攻 Meta 自己开启的战场。 Llama 曾是 Meta 最具野心的 AI 作品：在 ChatGPT 和 PaLM 占据主流话语权的 2023 年，Meta 用一篇重量级论文和一组开放权重的大语言模型，意外地把开源阵营推上主舞台。而那时，Meta 的 AI 科研团队 FAIR（Fundamental AI Research）也正处于高光时刻。

5/27/2025 3:16:38 PM

国内首创!夸克健康大模型通过12门副主任医师职称考试，4个学科达主任医师水平

夸克健康大模型近日创造了国内AI医疗领域的重要里程碑，在12门国家副主任医师职称考试中成绩全部超过合格线，成为国内首个成功跨越这一专业门槛的大模型。这一突破标志着AI在医疗专业能力方面达到了新的高度，目前用户已可通过夸克搜索直接调用这一全新的大模型能力。技术架构与创新突破夸克健康大模型以阿里巴巴的通义千问为技术基础，通过海量高质量数据构建和多阶段后训练策略实现了关键性突破。

5/27/2025 3:01:00 PM

AI在线

国内首个!夸克健康大模型成功通过副主任医师考试

夸克健康大模型在全国副主任医师职称考试中表现出色，成功通过12门学科的评测，成为国内首个跨越这一门槛的大模型。此次考试涵盖了全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学和麻醉学等12个常用学科。夸克健康大模型在所有测试科目中均超过了合格线，并在全科医学、肿瘤内科学、皮肤与性病学、精神病学等四个学科达到了主任医师的及格线。

5/27/2025 3:01:00 PM

AI在线

阿里妈妈推出URM大模型，引领广告智能化新潮流

近日，在 TongAI 大会上，阿里妈妈正式发布了 URM 通用召回大模型。这一全新的技术成果，结合了深度学习与大数据分析能力，旨在提升电商广告的智能投放效果。 URM 大模型不仅能够精准解析消费者的行为和兴趣偏好，还能有效提高广告投资回报率（ROI），标志着阿里妈妈在生成式推荐领域的首次技术落地，为广告行业的智能化转型注入了新的动力。

5/27/2025 10:01:20 AM

AI在线

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

大模型

AI仅凭“自信”学会推理，浙大校友复刻DeepSeek长思维链涌现，强化学习无需外部奖励信号

一文教你玩转 RAG 大模型应用开发

AI 大脑如何被 “套路”?— 揭秘大模型提示词攻防

模型吞噬代码，Agent重构世界：当AI Agent与模型协同进化

实测 Google Veo 3：AI 视频终于能开口“说话”了 （附白嫖攻略+提示词技巧）

Meta闪电分拆AI帝国！Llama团队一劈为二：一边狂卷AGI，一边死磕OpenAI

​中国石油发布3000亿参数昆仑大模型，助力智能化油气全产业链

多模态大模型不会画辅助线？最新评估得分：o3仅25.8%，远低于人类82.3%

告别卡脖子，华为黑科技破局！昇腾推理加速1.6倍打破LLM降智魔咒

知识图谱、大模型与幻觉：自然语言处理的视角

DeepSeek-V3：硬件与模型的完美统协，奏响 AI 高效新乐章

基于大模型的智能问答系统

两岁的Llama，最初的14位作者已跑了11个！Mistral成最大赢家

舍弃自回归！国内团队打造纯扩散多模态大模型LLaDA-V，理解任务新SOTA

Llama 论文作者“出逃”，14人团队仅剩3人，法国独角兽 Mistral 成最大赢家

国内首创!夸克健康大模型通过12门副主任医师职称考试，4个学科达主任医师水平

​国内首个!夸克健康大模型成功通过副主任医师考试

阿里妈妈推出URM大模型，引领广告智能化新潮流

实测 Google Veo 3：AI 视频终于能开口“说话”了（附白嫖攻略+提示词技巧）

中国石油发布3000亿参数昆仑大模型，助力智能化油气全产业链

国内首个!夸克健康大模型成功通过副主任医师考试