大模型

8秒出大片！10个案例实测谷歌Veo 3视频生成功能

前几天的 2025 年 Google I/O 开发者大会上，谷歌发布了一系列先进的图像和视频生成工具，好玩的太多了，我还没来得及一一体验，今天先尝试一下最近超级火的 Veo 3 视频生成。后续再尝试下 Imagen 4 和 Flow 平台和大家分享。先简单介绍一下。

5/27/2025 7:31:45 AM

阿真Irene

LLM能理解数学吗？最新研究揭露大模型数学推理的致命缺陷

你有没有想过，那些在聊天中侃侃而谈的AI大模型，遇到数学题时会是什么样子？就像一个平时很会聊天的朋友，突然被问到复杂的数学问题时支支吾吾的样子。最近有研究团队专门研究了这个问题，结果发现了一些让人意外的真相。

5/27/2025 1:27:00 AM

无影寺

RAG系列：问题优化 - 意图识别&同义改写&多视角分解&补充上下文

在实际业务场景中，知识库不会只有单一领域的知识，可能会存在多个领域的知识，如果对用户问题不提前做领域区分，在对基于距离的向量数据库进行检索时，可能会检索出很多与用户问题不属于同一个领域的文档片段，这样的上下文会存在较多的噪音或者不准确的信息，从而影响最终的回答效果。另一方面知识库中涵盖的知识表达形式也是有限的，但用户的提问方式却是千人千面的，用户遣词造句的方式以及描述问题的角度可能会与向量数据库中存储的文档片段存在差异，这就可能导致用户问题和知识库之间不能很好匹配，从而降低检索效果。为了解决此问题，我们可以对用户问题进行查询增强，比如对用户问题进行意图识别、同义改写、多视角分解以及补充上下文，通过这几个查询增强方式来更好地匹配知识库中的文档片段，提升检索效果和回答效果。

5/27/2025 12:40:00 AM

燃哥讲AI

基于图的 RAG 方法总结（GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG）

在自然语言处理领域，检索增强生成（RAG）技术通过结合外部知识库与语言模型，显著提升了模型在知识密集型任务中的表现。近年来，基于图结构的 RAG 方法成为研究热点，通过引入知识图谱的实体关系建模能力，有效解决了传统 RAG 在多跳推理、长文本理解和全局语义捕捉中的局限性。本文详细分析五种代表性方法：GraphRAG、GraphReader、LightRAG、HippoRAG和KAG ，从实现细节、优缺点及适用场景展开对比。

5/27/2025 12:15:00 AM

Goldma

字节跳动 AdaCoT：基于强化学习的自适应推理触发方法（万字）

大家好，我是肆〇柒。在当下，大型语言模型（LLM）凭借其强大的语言理解和生成能力，在众多领域展现出了巨大的潜力。然而，尽管 LLM 在处理常规任务时表现出色，但在面对复杂推理任务时，却常常暴露出明显的短板。

5/26/2025 5:16:51 PM

肆零柒

字节开源Dolphin，高精度文档图像解析大模型，创新先分析后解析新范式

在数字时代，从扫描文档、图片等非结构化数据中高效、准确地提取结构化信息，是人工智能领域长期面临的挑战。无论是复杂的表格、交织的文本段落，还是难以识别的数学公式，都对文档解析技术提出了严苛要求。传统的解决方案往往依赖于多个专业模型的串联，不仅集成成本高昂，还容易在处理过程中累积误差。

5/26/2025 4:46:38 PM

贝塔街的万事屋

阿里妈妈在TongAI大会推出全新URM通用召回大模型，重塑购物体验

在首届国际通用人工智能大会 TongAI 上，阿里妈妈隆重推出了其 LMA2广告大模型系列中的 URM 通用召回大模型。这一新模型在生成式推荐（AIGR）领域的首次亮相，标志着阿里妈妈在智能广告技术上的又一次重大突破。 URM 通用召回大模型的设计理念是为了更精准地预测消费者的购物需求。

5/26/2025 4:00:50 PM

AI在线

谷歌通过 Gemini 应用扩展了其热门新视频机型 Veo 3 的访问权限

谷歌在其AI视频生成工具Veo3发布仅100小时后，迅速将其推广至全球71个新国家用户使用。不过，这一波扩展仍未包括欧盟国家。这一消息由谷歌Gemini副总裁Josh Woodward在X平台宣布。

5/26/2025 10:01:00 AM

AI在线

如何使用Google Gemini模型完成计算机视觉任务？

译者 | 李睿审校 | 重楼自从人工智能聊天机器人兴起以来，Google Gemini脱颖而出，已经成为推动智能系统进化的主要参与者之一。除了强大的会话能力之外，Gemini还释放了计算机视觉实际应用的潜力，让它们能够看到、解释和描述周围的世界。本文将逐步讲解如何利用Google Gemini完成计算机视觉任务，其中包括如何设置环境，发送带有指令的图像以及解释模型的输出以进行对象检测、字幕生成和OCR，还将探讨数据注释工具（例如YOLO中使用的工具），为自定义训练场景提供上下文。

5/26/2025 8:36:25 AM

李睿

智能取证新利器：大模型装入 “小箱子”

近日，福建厦门举办了2025年 “智会” 生态合作大会，吸引了众多行业专家和科技企业代表的参与。本次大会重点讨论了公共安全、司法取证技术创新以及智能装备发展等前沿议题，其中一款名为 “星睿取证分析大模型一体机” 的智能设备备受瞩目。这款一体机的亮点在于其将深度学习与便携性结合，内置了 DeepSeek 等先进的大模型技术。

5/23/2025 7:00:45 PM

AI在线

大语言模型究竟为何会在对话中“迷失”

译者 | 张哲刚审校 | 重楼微软研究院和 Salesforce的一篇新论文发现，即使是功能最强大的大型语言模型，如果面临的指令是分阶段而非一次性给出，往往也会表现不佳。该文作者运行六项任务进行研究，最终发现：当提示被拆分成多个回合时，大语言模型的性能平均下降了39%。单轮次对话（左图）可获得最佳结果，但对最终用户而言显得并不自然。

5/23/2025 8:18:52 AM

张哲刚

全球规模最大的单细胞基础大模型 CellFM 发布：基于国产超算，中山大学、华为等研发

该模型创新性地整合了超 1 亿人类单细胞数据（规模达同类 2 倍以上），构建了 8 亿参数的深度学习框架（参数量超同类 8 倍），在生物表征学习和跨数据集泛化能力上取得重大突破。

5/22/2025 5:55:33 PM

汪淼

TCL联手阿里云深度布局AI赛道，半导体显示专家大模型"星智"正式亮相

家电巨头TCL与云计算龙头阿里云正式宣布达成全栈AI战略合作，这一合作将重点围绕半导体显示和智能终端两大核心领域展开。双方计划充分利用阿里云在"云 AI"方面的技术优势，联合开发面向垂直行业的专业大模型解决方案。在技术研发层面，TCL与阿里云将基于Qwen3、Qwen-VL、QwQ等先进模型，持续优化升级半导体显示专家大模型——星智X-Intelligence。

5/22/2025 5:00:55 PM

AI在线

腾讯全面展示AI大模型战略，推动企业智能化转型

在2025年的 AI 产业应用峰会上，腾讯首次全景展示了其大模型战略，标志着公司在人工智能领域的重要进展。此次峰会不仅让人们看到了腾讯在自研大模型方面的努力，更体现了其致力于为各行业企业提供全面智能解决方案的决心。会上，腾讯首席执行官汤道生表示，随着人工智能技术的不断成熟，未来每个企业都将成为 AI 公司。

5/22/2025 4:00:55 PM

AI在线

Meta推出J1系列模型，最强“AI法官”上线

近日，Meta 公司发布了其全新 J1系列模型，这是一项旨在提升 AI 判断能力的创新技术。通过结合强化学习和合成数据的训练方法，J1模型不仅在判断的准确性上取得显著进步，还在公平性方面表现出色。此次发布的消息由科技媒体 marktechpost 报道，令人瞩目。

5/22/2025 4:00:55 PM

AI在线

Meta 推出 “Llama 创业计划”，支持初创企业使用 AI 模型

Meta 公司近日宣布推出一项名为 “Llama 创业计划” 的新项目，旨在鼓励初创企业采用其 Llama AI 模型。该计划为参与公司提供 “直接支持”，并在某些情况下提供资金支持。任何在美国注册、融资少于1000万美元、拥有至少一名开发人员并正在开发生成式 AI 应用的公司，均可在5月30日前申请参与。

5/22/2025 4:00:55 PM

AI在线

杭州市政府工作报告点名 DeepSeek，力挺算法模型企业发展

据澎湃新闻报道，在5月22日开幕的杭州市十四届人大五次会议上，市长姚高员所作的政府工作报告中特别提到了人工智能企业 DeepSeek（深度求索）及其开源大模型。报告回顾了2024年杭州的工作成就，肯定了 DeepSeek 等一批大模型在低成本下取得出色表现，并指出其发展“震动全球同业”。 DeepSeek 作为杭州本土新兴科技力量的代表，与其他五家初创公司一同在去年底至今年初迅速崛起，被誉为“杭州六小龙”。

5/22/2025 3:00:30 PM

AI在线

AI也能当情感大师？腾讯发布最新AI社交智能榜单，最新版GPT-4o拿下第一

判断AI是否智能，评价维度如今已不仅限于刷榜成绩。当大模型在“IQ”上不断实现新的突破，“懂人心”、“解人意”开始成为实际应用中，人们对大模型新的要求。所以，AI的“EQ”又该如何评价？

5/22/2025 1:42:28 PM

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

大模型

8秒出大片！10个案例实测谷歌Veo 3视频生成功能

LLM能理解数学吗？最新研究揭露大模型数学推理的致命缺陷

RAG系列：问题优化 - 意图识别&同义改写&多视角分解&补充上下文

基于图的 RAG 方法总结（GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG）

字节跳动 AdaCoT：基于强化学习的自适应推理触发方法（万字）

字节开源Dolphin，高精度文档图像解析大模型，创新先分析后解析新范式

阿里妈妈在TongAI大会推出全新URM通用召回大模型，重塑购物体验

谷歌通过 Gemini 应用扩展了其热门新视频机型 Veo 3 的访问权限

如何使用Google Gemini模型完成计算机视觉任务？

智能取证新利器：大模型装入 “小箱子”

大语言模型究竟为何会在对话中“迷失”​

全球规模最大的单细胞基础大模型 CellFM 发布：基于国产超算，中山大学、华为等研发

TCL联手阿里云深度布局AI赛道，半导体显示专家大模型"星智"正式亮相

腾讯全面展示AI大模型战略，推动企业智能化转型

Meta推出J1系列模型，最强“AI法官”上线

​Meta 推出 “Llama 创业计划”，支持初创企业使用 AI 模型

杭州市政府工作报告点名 DeepSeek，力挺算法模型企业发展

AI也能当情感大师？腾讯发布最新AI社交智能榜单，最新版GPT-4o拿下第一

大语言模型究竟为何会在对话中“迷失”

Meta 推出 “Llama 创业计划”，支持初创企业使用 AI 模型