大模型

中国华电发布 “华电智” 大模型，能源管理进入智能新时代

在11月4日举行的2025年中国华电新型电力系统技术创新论坛上，中国华电正式发布了其最新研发的“华电智”大模型。这一模型在人工智能与预测应用方面表现突出，标志着中国在电力行业智能化转型的又一重要里程碑。 “华电智”大模型全球首创了径流预测大模型，显著提升了水能利用的预测精度。

11/5/2025 9:42:34 AM

AI在线

大模型正颠覆金融服务，度小满CEO揭秘AI如何助力普惠金融

在定于11月3日开幕的2025年香港金融科技周上，金融科技与人工智能的深度融合再次成为全球焦点。本届盛会汇集了香港特区行政长官李家超、诺贝尔物理学奖得主杰弗里·辛顿（Geoffrey Hinton）等重量级嘉宾。其中，度小满 CEO 朱光发表了重要演讲，详细阐述了大模型(Large Language Model， LLM)在金融服务行业的创新应用与颠覆性影响。

11/4/2025 5:41:52 PM

AI在线

字节跳动新举措！推出豆包股激励计划，吸引大模型人才

字节跳动最近在大模型领域推出了一项颇具创新的「豆包长期激励计划」。这一计划的核心在于建立一个「虚拟股」机制，旨在通过授予员工豆包股和类似字节期权的回购机制，进一步吸引和留住那些在人工智能（AI）和大模型技术方面的人才。随着 AI 技术的快速发展，人才的竞争愈发激烈。

11/4/2025 10:51:51 AM

AI在线

稠密监督 × 策略内采样：On-Policy Distillation 如何以 1/10 成本训练专家级小模型

大家好，我是肆〇柒。我看到一项来自 Thinking Machines Lab 的前沿研究——《On-Policy Distillation》。这项工作巧妙融合了强化学习的策略内采样优势与知识蒸馏的稠密监督信号，不仅将后训练成本降至传统 RL 的十分之一，还在数学推理、个性化助手和持续学习等关键场景中展现出惊人的效率与稳定性。

11/4/2025 9:42:07 AM

肆零柒

LangChain 大模型应用开发框架：从 RAG 到 Agent 的完整指南

在AI大模型时代，Python以23.08%的市场份额连续五年稳居编程语言榜首，在AI、数据科学、深度学习等前沿技术中的应用尤为广泛。而LangChain作为一个基于大语言模型(LLM)的应用程序开发框架，提供了一整套工具、组件和接口，简化了创建大模型应用程序的过程，已经成为大模型应用开发的事实标准。本文将从零到一地介绍如何使用LangChain构建从检索增强生成(RAG)到智能代理(Agent)的完整应用。

11/4/2025 7:15:00 AM

用户007

最新外国「自研」大模型，都是套壳国产？

外国开发者：我们该开始学习中文了吗？绷不住了，美国科技公司最新发布的大模型，思考时怎么一直在说中文？本周，知名 AI 代码工具 Cursor 发布了 2.0 版重大更新，推出了首个自家的代码模型 Composer，以及用于并行协作多个智能体的新界面。

11/1/2025 8:51:00 PM

机器之心

最具争议性研究：大模型中间层输出可 100% 反推原始输入

最近，一篇名为《Language Models are Injective and Hence Invertible》的论文在学术界和科技圈引起了广泛讨论，甚至连老马的 Grok 官方也下场转发。这篇论文出自意大利罗马第一大学（Sapienza University of Rome）的 GLADIA Research Lab，文中提出了一个颇有争议却又耐人寻味的观点：主流的 Transformer 语言模型在信息处理过程中几乎不会丢失任何输入内容，从数学意义上看，它们是可逆的。换句话说，模型的隐藏状态并不是模糊的语义压缩，而是一种能够完整保留输入信息的精确重编码。

10/31/2025 3:27:00 PM

郑佳美

英伟达再掷十亿美元，加码 AI 编程新锐 Poolside

据彭博社援引知情人士消息，芯片巨头英伟达（Nvidia）计划向 AI 编程模型公司 Poolside 追加投资 5 亿至 10 亿美元，助力后者完成总额 20 亿美元的新一轮融资。该轮融资对 Poolside 的投前估值为 120 亿美元，若交割顺利，英伟达最终出资金额将视其他投资者到位情况最高升至 10 亿美元。 Poolside 总部位于美国与巴黎，专注为软件开发场景构建大模型，其工具主要面向代码生成、调试及自动化编程流程，客户已覆盖国防与政府部门。

10/31/2025 9:46:42 AM

AI在线

大模型去全球接单平台赚外快，98%惨遭老板退货！ScaleAI宣布新智能体基准：AI绝对自动化几乎为0，大多知名基准过时、封闭

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）如果让大模型去外包平台去接单，它真的可以赚到钱吗？现在终于有专业的评测机构站出来公布答案了。不用硬夸AI，事实是让它接单，它会饿死。

10/30/2025 1:30:49 PM

云昭

如何理解：高效的异构算力调度是业界目前面临的一大难题？

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景 - 构建大模型应用架构设施底座：异构算力。在后摩尔时代与AI爆发的双重驱动下，计算架构正经历一场从同构到异构的深刻变革。以 GPU、NPU、FPGA、DPU .

10/30/2025 9:45:53 AM

Luga Lee

Cursor发布首个编程大模型！代码生成250tokens/秒，强化学习+MoE架构

Cursor的首个编码模型，刚刚发布了！最新进展，Cursor 2.0正式发布，并且首次搭载了「内部」大模型。没错，不是GPT、不是Claude，如今模型栏多了个新名字——Composer。

10/30/2025 9:13:55 AM

Amazon重磅新作SimRAG：让大模型“自我进化”，轻松适配专业领域问答任务

在大模型技术飞速发展的今天，通用大模型在日常对话、内容创作等场景中已展现出卓越能力，但当面对医学、科学、计算机等专业领域时，却常常“力不从心”。分布偏移导致模型认知与领域数据脱节，高质量领域数据稀缺推高训练成本，传统RAG技术又难以精准捕捉领域信息——这些痛点成为大模型落地专业场景的关键阻碍。而Amazon在2025年NAACL会议上发表的SimRAG（Self-Improving Retrieval-Augmented Generation）框架，为解决这些问题提供了全新思路。

10/30/2025 8:57:54 AM

Goldma

从反馈中学习：强化学习如何提升百晓生问答精准度

第一部分：引言在人工智能技术飞速发展的今天，智能问答系统已成为连接信息与用户的重要桥梁，它们不仅重塑着人机交互方式，更在提升服务效率、优化知识获取路径等方面展现出巨大潜力。在此背景下，"百晓生"作为一款基于RAG（检索增强生成）与外挂知识库的大型语言模型（LLM）驱动的问答产品，专注于为上门工程师提供精准的质检知识答疑服务。经过一年的持续迭代与优化，该产品已从最初的10%小流量实验，逐步开放至全国范围，目前每日稳定为超过3000名工程师提供支持，连续多周问答准确率保持在90% 。

10/30/2025 1:22:00 AM

车天博、李俊波、李莹莹

抖音副总裁李亮：AI 技术助力谣言治理，构建可信平台环境

近日，央视社会与法频道发布了一则视频，讨论了人工智能（AI）在假新闻制造中的作用。对此，抖音集团副总裁李亮发表了看法。他指出，AI 和算法同样是工具，虽然 AI 使得谣言的制造变得更加容易，但抖音也在利用 AI 技术来治理谣言。

10/29/2025 3:06:47 PM

AI在线

大模型也需要「自知之明」：KnowRL教会AI识别知识边界，推理能力反超SFT

今天给大家分享一篇刚出炉的大模型研究——《KnowRL: Exploring Knowledgeable Reinforcement Learning for Factuality》。这篇论文提出的"知识边界学习"机制解决了一个特别棘手的问题：为什么模型参数越大反而越容易一本正经地胡说八道？论文PDF可以直接戳这里下载： "推理-幻觉"两难？

10/29/2025 2:11:00 AM

一度