大模型

一次排查 Cursor Bug 的经历

相信很多同学日常编码已经用上了Cursor。最近，我在用Cursor过程中遇到了「注册的MCP服务不调用」的问题。经过一顿排查，最终确定是Cursro自身bug导致。

3/17/2025 10:01:07 AM

卡颂

27个大模型混战电商领域，DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果

全面评估大模型电商领域能力，首个聚焦电商基础概念的可扩展问答基准来了！ ChineseEcomQA，来自淘天集团。此前，大模型常因生成事实性错误信息而受限，而传统基准又难以兼顾电商任务的多样性与领域特殊性。

3/17/2025 8:48:00 AM

量子位

北京新增34款已完成登记的生成式AI服务，小米AI搜索、Monica在列

网信北京发布了最新北京市生成式人工智能服务已登记信息公告，公称，根据《生成式人工智能服务管理暂行办法》及有关规定，对于通过API接口或其他方式直接调用已备案大模型能力的生成式人工智能应用或功能，采用登记管理方式，允许上线提供服务。截至3月14日，我市新增34款已完成登记的生成式人工智能服务，累计已完成46款生成式人工智能服务登记。其中，小米AI搜索、小米AI写作、Monica等产品在列。

3/14/2025 2:20:00 PM

AI在线

炸裂官宣！大佬亲自站台，AWS 全力支持 DeepSeek！

月11日凌晨，AWS宣布在AWS Bedrock推出全托管的DeepSeek-R1模型，成为首个提供DeepSeek-R1全托管的海外云厂商。与此同时，DeepSeek也成为是首个登陆Amazon Bedrock的国产大模型。 Amazon CEO Andy .

3/14/2025 10:43:27 AM

架构师之路

无缝切换，实现多厂家大模型高效对接

1、问题介绍在 AI 技术迅猛发展的今天，越来越多的研发同学面临着众多大模型选型的挑战。随着业务需求的多样化，大家希望能够逐一对比和探索不同的大模型，以便选择最适合的解决方案。然而，不同模型的对接方式各异，请求格式、参数解析也各不相同，这给开发者带来了不小的困扰。

3/14/2025 9:02:03 AM

架构精进之路

阶跃星辰与智元机器人达成合作探索大模型+具身机器人应用

上海阶跃星辰智能科技有限公司与智元机器人正式签署深度战略合作协议，双方将在基座大模型和机器人研发领域展开深度合作，共同探索“大模型具身机器人”的技术突破与应用创新。此次合作涉及世界模型技术研发、具身智能领域数据合作以及新零售等应用场景的落地，旨在推动具身智能技术在家庭服务、新零售、智能制造等领域的规模化应用。阶跃星辰与智元机器人的合作内容涵盖了模型研发、行业解决方案以及数据体系建设等多个方面。

3/13/2025 5:31:00 PM

AI在线

RAG（三）GraphRAG进阶：GraphReader-- 基于图的Agent，让大模型“读懂”长文本

上一篇论文介绍了GraphRAG，今天来看一篇算是其进阶版的方法--GraphReader。对于其研究动机，简单来说，LLMs具有强大的规划和反思能力，但在解决复杂任务时，如函数调用或知识图谱问答（KGQA），以及面对需要多次推理步骤的问题时，仍然面临困难。特别是当涉及到长文本或多文档的处理时，现有的方法往往难以充分利用这些模型的能力来捕捉全局信息，并有效地进行决策。

3/13/2025 12:24:34 PM

Glodma

迈向视觉大一统：UnifiedReward，多模态生成与理解的通用奖励模型

本篇文章来自公众号粉丝投稿，论文提出了一个视觉领域通用的奖励模型UnifiedReward，能够对图像/视频的生成与理解进行pairwise（成对比较）或 pointwise（单样本打分）评估，可用于视觉各领域的直接偏好优化 (DPO)，提升各类视觉模型的表现。论文介绍近年来，大模型时代的多模态生成与理解技术取得了飞跃式发展。然而，如何让AI真正“看懂”世界，并更好地对齐人类偏好，仍是一个核心挑战。

3/13/2025 10:18:42 AM

Yibin Wang

14B 小模型逆袭翻译赛道，论文财报实测超Claude，不信试试“我命由我不由天”

都说通用大模型轻松拿捏翻译，结果有人来掀桌了。来自网易有道的14B翻译小模型，测试达行业第一，翻译质量超越一众国内外主流通用大模型。它就是子曰翻译大模型2.0（下文简称子曰2.0），在英译中方面轻松超越Claude 3.5 Sonnet等12个主流通用大模型，中译英也和Claude 3.5 Sonnet达到同等水平。

3/13/2025 10:04:06 AM

量子位

大模型长文推理迎来“核弹级”提速！清华APBB框架狂飙10倍，Flash Attention直接被秒

还在为大模型处理长文本“龟速”而抓狂?别急!清华大学祭出“王炸”技术——APB 序列并行推理框架，直接给大模型装上“涡轮增压”引擎!实测显示，这项黑科技在处理超长文本时，速度竟比肩 Flash Attention 快10倍!没错，你没听错，是10倍!要知道，随着 ChatGPT 等大模型的爆火，AI 们“阅读”能力也水涨船高，动辄处理十几万字的长文不在话下。然而，面对海量信息，传统大模型的“大脑”却有点卡壳—— Transformer 架构虽强，但其核心的注意力机制就像一个“超级扫描仪”，文本越长，扫描范围呈指数级膨胀，速度自然就慢了下来。为了解决这个“卡脖子”难题，清华大学的科学家们联合多家研究机构和科技巨头，另辟蹊径，推出了 APB 框架。

3/13/2025 9:50:00 AM

AI在线

不需要 AI 和数学知识背景，这篇文章带你学会大模型应用开发

作者 | ronaldo最近几年，大模型在技术领域的火热程度属于一骑绝尘遥遥领先，不论是各种技术论坛还是开源项目，大多都围绕着大模型展开。大模型的长期目标是实现AGI，这可能还有挺长的路要走，但是眼下它已经深刻地影响了“编程”领域。各种copilot显著地提升了开发者的效率，但与此同时，开发者也变得非常地焦虑。

3/13/2025 8:00:00 AM

腾讯技术工程

科大讯飞依靠国产算力卡成功进入大模型研发梯队

近日，科大讯飞在互动平台上回答投资者提问，透露了其在国产算力领域的最新进展，引发广泛关注。科大讯飞表示，凭借仅仅1万张910B 国产算力卡，他们已经跻身于大模型研发的第一梯队。这一成绩令人瞩目，因为同类企业在此领域所需的算力往往远超此数。

3/11/2025 2:15:00 PM

AI在线

从鹦鹉学舌到灵魂对话，AI的人话革命

2030年，一位老人对家庭机器人说：“我想念年轻时在西湖划船的日子。 ”AI不仅能调出当年的老照片，还能结合实时天气与老人健康数据，规划一场安全舒适的怀旧之旅，并同步预约无人游船。当机器对人类产生“主动关怀”，标志着AI从工具进化为“生活伴侣”。

3/11/2025 1:20:43 PM

佚名

基于Dify与DeepSeek：零门槛训练自己的专属AI大模型

在人工智能（AI）技术日益普及的今天，训练属于自己的AI大模型不再是遥不可及的梦想。随着DeepSeek R1的发布，其部署成本仅为ChatGPT的十分之一，这一突破让更多企业和个人能够轻松参与AI开发。未来，垂直领域的AI大模型和应用将如雨后春笋般涌现，这无疑是一个巨大的机遇。

3/11/2025 10:51:35 AM

冰河技术

字节跳动豆包大模型团队开源MoE架构优化技术，训练成本节省40%

字节跳动豆包大模型团队官宣开源一项针对 MoE（混合专家模型）架构的关键优化技术，可将大模型训练效率提升 1.7 倍，成本节省 40%。据悉，该技术叫做 COMET，已实际应用于字节的万卡集群训练，累计帮助节省了数百万 GPU 小时训练算力。

3/10/2025 5:42:41 PM

远洋

如何看待”首个真干活”AI—Manus？

话题背景今日凌晨，一款通用AI Agent产品「Manus」正式发布。 GAIA评分已超越OpenAI的DeepResearch，成为GAIA评分第一。这一产品以“数字代理人”自居，宣称能独立完成复杂任务并交付完整成果，迅速成为科技圈的焦点。

3/10/2025 12:00:00 PM

腾讯技术工程

2025年AI投资热潮延续：九家美国公司获超亿美元融资

2024年是人工智能行业具有里程碑意义的一年，据TechCrunch统计，去年有49家初创公司获得了价值1亿美元或以上的融资，其中七家公司筹集了10亿美元以上资金，三家公司甚至获得了多轮"巨额融资"。而2025年开年以来，这一势头不减。尽管年初刚过，融资额超过1亿美元的美国AI公司数量已接近两位数，且已有一轮融资突破10亿美元大。

3/10/2025 10:00:43 AM

AI在线

大模型本地部署的“隐形炸弹”，你的数据安全吗？

作者 | 朱雀实验室随着DeepSeek R1等开源大模型的火爆，越来越多的开发者、企业甚至开始尝试在本地部署大语言模型，享受AI带来的便利。然而近期腾讯混元安全团队-朱雀实验室发现：这些广受欢迎的AI工具中有不少存在安全隐患。如果使用不当，攻击者可能窃取用户数据、滥用算力资源，甚至控制用户设备。

3/10/2025 9:10:00 AM

腾讯技术工程

资讯热榜

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快 Meta 新超级智能实验室遭遇离职潮，AI 人才流失引发担忧宾州州立大学推出首个人工智能工程学位，抢占教育先机联合国成立人工智能咨询小组 AI 安全测试揭示聊天机器人助长恐怖活动与网络犯罪亿万富翁丹・洛布减持台积电，转投另一家万亿人工智能公司深度测评！谷歌全新AI模型Nano Banana（附30+提示词案例）

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini 马斯克 AI创作智能体英伟达 Anthropic 论文代码 AI新词训练算法 Stable Diffusion LLM 芯片蛋白质开发者腾讯 Claude 苹果生成式 AI for Science Agent 神经网络 3D 机器学习研究 xAI 生成人形机器人 AI视频计算百度 Sora GPU AI设计华为工具大语言模型 RAG 搜索具身智能字节跳动大型语言模型场景深度学习预测视频生成伟达视觉 Transformer AGI 架构亚马逊神器推荐 Copilot 应用 DeepMind 特斯拉

大模型

一次排查 Cursor Bug 的经历

27个大模型混战电商领域，DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果

北京新增34款已完成登记的生成式AI服务，小米AI搜索、Monica在列

炸裂官宣！大佬亲自站台，AWS 全力支持 DeepSeek！

无缝切换，实现多厂家大模型高效对接

阶跃星辰与智元机器人达成合作 探索大模型+具身机器人应用

RAG（三）GraphRAG进阶：GraphReader-- 基于图的Agent，让大模型“读懂”长文本

迈向视觉大一统：UnifiedReward，多模态生成与理解的通用奖励模型

14B 小模型逆袭翻译赛道，论文财报实测超Claude，不信试试“我命由我不由天”

大模型长文推理迎来“核弹级”提速！清华APBB框架狂飙10倍，Flash Attention直接被秒

不需要 AI 和数学知识背景，这篇文章带你学会大模型应用开发

科大讯飞依靠国产算力卡成功进入大模型研发梯队

从鹦鹉学舌到灵魂对话，AI的人话革命

基于Dify与DeepSeek：零门槛训练自己的专属AI大模型

字节跳动豆包大模型团队开源MoE架构优化技术，训练成本节省40%

如何看待”首个真干活”AI—Manus？

2025年AI投资热潮延续：九家美国公司获超亿美元融资

大模型本地部署的“隐形炸弹”，你的数据安全吗？

阶跃星辰与智元机器人达成合作探索大模型+具身机器人应用