大模型

腾讯全面展示AI大模型战略，推动企业智能化转型

在2025年的 AI 产业应用峰会上，腾讯首次全景展示了其大模型战略，标志着公司在人工智能领域的重要进展。此次峰会不仅让人们看到了腾讯在自研大模型方面的努力，更体现了其致力于为各行业企业提供全面智能解决方案的决心。会上，腾讯首席执行官汤道生表示，随着人工智能技术的不断成熟，未来每个企业都将成为 AI 公司。

5/22/2025 4:00:55 PM

AI在线

杭州市政府工作报告点名 DeepSeek，力挺算法模型企业发展

据澎湃新闻报道，在5月22日开幕的杭州市十四届人大五次会议上，市长姚高员所作的政府工作报告中特别提到了人工智能企业 DeepSeek（深度求索）及其开源大模型。报告回顾了2024年杭州的工作成就，肯定了 DeepSeek 等一批大模型在低成本下取得出色表现，并指出其发展“震动全球同业”。 DeepSeek 作为杭州本土新兴科技力量的代表，与其他五家初创公司一同在去年底至今年初迅速崛起，被誉为“杭州六小龙”。

5/22/2025 3:00:30 PM

AI在线

AI也能当情感大师？腾讯发布最新AI社交智能榜单，最新版GPT-4o拿下第一

判断AI是否智能，评价维度如今已不仅限于刷榜成绩。当大模型在“IQ”上不断实现新的突破，“懂人心”、“解人意”开始成为实际应用中，人们对大模型新的要求。所以，AI的“EQ”又该如何评价？

5/22/2025 1:42:28 PM

TCL 联手阿里云，打造半导体显示行业首个强推理大模型

TCL 集团与阿里云达成全栈 AI 战略合作，聚焦半导体显示和智能终端领域，共同研发垂直行业专业大模型，加速制造业智能化转型。 TCL 创始人李东生与阿里云 CEO 吴泳铭共同见证签约。此次合作将聚焦大模型推理、多模态理解和智能检索三大核心技术。

5/22/2025 11:00:55 AM

AI在线

百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%

2025年5月20日，百度飞桨团队正式发布了PaddleOCR3.0版本，并对外开源。这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展，进一步提升了PaddleOCR在OCR领域的技术实力和应用价值。 PaddleOCR自发布以来，凭借其学术前沿算法和产业落地实践，受到了产学研各方的喜爱，并被广泛应用于众多知名开源项目。

5/22/2025 10:00:56 AM

AI在线

前端 x AI：从了解提示工程、RAG和微调开始

在AI工程应用中有三种应用范式，他们分别是提示工程（Prompt Engineering）、RAG（Retrieve Augmented Generation）、微调（Fine Tuning），那么在工程应用中我们该如何选择呢？在具体介绍这三种范式之前，首先我们需要了解什么是大模型。大模型通常指的是拥有大量参数和复杂结构的深度学习模型，它经过海量的多样化的数据预训练之后，具备了非常多的能力，包括编码、数学、金融、教育和法律等行业的能力。

5/22/2025 1:00:00 AM

赖祥燃

告别“单打独斗”！AI 协作新范式 MoA，如何集结大模型“梦之队”？

大模型浪潮下，你的 AI 应用遇到瓶颈了吗？当 GPT、Claude、文心一言等各类强大模型如繁星般涌现，我们惊喜于它们令人惊叹的能力。然而，在实际落地中，我们常常发现，即使是最顶尖的单一模型，也难以完美应对所有复杂场景的需求。

5/21/2025 4:27:00 PM

贝塔街的万事屋

面壁智能获新一轮数亿元融资，引领端侧大模型高效发展与应用普及

近日，面壁智能完成新一轮数亿元融资，本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。本轮融资的完成，将进一步为面壁智能构筑高效大模型技术、产品壁垒、加速行业赋能与生态拓展奠定坚实基础，协同产业上下游推动「端侧大脑」在千行百业规模化应用。 2025 年伊始，全球人工智能竞赛进入白热化，以「高效、低耗」为代表的创新路径正在引领全球 AI 变革。

5/21/2025 4:18:00 PM

徐咪

DeepSeek发布大模型训练端到端论文，展示卓越工程深度

近日，DeepSeek发布了一篇关于大模型训练的最佳端到端技术论文，引发业界广泛关注。该论文全面阐述了DeepSeek在大模型研发中的技术突破，涵盖软件、硬件及混合优化方案，展现了其令人惊叹的工程深度。在**软件**层面，论文详细介绍了多头潜在注意力机制（MLA），显著降低推理过程中的内存占用;FP8混合精度训练通过低精度计算提升效率，同时保证数值稳定性;DeepEP通信库优化了专家并行(EP)通信，支持FP8低精度操作，加速MoE模型训练与推理;LogFMT对数浮点格式则通过均匀化激活分布，进一步优化计算效率。

5/21/2025 11:01:05 AM

AI在线

大模型全面爆发，所有榜一都是Gemini！谷歌一夜站到了台前

北京时间今天凌晨 1 点，今年的 Google I/O 2025 开发者大会正式开启。谷歌最近的大模型技术风头正劲，今年的这场「科技春晚」吸引了全球关注的目光。没有意外，今年的核心主题自然是 AI。

5/21/2025 9:40:11 AM

机器之心

解锁 LLM 新高度！一文深度解读 Qwen3 大模型

1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型，参数规模从 0.6 亿到 2350 亿不等，满足不同下游应用需求。旗舰模型 Qwen3-235B-A22B 作为 MoE 模型，总参数量达 2350 亿，每 token 激活参数量为 220 亿，在性能与效率间取得平衡。密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似，采用 Grouped Query Attention（GQA）和 QK-Norm 改进注意力机制，使用 SwiGLU 作为激活函数，搭配 Rotary Positional Embeddings（RoPE）进行位置编码，采用 RMSNorm 并预归一化。

5/21/2025 9:04:38 AM

Goldma

百度文心 X1 Turbo 大放异彩，斩获信通院最高评级！

在5月20日举行的百度 AI Day 上，中国信息通信研究院（信通院）公布了最新的大模型推理能力评估结果，令众多科技爱好者为之振奋。百度的文心大模型 X1Turbo 成为国内首个获得 “4 级” 最高评级的大模型，这一成就让人刮目相看。此次评估共涵盖24项能力，X1Turbo 在其中表现不凡，16项能力满分达到5分，展示了其强大的技术实力。

5/21/2025 9:01:06 AM

AI在线

面壁智能获新一轮数亿元融资推动「端侧大脑」规模化应用

面壁智能宣布完成新一轮数亿元融资，本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。这一融资的完成，将为面壁智能在高效大模型技术、产品壁垒、行业赋能与生态拓展方面奠定坚实基础，推动“端侧大脑”在千行百业的规模化应用。面壁智能是一家专注于打造高效大模型的公司，以“高效”为第一性原理，致力于在同等参数下实现更高的性能、更低的成本、更低的功耗和更快的速度。

5/21/2025 9:01:06 AM

AI在线

RAG与微调，大语言模型的“大脑升级”，该选哪条路？（小白科普）

最近在做项目时，我发现有些甲方对RAG和模型微调分区的不太清楚，明明大语言模型（LLM）加挂RAG就可以解决的问题，却坚持要微调，但是具体沟通后发现，其实只是不太了解二者的实际用途。其实，Retrieval-Augmented Generation (RAG) 和微调 (Fine-Tuning) 是两种最常用的LLM的“大脑升级”技术，虽然它们都能提升模型的性能，但工作原理和适用场景却大相径庭。今天，我就来深入聊聊这两种技术，弄清楚在不同情况下，到底该选 RAG 还是微调。

5/21/2025 3:00:00 AM

贝塔街的万事屋

蚂蚁武威：下一代「推理」模型范式大猜想

R1 之后，长思维链成为研究下一代基础模型中 “推理”（Reasoning）能力的热门方向。一方面，R1 证明了大模型深度思考的可行性；与此同时，尽管 R1 展现出了强大的性能，大模型推理的序幕实则才刚刚拉开。此外，R1 在海外掀桌也给国内人工智能的研究带来一个显著影响，即：越来越多的研究者敢于站在更高视角思考，提出前瞻引领的技术思想。

5/21/2025 12:10:00 AM

陈彩娴

60+头部企业关于AI的思想碰撞，都在这场大会里

最近由150位全球顶尖AI创始人参与的红杉资本AI峰会刷爆AI产业圈，关于大热的智能体经济、大模型、机器人商业化...来自OpenAI、英伟达、谷歌等公司的AI大佬们给出了他们的洞察——AI不再卖工具，而是卖收益。它正在从“技术产品”进化为一种新的经济运行方式。这一观点通俗来讲，就是客户不会因为你的AI产品功能好不好来买单，他们只为能帮他挣钱的产品买单。

5/20/2025 3:36:54 PM

火山引擎推出开源 MCP Servers，助力大模型应用开发

近日，火山引擎宣布推出一款名为 MCP Servers 的大模型生态平台，并将其开源。这一举措使得企业可以轻松将自研工具按照 MCP 协议进行封装并上传共享，形成一个良性的 “用生态” 与 “建生态” 的循环。火山引擎MCP Servers 可被视为一个 “大模型工具超市”，集成了大量高质量的 MCP 协议适配工具，涵盖了搜索、数据库和业务系统 API 等多个高频场景。

5/20/2025 12:00:55 PM

AI在线

火山引擎发布大模型生态广场 MCP Servers

火山引擎正式发布了其大模型生态广场——MCP Servers，这一创新平台的推出标志着AI开发进入了一个全新的模块化组装时代。通过“MCP Market（工具广场）火山方舟(大模型服务) Trae(应用开发环境)”的深度协同，MCP Servers实现了从工具调用、模型推理到应用部署的全链路开发闭环，极大地简化了开发流程，让开发者能够以更高效的方式构建AI应用。 MCP Servers被形象地称为“大模型工具超市”，它集成了众多高质量的MCP协议适配工具，覆盖了搜索、数据库、业务系统API等高频应用场景。

5/20/2025 9:00:56 AM

AI在线

资讯热榜

Wan2.2-Animate又火了！5分钟让抠脚大汉秒变高冷女神最具争议性研究：大模型中间层输出可 100% 反推原始输入奥特曼回应一切：重组后仍需微软支持，不相信OpenAI的欢迎做空 Bevel 获得 1000 万美元 A 轮融资，致力于 AI 健康助手创新亚马逊股价暴涨 13%，人工智能推动云计算迎来多年最快增长 OpenAI更新ChatGPT规则：10月29日起禁止医疗、法律与财务建议 OpenAI 或将于明年上市，估值可达万亿！「套壳」的最高境界：OpenAI揭秘Atlas浏览器架构OWL

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta AI新词微软智能用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果 Claude 腾讯 Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人 AI视频研究大语言模型生成具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计 AGI 大型语言模型搜索视频生成场景深度学习架构生成式AI DeepMind 编程视觉 Transformer 预测亚马逊 AI模型特斯拉 MCP

大模型

腾讯全面展示AI大模型战略，推动企业智能化转型

杭州市政府工作报告点名 DeepSeek，力挺算法模型企业发展

AI也能当情感大师？腾讯发布最新AI社交智能榜单，最新版GPT-4o拿下第一

TCL 联手阿里云，打造半导体显示行业首个强推理大模型

百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%

前端 x AI：从了解提示工程、RAG和微调开始

告别“单打独斗”！AI 协作新范式 MoA，如何集结大模型“梦之队”？

面壁智能获新一轮数亿元融资，引领端侧大模型高效发展与应用普及

DeepSeek发布大模型训练端到端论文，展示卓越工程深度

大模型全面爆发，所有榜一都是Gemini！谷歌一夜站到了台前

解锁 LLM 新高度！一文深度解读 Qwen3 大模型​

百度文心 X1 Turbo 大放异彩，斩获信通院最高评级！

面壁智能获新一轮数亿元融资 推动「端侧大脑」规模化应用

RAG与微调，大语言模型的“大脑升级”，该选哪条路？（小白科普）

蚂蚁武威：下一代「推理」模型范式大猜想

60+头部企业关于AI的思想碰撞，都在这场大会里

火山引擎推出开源 MCP Servers，助力大模型应用开发

火山引擎发布大模型生态广场 MCP Servers

解锁 LLM 新高度！一文深度解读 Qwen3 大模型

面壁智能获新一轮数亿元融资推动「端侧大脑」规模化应用