大模型

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

大语言模型（LLMs）的成功激发了人们对各种智能体的兴趣。将 LLM 用于智能体的一个关键假设是，LLMs 利用常识和思维链（Chain-of-Thought, CoT）进行推理，从而智能体可以有效地探索并高效地解决复杂领域的问题。然而，LLM 智能体存在次优探索和知 - 行差距（knowing-doing gap）的问题，即无法有效地将模型中的知识转化为行动。

5/6/2025 9:08:00 AM

机器之心

68页论文再锤大模型竞技场！Llama4发布前私下测试27个版本，只取最佳成绩

大模型竞技场的可信度，再次被锤。最近一篇名为《排行榜幻觉》（The Leaderboard Illusion）的论文在学术圈引发关注。图片它指出，如今被视为LLM领域首选排行榜的Chatbot Arena，存在诸多系统问题。

5/6/2025 1:45:00 AM

谷歌 Gemini 聊天机器人新增多图上传功能，部分用户已可体验

谷歌Gemini聊天机器人开始支持多图上传功能，目前仅部分用户可用，免费账户暂不支持。此外，Gemini还推出了修改AI生成图像的功能，包括更改背景、替换物体等。#谷歌Gemini# #AI新功能#

5/5/2025 7:01:16 PM

远洋

谷歌下周起允许 13 岁以下儿童使用 Gemini，需家长管理账户

谷歌宣布下周起允许13岁以下儿童使用Gemini聊天机器人，但需通过家长管理的谷歌账户。家长需使用Family Link服务进行管理，谷歌强调设有专门防护措施且不会使用儿童数据训练AI。 #人工智能##儿童上网安全#

5/4/2025 8:27:36 AM

远洋

29 年经典游戏被攻克：谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

谷歌Gemini 2.5 Pro成功通关29年前的经典游戏《宝可梦蓝》，展示了AI在游戏领域的突破。谷歌CEO皮查伊兴奋宣布这一成果，引发对AI游戏能力的讨论。#AI游戏# #Gemini#

5/4/2025 7:55:19 AM

远洋

谷歌拟推出儿童版 Gemini：能辅导学习、能编故事、能过滤不当内容

谷歌本周在一封邮件中通知一位8岁儿童的家长：“Gemini 应用即将开放给您的孩子使用。也就是说，孩子可以用 Gemini 提问题、写作业、编故事。”

5/3/2025 5:06:41 PM

清源

68 页论文再锤大模型竞技场：Llama4 发布前私下测试 27 个版本，只取最佳成绩

最近一篇名为《排行榜幻觉》（The Leaderboard Illusion）的论文在学术圈引发关注。

5/2/2025 8:41:36 PM

汪淼

谷歌推出 Gemini 本地图像编辑功能：动动手就能让 AI 帮你改图

Gemini 的本地图像编辑功能将从今天起逐步推向全球，预计在未来几周内，服务将扩展至大多数国家，并支持超过 45 种语言。

5/1/2025 4:59:23 PM

清源

谷歌 Gemini AI 酝酿新高级订阅层级，Ultra 蓄势待发

科技媒体 testingcatalog 今天（5 月 1 日）发布博文，报道称谷歌计划扩展 Gemini AI 服务，可能扩展推出“Gemini Ultra”订阅层级。

5/1/2025 10:40:36 AM

故渊

快手All in AI视觉！成立可灵AI事业部，加速大模型商业化

4 月 30 日，快手发布组织架构调整公告，宣布正式成立可灵AI事业部，进一步强化其在人工智能领域的战略布局。公告显示，新成立的可灵AI事业部下设可灵AI产品部、运营部和技术部，全面负责包括可灵、可图在内的系列大模型业务。快手高级副总裁盖坤将出任可灵AI事业部负责人，并继续兼任社区科学线负责人。

4/30/2025 6:00:51 PM

AI在线

中国开源大模型新成员：小米推理大模型首秀！

编辑 | 云昭进入2025以来，中国大模型的开源力量一骑绝尘，甚至盖过了Llama的势头。今天，中国开源大模型，迎来新成员！ 4月30日，赶在五一前，一条“为Reasoning而生”的Xiaomi Mimo开源模型的发布消息不胫而走，发布渠道是小米6天前新注册的公众号Xiaomi Mimo。

4/30/2025 4:48:07 PM

云昭

Meta Llama AI 模型下载量突破 12 亿，开发者贡献数万个衍生模型

Meta在首届LlamaCon大会上宣布，其开源AI模型Llama下载量已达12亿次，用户近10亿。首席产品官Chris Cox透露，数千开发者贡献了数万衍生模型。与此同时，阿里巴巴Qwen3模型家族发布，形成有力竞争。#AI开源##LlamaCon#

4/30/2025 2:50:04 PM

远洋

真假难辨!腾讯混元Turbo S助《太空杀》AI玩家智商飙升

社交推理游戏《太空杀》正迎来一场人和AI推理水平的大PK。巨人网络旗下这款风靡全球的手游，通过接入腾讯混元新一代旗舰快思考模型Turbo S，使其AI玩家的智能水平实现了高度拟人化。腾讯混元Turbo S能够同时驱动八名AI玩家参与游戏，凭借其强大的推理能力和仿真的文字对话能力，与真人玩家展开智力较量。

4/30/2025 2:00:41 PM

AI在线

蚂蚁数科发布金融智能体开发平台 Agentar，推动 AI 技术在金融领域应用

在数字中国建设峰会期间，蚂蚁数科正式推出了智能体开发平台 Agentar。该平台旨在为金融机构提供一站式、全栈的智能体开发工具，帮助它们高效地打造具备自主决策能力、可信赖的金融智能体应用。此次发布标志着 AI 技术从 “辅助工具” 转变为推动金融服务变革和效率提升的 “生产力引擎”。

4/30/2025 12:00:40 PM

AI在线

加速追赶！腾讯拆分AI团队，豪掷研发资源

据央广网消息，4月29日，公司对其混元大模型研发体系进行全面重构，聚焦算力、算法和数据三大核心，调整团队部署并加大研发投入。此次调整的核心是成立两个新的部门:大语言模型部和多模态模型部，分别负责探索前沿技术、迭代基础模型。同时，腾讯加强了底层支撑，设立数据平台部和机器学习平台部，专注于数据管理和AI平台建设，为混元大模型的研发提供全面支持。

4/30/2025 11:00:50 AM

AI在线

Meta 发布 Llama API，开发者可体验最新 AI 模型

在刚刚结束的首届 LlamaCon AI 开发者大会上，Meta 公司正式发布了其 Llama 系列 AI 模型的 API，名为 Llama API。该 API 目前处于有限预览阶段，旨在让开发者能够探索和试验基于不同 Llama 模型的产品。 Meta 表示，这一新工具将与公司的 SDK 配合使用，允许开发者创建由 Llama 模型驱动的服务、工具和应用程序。

4/30/2025 11:00:50 AM

AI在线

Qwen3来了！新一代高性能与混合推理能力兼备的大语言模型！

阿里云正式发布通义千问Qwen3系列大模型，这一里程碑式更新在性能、训练规模和推理能力等多个维度实现重大突破。作为国产大模型的领军者，Qwen3不仅以2350亿参数的MoE架构刷新性能记录，更通过创新的"混合思考模式"和360万亿token的超大规模训练，成为当前性能领先的开源大语言模型。 1、Qwen3的性能表现Qwen3系列包含多个版本，涵盖MoE混合专家模型和Dense稠密模型。

4/30/2025 10:59:04 AM

Meta Llama AI模型下载量突破12亿，开发者热情高涨

在人工智能领域，Meta 公司近期传来了一个令人振奋的消息:其 “开放式” AI 模型系列 Llama 的下载量已突破12亿次。这个数字在不久前的3月中旬刚刚达到10亿次，显示出 Llama 模型在开发者和用户中获得的广泛认可和热情。在首届 LlamaCon 开发者大会上，Meta 的首席产品官 Chris Cox 在主题演讲中透露了这一令人瞩目的数据。

4/30/2025 10:00:55 AM

AI在线

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

大模型

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

68页论文再锤大模型竞技场！Llama4发布前私下测试27个版本，只取最佳成绩

谷歌 Gemini 聊天机器人新增多图上传功能，部分用户已可体验

谷歌下周起允许 13 岁以下儿童使用 Gemini，需家长管理账户

29 年经典游戏被攻克：谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

谷歌拟推出儿童版 Gemini：能辅导学习、能编故事、能过滤不当内容

68 页论文再锤大模型竞技场：Llama4 发布前私下测试 27 个版本，只取最佳成绩

谷歌推出 Gemini 本地图像编辑功能：动动手就能让 AI 帮你改图

谷歌 Gemini AI 酝酿新高级订阅层级，Ultra 蓄势待发

快手All in AI视觉！成立可灵AI事业部，加速大模型商业化

中国开源大模型新成员：小米推理大模型首秀！

Meta Llama AI 模型下载量突破 12 亿，开发者贡献数万个衍生模型

真假难辨!腾讯混元Turbo S助《太空杀》AI玩家智商飙升

​蚂蚁数科发布金融智能体开发平台 Agentar，推动 AI 技术在金融领域应用

加速追赶！腾讯拆分AI团队，豪掷研发资源

​Meta 发布 Llama API，开发者可体验最新 AI 模型

Qwen3来了！新一代高性能与混合推理能力兼备的大语言模型！

Meta Llama AI模型下载量突破12亿，开发者热情高涨

蚂蚁数科发布金融智能体开发平台 Agentar，推动 AI 技术在金融领域应用

Meta 发布 Llama API，开发者可体验最新 AI 模型