大模型

12GB 显存可实现 128K 上下文 5 并发会话，IBM 预览 Granite 4.0 Tiny 模型

该模型采用混合 Mamba-2 / Transformer 架构，现有版本总参数规模为 7B、活动参数为 1B，可在消费级硬件上实现可用的体验。

5/10/2025 11:46:11 AM

溯波（实习）

商汤科技迈向多模态大模型的新纪元

在过去的两年里，人工智能领域的关注点逐渐转向了大模型的技术发展，而商汤科技作为一家成立不到十年的公司，凭借其在计算机视觉领域的技术积累，正迅速转型，迎接这一浪潮。尽管在2023年之前，商汤主要聚焦于视觉模型，但随着 DeepSeek R1的发布，市场的重心开始向自然语言处理和大规模参数模型倾斜，商汤的策略也随之调整。商汤于4月10日推出的全新6000亿参数多模态大模型 “日日新 Sense Nova V6”，展现了强大的综合能力，与国际领先的 GPT-4.5和 Gemini2.0Pro 不相上下。

5/9/2025 4:00:51 PM

AI在线

智能音箱迎来AI时代新技术渗透率超20%

在技术迅速发展的今天，智能音箱的 “智商” 也在不断提升。近日，快科技报道称，凭借 AI 大模型的加持，智能音箱在智能化领域实现了质的飞跃。根据洛图科技（RUNTO）的数据显示，2025年第一季度，中国智能音箱市场的销量达到了369.9万台，尽管同比下降了5.6%，但整体行业的技术升级势头依然强劲。

5/9/2025 10:01:41 AM

AI在线

阿里巴巴开源 ZeroSearch 搜索引擎：训练成本大幅降低 80%

近日，阿里巴巴推出了一款名为 ZeroSearch 的开源创新大模型搜索引擎，这一新工具通过强化学习框架，极大地提高了搜索能力，并且在训练过程中不需要与真实搜索引擎互动。 ZeroSearch 的核心优势在于它能够利用大型预训练模型的知识，快速生成相关内容，并且可以动态控制生成内容的质量。与传统的搜索引擎相比，ZeroSearch 的训练成本显著降低。

5/9/2025 9:00:59 AM

AI在线

阿里开源大模型搜索引擎 ZeroSearch,大幅降低成本

近日，阿里巴巴在 Github 等平台正式开源了其全新研发的大模型搜索引擎 ZeroSearch。这款搜索引擎以强化学习框架为基础，能够在无需与真实搜索引擎交互的情况下，激发大模型的搜索能力。 ZeroSearch 的核心技术是利用大模型在大规模预训练过程中积累的丰富知识，将其转化为一个高效的检索模块。

5/9/2025 9:00:59 AM

AI在线

商汤万象平台稳居国内AI大模型市场第二，未来前景光明

近日，国际数据公司（IDC）发布的最新报告《中国模型即服务 (MaaS) 及 AI 大模型解决方案市场追踪(2024H2)》显示，商汤科技旗下的万象平台在国内 AI 大模型解决方案市场中表现抢眼，凭借13% 的市场份额稳居第二，继续引领行业的第一梯队。这一成就不仅展示了商汤在 AI 领域的实力，更凸显了整个行业的发展潜力。报告指出，2024年中国的 AI 大模型解决方案市场正在迎来爆发式增长，全年市场规模预计将达到34.9亿元人民币，较去年同比增长高达126.4%。

5/8/2025 4:00:46 PM

AI在线

Mistral 发布 Medium 3 大模型：前沿级性能与低成本兼具，提供多种企业功能

该模型在各项基准测试中的表现都达到或超过了 Anthropic Claude Sonnet 3.7 的 90%，成本则为每百万 Token 输出 0.4 美元、每百万 Token 输出 2 美元。

5/8/2025 11:07:40 AM

溯波（实习）

北大、清华联合发布！大模型逻辑推理能力新突破

在当前人工智能领域，大语言模型（LLMs）取得了显著成就，但其逻辑推理能力依然显得不足。为了提升这一能力，来自北京大学、清华大学、阿姆斯特丹大学、卡内基梅隆大学以及阿布扎比的 MBZUAI 等五所高校的研究人员，联合发布了《Empowering LLMs with Logical Reasoning: A Comprehensive Survey》综述论文，聚焦于逻辑推理的两大关键问题:逻辑问答和逻辑一致性。研究表明，大语言模型在处理复杂逻辑推理时存在明显的短板。

5/8/2025 10:00:54 AM

AI在线

低价大模型 DeepSeek 实用指南

火爆全网的国产大模型 DeepSeek，其 API 价格仅为同类模型的几十分之一。图片DeepSeek 网页端与 API 应用场景DeepSeek 网页端界面简洁直观，但 API 使用需要一定技巧。本文将从对话、知识库、AI 翻译、AI 编程及 Python 调用等多个场景，分篇评测 DeepSeek API 的实际应用。

5/8/2025 8:10:25 AM

红绿灯灯灯灯

全新 AI 驱动的生命科学发现系统亮相，助力科研效率飞跃

在生物科技领域，人工智能的迅速发展正推动科研方法的革命。近日，中国农业科学院与百图生科联合推出了基于大模型的 “发现系统”，这一系统有望大幅提升生命科学研究的效率和精度。在5月6日的发布会上，来自行业内的专家们围绕如何实现 AI 在生命科学中的应用进行深入探讨。

5/7/2025 10:01:29 AM

AI在线

上线仅7天，阿里通义千问3问鼎全球开源模型

近日，阿里巴巴推出的开源大模型 “通义千问3”（Qwen3）在上线仅七天后，便成功夺得了全球开源模型的冠军地位。这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的，标志着阿里在人工智能领域又一次取得了重要突破。据悉，通义千问3在指令遵循能力方面，表现超越了诸多顶级闭源模型，如 o3High、o4-Mini High 和 Gemini2.5pro，成功跻身全球第一的位置。

5/7/2025 10:01:04 AM

AI在线

理想汽车李想宣布 AI Talk 第二季：探讨人工智能的未来与发展

理想汽车创始人兼 CEO 李想在社交平台上宣布，《AI Talk 第二季》将于5月7日晚上8点正式上线。在这一季中，他将与观众分享自己对人工智能最新的思考，尤其是理想 VLA 司机大模型的创新理念。李想表示，VLA 司机大模型不仅是技术的结晶，更是生物进化的延续，从动物智能到人类智慧的跃迁。

5/7/2025 9:00:53 AM

AI在线

从看见到理解，多模态大模型如何重塑行为检测

在人工智能技术快速迭代的今天，行为检测作为计算机视觉领域的重要分支，正迎来一场由多模态大模型引领的技术革命。作为曾在CV算法公司工作的从业者，我深刻体会到传统计算机视觉方法在实际落地中的诸多痛点。过去几年，许多行为检测、烟火检测等应用，往往因为高昂的训练成本和难以接受的误报率而被甲方叫停。

5/7/2025 1:00:00 AM

贝塔街的万事屋

三分钟快速入门大模型数据工程

向自然语言处理的大模型应用，数据工程的核心任务是构建一套高效、可扩展、可控的数据流程，从源头到可用于模型训练、推理的高质量文本语料，全链路打通。数据工程的整体目标构建稳定的数据流转链路，从原始文本数据 → 清洗/标注/审核后的语料 → 符合模型输入格式的数据集保证数据可用性、完整性、质量、结构统一性支持多阶段使用场景：训练/微调、推理RAG、评估测试等数据来源最常见的形式是甲方提供，如客户工单、业务知识库、客服聊天记录、FAQ 等。需尽早明确数据格式、内容范围、隐私边界。

5/7/2025 12:10:00 AM

贝塔街的万事屋

南天信息与新华三合作推出行业领先的大模型一体机

近日，南天信息的子公司海捷科技与紫光集团旗下的新华三集团达成深度合作，联合推出了一款基于新华三 LinSeer Cube 的大模型一体机。这一新产品的发布，标志着在人工智能领域内又一次重要的技术进步，特别是在行业应用方面。随着人工智能的迅猛发展，企业在数字转型和智能化进程中亟需高效、便捷的解决方案。

5/6/2025 12:00:51 PM

AI在线

iOS18.6或为中国用户启用AI功能国行苹果AI或由阿里百度技术支持

近日，知名科技记者马克·古尔曼透露消息，苹果AI有望在iOS18.6系统中首次在中国大陆启用部分功能，届时其背后将有阿里巴巴和百度提供技术支持。由于政策和合规方面的限制，海外的大模型如GPT、Gemini等无法在中国境内直接提供服务。基于此情况，百度的文心一言大模型将成为国行版苹果AI的核心云端智能引擎，承担起为苹果AI提供智能处理能力的重任。

5/6/2025 10:01:27 AM

AI在线

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

大语言模型（LLMs）的成功激发了人们对各种智能体的兴趣。将 LLM 用于智能体的一个关键假设是，LLMs 利用常识和思维链（Chain-of-Thought, CoT）进行推理，从而智能体可以有效地探索并高效地解决复杂领域的问题。然而，LLM 智能体存在次优探索和知 - 行差距（knowing-doing gap）的问题，即无法有效地将模型中的知识转化为行动。

5/6/2025 9:08:00 AM

机器之心

68页论文再锤大模型竞技场！Llama4发布前私下测试27个版本，只取最佳成绩

大模型竞技场的可信度，再次被锤。最近一篇名为《排行榜幻觉》（The Leaderboard Illusion）的论文在学术圈引发关注。图片它指出，如今被视为LLM领域首选排行榜的Chatbot Arena，存在诸多系统问题。

5/6/2025 1:45:00 AM

资讯热榜

最具争议性研究：大模型中间层输出可 100% 反推原始输入 Wan2.2-Animate又火了！5分钟让抠脚大汉秒变高冷女神奥特曼回应一切：重组后仍需微软支持，不相信OpenAI的欢迎做空 OpenAI 或将于明年上市，估值可达万亿！亚马逊股价暴涨 13%，人工智能推动云计算迎来多年最快增长 Bevel 获得 1000 万美元 A 轮融资，致力于 AI 健康助手创新「套壳」的最高境界：OpenAI揭秘Atlas浏览器架构OWL OpenAI更新ChatGPT规则：10月29日起禁止医疗、法律与财务建议

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta AI新词微软智能用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果 Claude 腾讯 Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人 AI视频研究大语言模型生成具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景深度学习架构生成式AI DeepMind 编程视觉 Transformer AI模型预测亚马逊特斯拉 MCP

大模型

12GB 显存可实现 128K 上下文 5 并发会话，IBM 预览 Granite 4.0 Tiny 模型

商汤科技迈向多模态大模型的新纪元

智能音箱迎来AI时代 新技术渗透率超20%

阿里巴巴开源 ZeroSearch 搜索引擎：训练成本大幅降低 80%

阿里开源大模型搜索引擎 ZeroSearch,大幅降低成本

商汤万象平台稳居国内AI大模型市场第二，未来前景光明

Mistral 发布 Medium 3 大模型：前沿级性能与低成本兼具，提供多种企业功能

北大、清华联合发布！大模型逻辑推理能力新突破

低价大模型 DeepSeek 实用指南

全新 AI 驱动的生命科学发现系统亮相，助力科研效率飞跃

上线仅7天，阿里通义千问3问鼎全球开源模型

理想汽车李想宣布 AI Talk 第二季：探讨人工智能的未来与发展

从看见到理解，多模态大模型如何重塑行为检测

三分钟快速入门大模型数据工程

南天信息与新华三合作推出行业领先的大模型一体机

iOS18.6或为中国用户启用AI功能 国行苹果AI或由阿里百度技术支持

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

68页论文再锤大模型竞技场！Llama4发布前私下测试27个版本，只取最佳成绩

智能音箱迎来AI时代新技术渗透率超20%

iOS18.6或为中国用户启用AI功能国行苹果AI或由阿里百度技术支持