大模型

月之暗面 Kimi 推出首个内容社区，开启用户互动新模式

月之暗面近日宣布正在进行其首个内容社区产品的灰度测试，旨在提升用户体验和留存率。这款名为 Kimi 的产品早在去年底就开始了小范围的试用，目前终于迎来了更广泛的测试阶段。据澎湃新闻报道，月之暗面是一家成立于2023年3月的公司，由有着清华背景的杨植麟团队领导。

4/15/2025 12:02:18 PM

AI在线

MCP 协议深度解读：技术创新正以前所未有的速度突破

作者 | rianOpenAI 官宣全面支持MCP协议，至此MCP已得到业界广泛的认可。正逐步成为AI应用架构的基础协议。做为AI应用架构的USB-C,MCP原理是怎样的？

4/15/2025 10:16:12 AM

腾讯技术工程

智谱AI正式启动IPO流程，大模型“六小龙”迎来新篇章

据证券时报消息，国内大模型领域领军企业智谱AI已正式启动首次公开募股（IPO）流程，成为业内备受瞩目的焦点。据悉，智谱2025年4月14日在北京证监局办理辅导备案，辅导机构为中国国际金融股份有限公司。作为“大模型六小龙”（智谱AI、月之暗面、百川智能、MiniMax、零一万物、阶跃星辰）之一，智谱AI的这一里程碑标志着中国AI初创企业迈向资本市场的重要一步。

4/15/2025 10:01:28 AM

AI在线

海豚语言被谷歌大模型破译！跨物种交流大门打开，哈萨比斯：下一个是狗

神奇！人类和海豚真的能实现跨物种交流了？！

4/15/2025 9:53:52 AM

量子位

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

近日，Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名，这一剧烈波动引发了开发者们的广泛质疑，认为 Meta 可能通过提交特供版本以刷榜。事情的起因要追溯到4月6日，Meta 发布了其最新的大模型 Llama4，包括 Scout、Maverick 和 Behemoth 三个版本。其中，Llama-4-Maverick 在初期的评估中表现亮眼，位列 LMArena 排行榜的第二名，仅次于 Gemini2.5Pro。

4/14/2025 6:01:07 PM

AI在线

商汤大装置SenseCore 2.0全新升级推出1亿元代金券计划

4月14日，在北京举办的2025商汤技术交流日上，商汤科技正式宣布其大装置SenseCore2.0全面升级。作为AI基础设施领域的领军者，商汤大装置SenseCore2.0致力于为企业提供敏捷、灵活、可靠的全栈AI基础设施服务，以极致性价比推动大模型技术的高效落地与规模化应用。商汤大装置SenseCore2.0的升级，旨在应对当前大模型产业面临的三大挑战:开源模型和工具的主流化、性价比的生死线以及多模态技术带来的新场景需求。

4/14/2025 4:01:07 PM

AI在线

WOT大会7月北京启幕！12大AI主题诚征议题和嘉宾

WOT全球人工智能技术峰会是由51CTO开创的面向人工智能领域的高端技术会议品牌，它与另一大会品牌WOT全球技术创新大会一道，自2012年首次举办以来，历时十余年沉淀，累计吸引超过万名技术人员现场参与，同时吸引了数百家国内外知名科技企业和行业龙头、近千位技术领军人物深度合作。 ChatGPT引爆的热潮没有丝毫减缓之势，而DeepSeek又给这一热度添了一把火。伴随大模型的快速迭代、持续演进，生成式AI技术从理念到实践，从应用落地到产品百花齐放，创新速度之快令人瞩目，这也正是WOT全球人工智能技术峰会2025召开的目的和初衷。

4/14/2025 1:55:31 PM

阿里全模态Qwen2.5-Omni技术报告万字解读！

Qwen 团队最近发布了一款统一多模态大模型 Qwen2.5-Omni，开放了 7B 版本的权重。能够同时处理文本、图像、音频和视频输入，并以流式方式生成文本和语音响应。下面来详细看下：开源地址：论文地址：：地址： Face：：：官方体验：：：在日常生活中，人类能够同时感知视觉和听觉信息，并通过大脑处理这些信息后，以书写、说话或使用工具等方式进行反馈，从而与世界上的各种生物进行信息交流并展现智能。

4/14/2025 12:20:00 AM

Goldma

谷歌计划融合 Gemini 与 Veo 模型，打造全能 AI 助手

谷歌DeepMind CEO透露，计划将Gemini AI与Veo视频生成模型融合，提升AI对物理世界的理解能力。Gemini已支持多模态，可生成图像、文本和音频，行业正朝“全能”模型发展。#AI技术##谷歌Gemini#

4/13/2025 8:53:57 AM

远洋

斯坦福权威报告盖章！阿里通义千问贡献排名全球第三！用算力优势重塑全球竞争格局！

近日，斯坦福大学人工智能研究所发布了《2025年人工智能指数报告》，为全球人工智能领域的发展提供了新的视角。报告指出，阿里巴巴在全球重要大模型贡献中位居第三，成为中国科技公司的领军代表。报告显示，2024年，中国在全球 AI 大模型中贡献了15项，而阿里巴巴的6个模型入选，紧随谷歌与 OpenAI 的7个模型之后。

4/13/2025 7:34:53 AM

AI在线

谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索

谷歌Gemini AI新功能Circle Screen曝光，用户可圈选屏幕特定区域实现精准搜索，提升交互体验。类似安卓旗舰机的Circle to Search功能，但更聚焦于某一对象。#谷歌Gemini##AI新功能#

4/12/2025 8:45:30 AM

故渊

商汤日日新 SenseNova V6 多模态融合大模型发布

“商汤日日新 SenseNova V6”多模态融合大模型于今日发布，具备最长 64K 思维链、数理分析、多模态深度推理、全局记忆等能力，支持 10 分钟的视频推理及深度推理。

4/10/2025 4:16:29 PM

远洋

大模型“自动修 bug”能力将提升，豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

4 月 10 日消息，豆包大模型团队今日通过官方公众号宣布，首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源，可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上，Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言，是真正面向“全栈工程”的评测基准。其数据均来自 GitHub issue，历时近一年构建，以尽可能准确测评和提高大模型高阶编程智能水平。

4/10/2025 2:30:12 PM

清源

算法面试80%会问：大模型评估指标全解析

从训练到部署的评估链条大模型的评估贯穿了从研发到部署的全生命周期：训练阶段：使用交叉熵等损失函数指导模型优化方向生成评估：通过BLEU、ROUGE等指标量化生成内容质量能力测试：利用GLUE、MMLU等标准化基准评估多维度能力实战对比：在竞技场上与其他模型直接PK，检验实际效果交叉熵与困惑度熵最初源自物理学，用于描述系统无序程度。在信息论中，熵衡量信息的不确定性：$H(X) = -\sum_{x} P(x)log_b P(x)$交叉熵是评估预测分布与真实分布差异的指标，也是大模型训练中最常用的损失函数：$H(p, q) = -\sum_{i} p(i) \log q(i)$困惑度是评估语言模型的老牌指标，简单说就是预测下一个词有多"困难"。计算公式：复制在实际项目中，我们常用它监控预训练过程。

4/10/2025 7:00:00 AM

贝塔街的万事屋

阿里云刘伟光：AI正在推动各行各业的生产力变革

“阿里云大模型的战略就是服务企业市场创造社会价值，AI正在推动各行各业的生产力变革，通义大模型将深耕企业市场。 ”4月9日，阿里云在京召开AI势能大会，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光称，大模型的社会价值正在企业市场释放，阿里云将坚定投入，打造全栈领先的技术，持续开源开放，为AI应用提速。近一年多来，通义大模型技术加速迭代，在to B和to C赛道都取得了一些进展，在消费端表现为用户体验的优化，在产业侧表现为生产力的极大提升。

4/9/2025 2:35:50 PM

"是我创造了第一个LLM"！Kaggle前首席科学家一句话引发AI学术圈考古行动

论如何在技术圈争论中一句话噎到对方：哥们，是我创造了第一个大语言模型。发言者Jeremy Howard为澳大利亚昆士兰大学名誉教授、曾任Kaggle创始总裁和首席科学家，现answer.ai与fast.ai创始人，。事情的起因是有人质疑他最近的项目llms.txt在帮助大模型爬取互联网信息上并没太大作用，从而引发了这段争论，迅速引起众人围观。

4/9/2025 9:23:00 AM

量子位

一文彻底搞懂 MCP：AI 大模型的标准化工具箱

MCP 最近在 AI 领域引发了广泛关注，特别是在海外各大社区中，大家热烈讨论，热度相当高。我打开了 Google Trends[1]，这是一个专门用于查看全球热点趋势的网站。图片输入关键词后，可以查看其热度变化。

4/9/2025 8:25:20 AM

程序员NEO

模态编码器 | CLIP改进之SigLIP，采用sigmoid损失的图文预训练

DeepMind对CLIP改进的一篇工作--SigLIP，发表在2023CVPR。简单看下研究动机：传统的对比学习方法如CLIP等依赖于 softmax 归一化，这需要一个全局视角来计算成对相似度，从而限制了批处理大小的扩展能力，并且在小批处理大小下表现不佳。因此本文提出了一个简单的成对 Sigmoid 损失函数用于语言-图像预训练（SigLIP）。

4/9/2025 2:10:00 AM

Goldma

资讯热榜

6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 AI玩拼图游戏暴涨视觉理解力，告别文本中心训练，无需标注的多模态大模型后训练范式 OpenAI 为 ChatGPT 推出智能记忆清理功能，Plus 用户率先体验大的来了：谷歌Gemini 3.0 Pro单次生成网页版操作系统，Win、Mac、Linux一网打尽大模型降本增效，稀疏注意力机制的魔力在哪？ AI圈重磅发布！九大章节深度解读313页的State of AI 2025报告卡神新项目刷屏！AI老鸟深度解析Karpathy的开发Trick，网友：700块复刻ChatGPT！终于能亲自研究ChatGPT 英国政府提出 AI 节省 450 亿英镑计划，但专家质疑其可行性

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文 LLM 代码算法芯片 Stable Diffusion 苹果腾讯 AI for Science Agent Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度大语言模型 Sora 工具 GPU 具身智能 RAG 华为计算字节跳动 AI设计搜索 AGI 大型语言模型场景视频生成深度学习架构 DeepMind 视觉预测 Transformer 伟达编程 AI模型特斯拉生成式AI 神器推荐

大模型

月之暗面 Kimi 推出首个内容社区，开启用户互动新模式

MCP 协议深度解读：技术创新正以前所未有的速度突破

智谱AI正式启动IPO流程，大模型“六小龙”迎来新篇章

海豚语言被谷歌大模型破译！跨物种交流大门打开，哈萨比斯：下一个是狗

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

商汤大装置SenseCore 2.0全新升级 推出1亿元代金券计划

WOT大会7月北京启幕！12大AI主题诚征议题和嘉宾

阿里全模态Qwen2.5-Omni技术报告万字解读！

谷歌计划融合 Gemini 与 Veo 模型，打造全能 AI 助手

斯坦福权威报告盖章！阿里通义千问贡献排名全球第三！用算力优势重塑全球竞争格局！

谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索

商汤日日新 SenseNova V6 多模态融合大模型发布

大模型“自动修 bug”能力将提升，豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

算法面试80%会问：大模型评估指标全解析

阿里云刘伟光：AI正在推动各行各业的生产力变革

"是我创造了第一个LLM"！Kaggle前首席科学家一句话引发AI学术圈考古行动

一文彻底搞懂 MCP：AI 大模型的标准化工具箱

模态编码器 | CLIP改进之SigLIP，采用sigmoid损失的图文预训练

商汤大装置SenseCore 2.0全新升级推出1亿元代金券计划