大模型

谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索

谷歌Gemini AI新功能Circle Screen曝光，用户可圈选屏幕特定区域实现精准搜索，提升交互体验。类似安卓旗舰机的Circle to Search功能，但更聚焦于某一对象。#谷歌Gemini##AI新功能#

4/12/2025 8:45:30 AM

故渊

商汤日日新 SenseNova V6 多模态融合大模型发布

“商汤日日新 SenseNova V6”多模态融合大模型于今日发布，具备最长 64K 思维链、数理分析、多模态深度推理、全局记忆等能力，支持 10 分钟的视频推理及深度推理。

4/10/2025 4:16:29 PM

远洋

大模型“自动修 bug”能力将提升，豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

4 月 10 日消息，豆包大模型团队今日通过官方公众号宣布，首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源，可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上，Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言，是真正面向“全栈工程”的评测基准。其数据均来自 GitHub issue，历时近一年构建，以尽可能准确测评和提高大模型高阶编程智能水平。

4/10/2025 2:30:12 PM

清源

算法面试80%会问：大模型评估指标全解析

从训练到部署的评估链条大模型的评估贯穿了从研发到部署的全生命周期：训练阶段：使用交叉熵等损失函数指导模型优化方向生成评估：通过BLEU、ROUGE等指标量化生成内容质量能力测试：利用GLUE、MMLU等标准化基准评估多维度能力实战对比：在竞技场上与其他模型直接PK，检验实际效果交叉熵与困惑度熵最初源自物理学，用于描述系统无序程度。在信息论中，熵衡量信息的不确定性：$H(X) = -\sum_{x} P(x)log_b P(x)$交叉熵是评估预测分布与真实分布差异的指标，也是大模型训练中最常用的损失函数：$H(p, q) = -\sum_{i} p(i) \log q(i)$困惑度是评估语言模型的老牌指标，简单说就是预测下一个词有多"困难"。计算公式：复制在实际项目中，我们常用它监控预训练过程。

4/10/2025 7:00:00 AM

贝塔街的万事屋

阿里云刘伟光：AI正在推动各行各业的生产力变革

“阿里云大模型的战略就是服务企业市场创造社会价值，AI正在推动各行各业的生产力变革，通义大模型将深耕企业市场。 ”4月9日，阿里云在京召开AI势能大会，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光称，大模型的社会价值正在企业市场释放，阿里云将坚定投入，打造全栈领先的技术，持续开源开放，为AI应用提速。近一年多来，通义大模型技术加速迭代，在to B和to C赛道都取得了一些进展，在消费端表现为用户体验的优化，在产业侧表现为生产力的极大提升。

4/9/2025 2:35:50 PM

"是我创造了第一个LLM"！Kaggle前首席科学家一句话引发AI学术圈考古行动

论如何在技术圈争论中一句话噎到对方：哥们，是我创造了第一个大语言模型。发言者Jeremy Howard为澳大利亚昆士兰大学名誉教授、曾任Kaggle创始总裁和首席科学家，现answer.ai与fast.ai创始人，。事情的起因是有人质疑他最近的项目llms.txt在帮助大模型爬取互联网信息上并没太大作用，从而引发了这段争论，迅速引起众人围观。

4/9/2025 9:23:00 AM

量子位

一文彻底搞懂 MCP：AI 大模型的标准化工具箱

MCP 最近在 AI 领域引发了广泛关注，特别是在海外各大社区中，大家热烈讨论，热度相当高。我打开了 Google Trends[1]，这是一个专门用于查看全球热点趋势的网站。图片输入关键词后，可以查看其热度变化。

4/9/2025 8:25:20 AM

程序员NEO

模态编码器 | CLIP改进之SigLIP，采用sigmoid损失的图文预训练

DeepMind对CLIP改进的一篇工作--SigLIP，发表在2023CVPR。简单看下研究动机：传统的对比学习方法如CLIP等依赖于 softmax 归一化，这需要一个全局视角来计算成对相似度，从而限制了批处理大小的扩展能力，并且在小批处理大小下表现不佳。因此本文提出了一个简单的成对 Sigmoid 损失函数用于语言-图像预训练（SigLIP）。

4/9/2025 2:10:00 AM

Goldma

大模型+数据分析：下一代智能查询优化体系的先行探索

当你每天面对万亿级数据、日均百万次查询请求时，你会怎么做？处理海量数据查询犹如在迷雾中寻路，方向稍有不慎就会迷失。数据负载高到屏幕只显示超时，查询速度慢到让你有时间泡一杯咖啡再来检查结果。

4/9/2025 1:00:00 AM

大数据AI智能圈

谷歌 Gemini AI 升级文件分析功能，将支持 3GP、AVI、MP4 等 8 种视频格式

科技媒体 Android Authority 今天（4 月 8 日）发布博文，通过分析 APK 文件，发现谷歌 Gemini 即将升级文件分析功能，新增支持 3GP、AVI、FLV 等 8 种视频格式。

4/8/2025 11:24:00 AM

故渊

谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能

谷歌Gemini Live AI推出实时拍摄和识图导购功能，支持Pixel 9和Galaxy S25，可识别物体并比价购物。#谷歌AI##智能手机#

4/8/2025 7:36:23 AM

漾仔

大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略

一、Ollama 是什么？ Ollama 是一个开源的本地大模型部署工具，旨在简化大型语言模型（LLM）的运行和管理。通过简单命令，用户可以在消费级设备上快速启动和运行开源模型（如 Llama、DeepSeek 等），无需复杂配置。

4/8/2025 3:22:00 AM

wayn

谷歌研究：合成数据使大模型数学推理能力提升八倍

最近，来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。据专注于人工智能发展的研究机构 Epoch AI 报告显示，目前全球约有 300 万亿个公开可用的高质量文本训练标记。然而，随着类似 ChatGPT 这样的大模型的迅猛发展，对训练数据的需求呈指数级增长，预计到 2026 年之前，这些数据将被耗尽。

4/8/2025 12:40:00 AM

远洋

中国自主量子计算机“本源悟空”全球首次运行十亿级 AI 微调大模型

据《科创板日报》从安徽省量子计算工程研究中心获悉，本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关，在中国第三代自主超导量子计算机“本源悟空”真机上，全球首次运行十亿参数 AI 大模型微调任务。

4/7/2025 9:41:45 AM

远洋

LLM「想太多」有救了！高效推理让大模型思考过程更精简

LLM的推理能力显著增强，然而，这个「超级大脑」也有自己的烦恼。有时候回答会绕好大一个圈子，推理过程冗长又复杂，虽能得出正确答案，但耗费了不少时间和计算资源。比如问它「2加3等于多少」，它可能会从数字的概念、加法原理开始，洋洋洒洒说上一大通，这在实际应用中可太影响效率啦。

4/7/2025 9:23:00 AM

新智元

一文读懂开源 Llama 4 模型

Hello folks，我是 Luga，今天我们来聊一下人工智能领域的最新大模型技术进展 - 构建高效、灵活、以及开源的的大模型 - Llama 4 。在人工智能领域，随着技术的不断进步，越来越多的强大语言模型应运而生。 Llama 4 作为 Meta 推出的最新一代大规模语言模型，凭借其卓越的性能和创新的架构设计，成为了当前 AI 领域的焦点之一。

4/7/2025 8:40:00 AM

Luga Lee

大模型除了聊天还能做什么？关于大模型的分类和应用

大模型技术发展到今天，其功能可以说是日新月异；并且很多企业已经在探索大模型的应用场景和技术实现；但是很多人到现在对大模型的了解仅仅只限于能聊个天，问个问题。但实际上，大模型能够做的事要远比我们想象中的要多的多；因此，今天我们就从用户和技术两个角度来介绍一下大模型的应用。关于大模型的分类和应用问题如果想弄清楚大模型是怎么使用的，首先要知道大模型的分类；不同类型的模型适合不同的应用场景，其功能和实现也各不相同。

4/7/2025 8:15:00 AM

DFires

Llama 4开源王者归来！推理、编码打平DeepSeek V3但参数减一半，一张H100就能跑，还有巨兽2万亿参数模型！

编辑 | 李美涵出品 | 51CTO技术栈（微信号：blog51cto）深夜，Meta如期发布了全新的开源大型模型系列——Llama 4，并未出现任何“跳票”传闻中的推迟情况！图片此次发布也标志着Meta与近来崛起的开源新王 DeepSeek 正面硬钢。 Meta官推更是表示：表示：“今天开启了原生多模态AI创新的新时代”。

4/7/2025 7:00:00 AM

李美涵

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek 腾讯云上线DeepSeek全系API接口并打通联网搜索东风日产N7首款接入DeepSeek大模型，实现智能化人机交互 DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程 Copilot 视觉