大模型
太争气了!百度的底气,李彦宏的决心:3万卡国产自研集群;一口气九个重磅发布,全方位支持MCP,百度在大模型应用时代的出招与押注
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)4月25日,一年一度的百度开发者大会会场如约到来,这是中国国内首家AI巨头在后DeepSeek时代的全新产品的公开亮相。 进入2025以后,李彦宏带领下的百度正在如何思考新的AI应用形态? 百度在AI应用爆发时代都做了哪些准备?
4/25/2025 1:51:49 PM
云昭
机械臂+大模型+多模态:打造人机协作具身智能体
在人工智能快速发展的浪潮中,多模态大模型已成为技术前沿,使AI能够同时理解文本、图像、音频等多种信息。 这一突破为具身智能体开辟了新天地。 最近我在github中就找到了一个这样好玩的项目vlm_arm,其将机械臂与多模态大模型结合,打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。
4/25/2025 2:30:00 AM
贝塔街的万事屋
揭秘大模型的魔法:训练你的tokenizer
大家好,我是写代码的中年人。 在这个人人谈论“Token量”、“百万上下文”、“按Token计费”的AI时代,“Tokenizer(分词器)”这个词频频出现在开发者和研究者的视野中。 它是连接自然语言与神经网络之间的一座桥梁,是大模型运行逻辑中至关重要的一环。
4/25/2025 12:20:00 AM
写代码的中年人
谷歌“Wi-Fi密码”式的最瘦大模型
Gemma 3 的“低门槛 AI”计划露面了,谷歌这次直接把 Gemma 3 做成了“跑得动的”AI。 —Gemma-3-27b-it-qat-q4_0-gguf 听上去像个 Wi-Fi 密码,其实却是谷歌迄今为止最精简的大模型是的,不再只属于高端服务器和土豪显卡,普通玩家的游戏卡,甚至手机,都能一试身手。 这波操作的核心是三个字:量化训练(Quantization-Aware Training, QAT)。
4/24/2025 2:13:00 PM
文摘菌
大模型向量去重的N种解决方案!
简单来说,“向量”Vector 是大模型(LLM)在搜索时使用的一种“技术手段”,通过向量比对,大模型能找出问题的相关答案,并且进行智能回答。 向量简介Vector 是向量或矢量的意思,向量是数学里的概念,而矢量是物理里的概念,但二者描述的是同一件事。 “定义:向量是用于表示具有大小和方向的量。
4/24/2025 11:09:13 AM
磊哥
谷歌 Workspace 再添 AI 功能,音频概述与会议跟踪全新上线
谷歌近日宣布,旗下 Workspace 产品将引入更多 AI 工具,尤其是对其 Gemini 功能的扩展。 这些更新包括新的音频概述()功能和改进的会议跟踪方式,旨在提升用户的工作效率和体验。 新推出的音频概述功能,最初在谷歌的 NotebookLM 中亮相,允许用户围绕自己选择的研究主题创建播客。
4/24/2025 10:01:15 AM
AI在线
大模型数据味蕾论
AI大模型就像一位厨师,预训练数据就是这位厨师的味蕾。 没有经过训练的味蕾,再好的食材也无法变成美味佳肴。 没有优质的预训练数据,再强大的计算资源也打造不出卓越大模型。
4/24/2025 9:26:13 AM
大数据AI智能圈
谷歌 Gemini 月活跃用户突破 3.5 亿,仍与 ChatGPT 存在差距
根据最新的报道,谷歌的人工智能聊天机器人 Gemini 在全球的月活跃用户数已达到了3.5亿。 这一数据是在进行中的谷歌反垄断诉讼中披露的,显示了 Gemini 在过去一年中取得了显著的用户增长。 值得注意的是,Gemini 的日活跃用户也有了大幅提升,从2023年10月的900万增加到了目前的3500万,增长幅度相当可观。
4/24/2025 9:00:53 AM
AI在线
谷歌Gemini用户暴涨至3.5亿!但仍被ChatGPT碾压
最新数据显示,谷歌AI聊天机器人Gemini全球月活跃用户已达3.5亿,展现出惊人的增长势头。 这一数据来自谷歌反垄断诉讼中披露的内部文件,揭示了AI助手市场的激烈竞争格局。 爆发式增长轨迹-2024年10月:日活仅900万-2025年3月:日活飙升至3500万- 短短5个月:用户规模增长近4倍市场格局对比尽管增长迅猛,Gemini与行业领头羊仍存在明显差距:- ChatGPT:月活约6亿- Meta AI:月活近5亿谷歌的扩张策略为快速占领市场,谷歌采取了多管齐下的推广方式:1.
4/24/2025 9:00:53 AM
AI在线
谷歌 AI 聊天机器人 Gemini 月活达 3.5 亿,与 ChatGPT 等竞品仍有差距
谷歌AI聊天机器人Gemini全球月活跃用户达3.5亿,日活用户从去年10月的900万增至3500万。但与ChatGPT的6亿月活相比仍有差距。谷歌通过与三星合作、集成到Workspace和Chrome等策略推动增长。#AI竞争# #谷歌Gemini#
4/24/2025 7:50:42 AM
远洋
你的数据有多好,你的模型就有多强
在AI大战烽火连天的今天,所有人都在追逐参数规模的增长和架构的优化。 然而,行业内的一个秘密正在悄然成形:拥有独特数据资产的企业正在构筑起难以逾越的竞争壁垒。 数据,而非算法,正成为区分强弱的决定性要素。
4/24/2025 12:40:00 AM
大数据AI智能圈
学术打假!清华上交大研究颠覆认知:强化学习竟是大模型推理的"绊脚石"
【研究颠覆】清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。 研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于未使用强化学习的原始模型。 【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中,RL模型在低采样次数(k值)下准确率提升,但在高k值时问题覆盖率显著下降编码任务:RLVR训练模型在HumanEval 等测试中单样本pass@1分数提高,但在高采样数(k=128)时覆盖率下降视觉推理:Qwen-2.5-VL-7B模型在多模态任务中表现一致,RL未改变其基本问题解决策略【学界争议】研究结果引发学界激烈讨论:支持方认为RL提高了采样效率但限制了推理能力开发反对方指出可能是奖励结构缺陷而非RL本身问题中立观点建议结合蒸馏等其他方法增强推理【本质思考】研究团队提出关键区分:能力:模型解决问题的潜质与逻辑链条效率:在给定能力范围内得出答案的速度与稳定性强化学习更像是"能力调控器"而非"能力创造器",它能让模型更擅长做已知的事,但难以开发新的推理路径。
4/23/2025 2:00:43 PM
AI在线
微软发布全球首个1-bit大模型:内存缩至0.4 GB,参数只有0和±1,性能追平全精度
微软的BitNet b1.58 2B4T 的技术报告悄然上线。 其实在开源社区里,关于极致低比特量化的大模型早就有各种传闻,这次微软研究院终于亮出底牌。 ——全球首个原生1-bit、规模高达20亿参数的开源大模型。
4/23/2025 12:11:40 PM
文摘菌
谷歌考虑与安卓制造商签署Gemini人工智能独家合作协议
在最近的一场反垄断审判中,曝光出谷歌的内部文件显示,该公司曾在去年考虑与多个安卓手机制造商,如三星等,达成独家合作协议。 这些协议不仅涉及谷歌的搜索应用程序,还包括其最新推出的 Gemini 人工智能应用和 Chrome 浏览器。 这一消息无疑引发了行业的广泛关注,尤其是在当前反垄断监管日益严格的背景下。
4/23/2025 11:00:53 AM
AI在线
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?
昨天一早,Meta 了放出自家用了 20 万显卡集群训练出的 Llama 4 系列模型,其中包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。 消息一出,直接引爆了大模型圈。 Meta 还特意强调,这些模型都经过了大量未标注的文本、图像和视频数据的训练,视觉理解能力已经到了 Next level,有种在大模型领域一骑绝尘的既视感。
4/23/2025 10:44:00 AM
郑佳美
谷歌 Gemini 推出视频分析功能,能准确识别视频拍摄场所
近日,科技媒体 Android Authority 报道称,谷歌最新的 Gemini 聊天机器人引入了一项引人注目的新功能 —— 视频分析。 用户现在可以轻松上传视频并提问,Gemini 会基于视频内容进行智能分析,回答相关问题。 这一创新功能无疑为视频内容的处理带来了新的可能性,吸引了广大用户的关注。
4/22/2025 5:00:42 PM
AI在线
初探谷歌 Gemini 视频解析功能,AI 准确识别视频拍摄场所
科技媒体 Android Authority 今天(4 月 22 日)发布博文,报道称谷歌 Gemini 聊天机器人被发现新增视频分析功能。用户可上传视频并提出相关问题,Gemini 能够基于视频内容进行精准分析。
4/22/2025 3:37:04 PM
故渊
力压群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精确引用
最新报告指出,谷歌旗下的 Gemini 2.5 Pro 模型能准确解析 PDF 文档的视觉结构,实现精准的视觉引用功能,成为首款能完全理解 PDF 布局的 AI 模型。
4/22/2025 11:02:14 AM
故渊
资讯热榜
6秒视频10秒生成!全新AI视频神器 Grok Imagine 深度体验+元提示词分享
AI玩拼图游戏暴涨视觉理解力,告别文本中心训练,无需标注的多模态大模型后训练范式
OpenAI 为 ChatGPT 推出智能记忆清理功能,Plus 用户率先体验
大的来了:谷歌Gemini 3.0 Pro单次生成网页版操作系统,Win、Mac、Linux一网打尽
大模型降本增效,稀疏注意力机制的魔力在哪?
AI圈重磅发布!九大章节深度解读313页的State of AI 2025报告
卡神新项目刷屏!AI老鸟深度解析Karpathy的开发Trick,网友:700块复刻ChatGPT!终于能亲自研究ChatGPT
英国政府提出 AI 节省 450 亿英镑计划,但专家质疑其可行性
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
论文
LLM
代码
算法
芯片
Stable Diffusion
苹果
腾讯
AI for Science
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
大语言模型
Sora
工具
GPU
具身智能
RAG
华为
计算
字节跳动
AI设计
搜索
AGI
大型语言模型
场景
视频生成
深度学习
架构
DeepMind
视觉
预测
Transformer
伟达
编程
AI模型
特斯拉
生成式AI
神器推荐