大模型

一日一技：如何快速生成大模型工具调用的JSON Schema

在使用大模型的工具调用时，我们需要编写JSON Schema，例如下图的tools字段的值：图片这个Schema写起来非常麻烦，括号太多了，看着眼花。不信你肉眼看看，你需要几秒钟才能分清楚type: "object"跟哪个字段在同一层级？这个Schema有没有什么办法自动生成呢？

4/27/2025 7:57:50 AM

kingname

大模型应用系列：两万字解读MCP

MCP通过建立统一的工具连接规范，为Agent开发提供了标准化接入框架。该协议不仅简化了Agent与多样化系统的集成过程，还显著扩展了Agent的任务处理能力，使开发者能够更高效地构建具备复杂功能的智能体，实现从基础查询到业务决策的多层次应用。那么，如何进一步理解MCP呢？

4/27/2025 2:22:00 AM

曹洪伟

谷歌Gemini聊天机器人即将扩展至智能手表和汽车取代 Google Assistant

谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）宣布，其新一代聊天机器人 Gemini 将在今年晚些时候登陆智能手表、Android Auto 及其他设备。这一计划的推出意味着，谷歌将逐步用 Gemini 取代现有的 Google Assistant，提升用户体验。 Gemini 目前已经可以在手机应用和网页端使用，但在智能手表、汽车和其他智能设备上，谷歌依然依赖于 Google Assistant。

4/25/2025 5:00:49 PM

AI在线

谷歌确认：Gemini 聊天机器人今年将登陆智能手表、Android Auto

谷歌CEO皮查伊确认，Gemini聊天机器人将在今年晚些时候拓展至平板、汽车、耳机和手表等设备，逐步替代Google Assistant。更多细节或在下月I/O大会公布。#谷歌Gemini# #AI助手#

4/25/2025 2:50:54 PM

远洋

太争气了！百度的底气，李彦宏的决心：3万卡国产自研集群；一口气九个重磅发布，全方位支持MCP，百度在大模型应用时代的出招与押注

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）4月25日，一年一度的百度开发者大会会场如约到来，这是中国国内首家AI巨头在后DeepSeek时代的全新产品的公开亮相。进入2025以后，李彦宏带领下的百度正在如何思考新的AI应用形态？百度在AI应用爆发时代都做了哪些准备？

4/25/2025 1:51:49 PM

云昭

机械臂+大模型+多模态：打造人机协作具身智能体

在人工智能快速发展的浪潮中，多模态大模型已成为技术前沿，使AI能够同时理解文本、图像、音频等多种信息。这一突破为具身智能体开辟了新天地。最近我在github中就找到了一个这样好玩的项目vlm_arm，其将机械臂与多模态大模型结合，打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。

4/25/2025 2:30:00 AM

贝塔街的万事屋

揭秘大模型的魔法：训练你的tokenizer

大家好，我是写代码的中年人。在这个人人谈论“Token量”、“百万上下文”、“按Token计费”的AI时代，“Tokenizer（分词器）”这个词频频出现在开发者和研究者的视野中。它是连接自然语言与神经网络之间的一座桥梁，是大模型运行逻辑中至关重要的一环。

4/25/2025 12:20:00 AM

写代码的中年人

谷歌“Wi-Fi密码”式的最瘦大模型

Gemma 3 的“低门槛 AI”计划露面了，谷歌这次直接把 Gemma 3 做成了“跑得动的”AI。 —Gemma-3-27b-it-qat-q4_0-gguf 听上去像个 Wi-Fi 密码，其实却是谷歌迄今为止最精简的大模型是的，不再只属于高端服务器和土豪显卡，普通玩家的游戏卡，甚至手机，都能一试身手。这波操作的核心是三个字：量化训练（Quantization-Aware Training, QAT）。

4/24/2025 2:13:00 PM

文摘菌

大模型向量去重的N种解决方案！

简单来说，“向量”Vector 是大模型（LLM）在搜索时使用的一种“技术手段”，通过向量比对，大模型能找出问题的相关答案，并且进行智能回答。向量简介Vector 是向量或矢量的意思，向量是数学里的概念，而矢量是物理里的概念，但二者描述的是同一件事。 “定义：向量是用于表示具有大小和方向的量。

4/24/2025 11:09:13 AM

磊哥

谷歌 Workspace 再添 AI 功能，音频概述与会议跟踪全新上线

谷歌近日宣布，旗下 Workspace 产品将引入更多 AI 工具，尤其是对其 Gemini 功能的扩展。这些更新包括新的音频概述（）功能和改进的会议跟踪方式，旨在提升用户的工作效率和体验。新推出的音频概述功能，最初在谷歌的 NotebookLM 中亮相，允许用户围绕自己选择的研究主题创建播客。

4/24/2025 10:01:15 AM

AI在线

大模型数据味蕾论

AI大模型就像一位厨师，预训练数据就是这位厨师的味蕾。没有经过训练的味蕾，再好的食材也无法变成美味佳肴。没有优质的预训练数据，再强大的计算资源也打造不出卓越大模型。

4/24/2025 9:26:13 AM

大数据AI智能圈

谷歌 Gemini 月活跃用户突破 3.5 亿，仍与 ChatGPT 存在差距

根据最新的报道，谷歌的人工智能聊天机器人 Gemini 在全球的月活跃用户数已达到了3.5亿。这一数据是在进行中的谷歌反垄断诉讼中披露的，显示了 Gemini 在过去一年中取得了显著的用户增长。值得注意的是，Gemini 的日活跃用户也有了大幅提升，从2023年10月的900万增加到了目前的3500万，增长幅度相当可观。

4/24/2025 9:00:53 AM

AI在线

谷歌Gemini用户暴涨至3.5亿！但仍被ChatGPT碾压

最新数据显示，谷歌AI聊天机器人Gemini全球月活跃用户已达3.5亿，展现出惊人的增长势头。这一数据来自谷歌反垄断诉讼中披露的内部文件，揭示了AI助手市场的激烈竞争格局。爆发式增长轨迹-2024年10月:日活仅900万-2025年3月:日活飙升至3500万- 短短5个月:用户规模增长近4倍市场格局对比尽管增长迅猛，Gemini与行业领头羊仍存在明显差距:- ChatGPT:月活约6亿- Meta AI:月活近5亿谷歌的扩张策略为快速占领市场，谷歌采取了多管齐下的推广方式:1.

4/24/2025 9:00:53 AM

AI在线

谷歌 AI 聊天机器人 Gemini 月活达 3.5 亿，与 ChatGPT 等竞品仍有差距

谷歌AI聊天机器人Gemini全球月活跃用户达3.5亿，日活用户从去年10月的900万增至3500万。但与ChatGPT的6亿月活相比仍有差距。谷歌通过与三星合作、集成到Workspace和Chrome等策略推动增长。#AI竞争# #谷歌Gemini#

4/24/2025 7:50:42 AM

远洋

你的数据有多好，你的模型就有多强

在AI大战烽火连天的今天，所有人都在追逐参数规模的增长和架构的优化。然而，行业内的一个秘密正在悄然成形：拥有独特数据资产的企业正在构筑起难以逾越的竞争壁垒。数据，而非算法，正成为区分强弱的决定性要素。

4/24/2025 12:40:00 AM

大数据AI智能圈

学术打假！清华上交大研究颠覆认知：强化学习竟是大模型推理的"绊脚石"

【研究颠覆】清华大学与上海交通大学联合发表的最新论文，对业界普遍认为"纯强化学习（RL）能提升大模型推理能力"的观点提出了挑战性反驳。研究发现，引入强化学习的模型在某些任务中的表现，反而逊色于未使用强化学习的原始模型。【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中，RL模型在低采样次数（k值）下准确率提升，但在高k值时问题覆盖率显著下降编码任务:RLVR训练模型在HumanEval 等测试中单样本pass@1分数提高，但在高采样数（k=128）时覆盖率下降视觉推理:Qwen-2.5-VL-7B模型在多模态任务中表现一致，RL未改变其基本问题解决策略【学界争议】研究结果引发学界激烈讨论:支持方认为RL提高了采样效率但限制了推理能力开发反对方指出可能是奖励结构缺陷而非RL本身问题中立观点建议结合蒸馏等其他方法增强推理【本质思考】研究团队提出关键区分:能力:模型解决问题的潜质与逻辑链条效率:在给定能力范围内得出答案的速度与稳定性强化学习更像是"能力调控器"而非"能力创造器"，它能让模型更擅长做已知的事，但难以开发新的推理路径。

4/23/2025 2:00:43 PM

AI在线

微软发布全球首个1-bit大模型：内存缩至0.4 GB，参数只有0和±1，性能追平全精度

微软的BitNet b1.58 2B4T 的技术报告悄然上线。其实在开源社区里，关于极致低比特量化的大模型早就有各种传闻，这次微软研究院终于亮出底牌。 ——全球首个原生1-bit、规模高达20亿参数的开源大模型。

4/23/2025 12:11:40 PM

文摘菌

谷歌考虑与安卓制造商签署Gemini人工智能独家合作协议

在最近的一场反垄断审判中，曝光出谷歌的内部文件显示，该公司曾在去年考虑与多个安卓手机制造商，如三星等，达成独家合作协议。这些协议不仅涉及谷歌的搜索应用程序，还包括其最新推出的 Gemini 人工智能应用和 Chrome 浏览器。这一消息无疑引发了行业的广泛关注，尤其是在当前反垄断监管日益严格的背景下。

4/23/2025 11:00:53 AM

AI在线

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

大模型

一日一技：如何快速生成大模型工具调用的JSON Schema

大模型应用系列：两万字解读MCP

谷歌Gemini聊天机器人即将扩展至智能手表和汽车 取代 Google Assistant

谷歌确认：Gemini 聊天机器人今年将登陆智能手表、Android Auto

太争气了！百度的底气，李彦宏的决心：3万卡国产自研集群；一口气九个重磅发布，全方位支持MCP，百度在大模型应用时代的出招与押注

机械臂+大模型+多模态：打造人机协作具身智能体

揭秘大模型的魔法：训练你的tokenizer

谷歌“Wi-Fi密码”式的最瘦大模型

大模型向量去重的N种解决方案！

谷歌 Workspace 再添 AI 功能，音频概述与会议跟踪全新上线

大模型数据味蕾论

​谷歌 Gemini 月活跃用户突破 3.5 亿，仍与 ChatGPT 存在差距

谷歌Gemini用户暴涨至3.5亿！但仍被ChatGPT碾压

谷歌 AI 聊天机器人 Gemini 月活达 3.5 亿，与 ChatGPT 等竞品仍有差距

你的数据有多好，你的模型就有多强

学术打假！清华上交大研究颠覆认知：强化学习竟是大模型推理的"绊脚石"

微软发布全球首个1-bit大模型：内存缩至0.4 GB，参数只有0和±1，性能追平全精度

谷歌考虑与安卓制造商签署Gemini人工智能独家合作协议

谷歌Gemini聊天机器人即将扩展至智能手表和汽车取代 Google Assistant

谷歌 Gemini 月活跃用户突破 3.5 亿，仍与 ChatGPT 存在差距