大模型

一日一技：如何快速生成大模型工具调用的JSON Schema

在使用大模型的工具调用时，我们需要编写JSON Schema，例如下图的tools字段的值：图片这个Schema写起来非常麻烦，括号太多了，看着眼花。不信你肉眼看看，你需要几秒钟才能分清楚type: "object"跟哪个字段在同一层级？这个Schema有没有什么办法自动生成呢？

4/27/2025 7:57:50 AM

kingname

大模型应用系列：两万字解读MCP

MCP通过建立统一的工具连接规范，为Agent开发提供了标准化接入框架。该协议不仅简化了Agent与多样化系统的集成过程，还显著扩展了Agent的任务处理能力，使开发者能够更高效地构建具备复杂功能的智能体，实现从基础查询到业务决策的多层次应用。那么，如何进一步理解MCP呢？

4/27/2025 2:22:00 AM

曹洪伟

太争气了！百度的底气，李彦宏的决心：3万卡国产自研集群；一口气九个重磅发布，全方位支持MCP，百度在大模型应用时代的出招与押注

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）4月25日，一年一度的百度开发者大会会场如约到来，这是中国国内首家AI巨头在后DeepSeek时代的全新产品的公开亮相。进入2025以后，李彦宏带领下的百度正在如何思考新的AI应用形态？百度在AI应用爆发时代都做了哪些准备？

4/25/2025 1:51:49 PM

云昭

机械臂+大模型+多模态：打造人机协作具身智能体

在人工智能快速发展的浪潮中，多模态大模型已成为技术前沿，使AI能够同时理解文本、图像、音频等多种信息。这一突破为具身智能体开辟了新天地。最近我在github中就找到了一个这样好玩的项目vlm_arm，其将机械臂与多模态大模型结合，打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。

4/25/2025 2:30:00 AM

贝塔街的万事屋

揭秘大模型的魔法：训练你的tokenizer

大家好，我是写代码的中年人。在这个人人谈论“Token量”、“百万上下文”、“按Token计费”的AI时代，“Tokenizer（分词器）”这个词频频出现在开发者和研究者的视野中。它是连接自然语言与神经网络之间的一座桥梁，是大模型运行逻辑中至关重要的一环。

4/25/2025 12:20:00 AM

写代码的中年人

Gemma 3 的“低门槛 AI”计划露面了，谷歌这次直接把 Gemma 3 做成了“跑得动的”AI。 —Gemma-3-27b-it-qat-q4_0-gguf 听上去像个 Wi-Fi 密码，其实却是谷歌迄今为止最精简的大模型是的，不再只属于高端服务器和土豪显卡，普通玩家的游戏卡，甚至手机，都能一试身手。这波操作的核心是三个字：量化训练（Quantization-Aware Training, QAT）。

4/24/2025 2:13:00 PM

文摘菌

大模型向量去重的N种解决方案！

简单来说，“向量”Vector 是大模型（LLM）在搜索时使用的一种“技术手段”，通过向量比对，大模型能找出问题的相关答案，并且进行智能回答。向量简介Vector 是向量或矢量的意思，向量是数学里的概念，而矢量是物理里的概念，但二者描述的是同一件事。 “定义：向量是用于表示具有大小和方向的量。

4/24/2025 11:09:13 AM

磊哥

大模型数据味蕾论

AI大模型就像一位厨师，预训练数据就是这位厨师的味蕾。没有经过训练的味蕾，再好的食材也无法变成美味佳肴。没有优质的预训练数据，再强大的计算资源也打造不出卓越大模型。

4/24/2025 9:26:13 AM

大数据AI智能圈

你的数据有多好，你的模型就有多强

在AI大战烽火连天的今天，所有人都在追逐参数规模的增长和架构的优化。然而，行业内的一个秘密正在悄然成形：拥有独特数据资产的企业正在构筑起难以逾越的竞争壁垒。数据，而非算法，正成为区分强弱的决定性要素。

4/24/2025 12:40:00 AM

大数据AI智能圈

学术打假！清华上交大研究颠覆认知：强化学习竟是大模型推理的"绊脚石"

【研究颠覆】清华大学与上海交通大学联合发表的最新论文，对业界普遍认为"纯强化学习（RL）能提升大模型推理能力"的观点提出了挑战性反驳。研究发现，引入强化学习的模型在某些任务中的表现，反而逊色于未使用强化学习的原始模型。【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中，RL模型在低采样次数（k值）下准确率提升，但在高k值时问题覆盖率显著下降编码任务:RLVR训练模型在HumanEval 等测试中单样本pass@1分数提高，但在高采样数（k=128）时覆盖率下降视觉推理:Qwen-2.5-VL-7B模型在多模态任务中表现一致，RL未改变其基本问题解决策略【学界争议】研究结果引发学界激烈讨论:支持方认为RL提高了采样效率但限制了推理能力开发反对方指出可能是奖励结构缺陷而非RL本身问题中立观点建议结合蒸馏等其他方法增强推理【本质思考】研究团队提出关键区分:能力:模型解决问题的潜质与逻辑链条效率:在给定能力范围内得出答案的速度与稳定性强化学习更像是"能力调控器"而非"能力创造器"，它能让模型更擅长做已知的事，但难以开发新的推理路径。

4/23/2025 2:00:43 PM

AI在线

微软发布全球首个1-bit大模型：内存缩至0.4 GB，参数只有0和±1，性能追平全精度

微软的BitNet b1.58 2B4T 的技术报告悄然上线。其实在开源社区里，关于极致低比特量化的大模型早就有各种传闻，这次微软研究院终于亮出底牌。 ——全球首个原生1-bit、规模高达20亿参数的开源大模型。

4/23/2025 12:11:40 PM

文摘菌

Llama 4 刷榜作弊引热议，20 万显卡集群就做出了个这？

昨天一早，Meta 了放出自家用了 20 万显卡集群训练出的 Llama 4 系列模型，其中包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。消息一出，直接引爆了大模型圈。 Meta 还特意强调，这些模型都经过了大量未标注的文本、图像和视频数据的训练，视觉理解能力已经到了 Next level，有种在大模型领域一骑绝尘的既视感。

4/23/2025 10:44:00 AM

郑佳美

可信AI技术获中国电子学会科技进步一等奖，蚂蚁数科助力破解大模型应用“安全可信”难题

4月19日，2024年度中国电子学会科学技术奖在第十八届中国电子信息年会揭晓并颁奖，由清华大学、北京中关村实验室和蚂蚁集团等单位共同完成的联合项目《高效协作的互联网动态行为安全可信关键技术与应用》荣获科技进步奖一等奖。近年来，网络环境日益复杂，恶意流量攻击和隐蔽未知应用风险在互联网中泛滥，如何构建一个更安全可信的互联网环境，成为学术界和产业界的共同追求。由清华大学、北京中关村实验室及蚂蚁集团等联合提出的“高效协作的互联网动态行为安全可信关键技术”，创新提出了分层传递和高效求解的智能协作体系技术思路，通过模型表达、知识共享和应用支撑，在实现安全信息获取、传递和协作的同时，显著提升了互联网应对未知应用风险的能力。

4/21/2025 9:47:00 AM

新闻助手

银行科技转型加速，大模型应用深入核心业务

随着银行业在数字化型中面临的挑战与压力日益加大，越来越多的银行开始将大模型技术融入到核心业务中，而不仅仅停留在简单的聊天机器人应用上。最新的财报数据显示，国内一些主要银行在科技投入和大模型应用方面取得了显著进展，但同时也显露出投入的分化趋势。根据钛媒体 App 对十家主要银行的分析，包括六大国有银行及几家股份制银行，发现其中六家银行的科技投入出现了缩减。

4/18/2025 5:00:39 PM

AI在线

6周搞定18个月的工作量，爱彼迎不满老工具，暴力循环大模型怒迁代码，效果出奇好，怎么回事？谷歌亚马逊也做过类似的事

编辑 | 云昭Anthropic首席执行官Dario时不时就会出来发声，声称人工智能即将取代人工编码，或者抛出一个惊人的数字，预测在短短6个月内将有90%的编码工作将被AI取代。这种措辞无疑有夸大的成分，但这里想说的是，这并非空穴来风，或许6个月内AI不会取代90%的程序员，但取代90%的编程工作不无可能！因为企业接纳和适配大模型的速度远比我们想象得要快！

4/18/2025 4:05:39 PM

云昭

谷歌的“双子星”，正在围剿一众大模型

编辑 | 云昭继昨天凌晨OpenAI推出满血o3、o4-mini之后，没想到谷歌迈着“LLM王者”的步伐给出了自家的模型SOTA研究Gemini2.5 Flash。如果说o3主打的是“干实事”，那么谷歌这次的新发布则是告诉我们：什么是“成本可控”的极致性价比。这次的发布以后立马引来一众开发者的讨论，不过这次不是负面的，而是全面的好评。

4/18/2025 3:53:03 PM

云昭

华晨宝马与字节跳动火山引擎合作，推动AI赋能汽车营销

近日，华晨宝马领悦数字信息技术有限公司（“领悦”）与字节跳动旗下火山引擎达成合作，双方将在人工智能(AI)技术的帮助下创新汽车营销服务。此次合作通过AI技术实现精准的产品匹配与购车建议，优化内容引导，提升用户购车体验及经销商运营效率。宝马集团大中华区总裁高翔表示，AI是宝马打造更智能、贴心出行解决方案的关键，正在加速融入研发、生产、供应链、产品、服务及运营各个环节。

4/18/2025 3:00:39 PM

AI在线

知识图谱与其它知识库的关系

知识图谱与传统知识库：解构数据连接的哲学传统企业数据库和知识库长期以来一直被当作信息的仓库，它们好比一个个分隔的抽屉，每个抽屉里都整齐地存放着特定类型的信息。企业习惯了这种存储方式，却很少思考：我们真的需要将信息放在不同的抽屉里吗？知识图谱打破了这种传统思维，它将信息视为一张巨大的网络——每条信息都是网络中的一个节点，节点之间通过各种关系连接起来。

4/18/2025 12:49:58 PM

大数据AI智能圈

资讯热榜

AI视频资讯早读！7个产品更新+8个案例精选 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放李飞飞/DeepSeek前员工领衔，复现R1强化学习框架，训练Agent在行动中深度思考大模型向量去重的N种解决方案！全球首部AI制作长片《海上女王郑一嫂》震撼上映：科技与艺术的碰撞大模型应用系列：两万字解读MCP GPT-4o图像生成功能现已集成至自定义GPTs OpenAI 新推出的 GPT-4.1 模型面临对齐性下降的挑战

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景人形机器人预测百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成训练干货合集应用大型语言模型科技亚马逊智能体 DeepMind 特斯拉

大模型

一日一技：如何快速生成大模型工具调用的JSON Schema

大模型应用系列：两万字解读MCP

太争气了！百度的底气，李彦宏的决心：3万卡国产自研集群；一口气九个重磅发布，全方位支持MCP，百度在大模型应用时代的出招与押注

机械臂+大模型+多模态：打造人机协作具身智能体

揭秘大模型的魔法：训练你的tokenizer

谷歌“Wi-Fi密码”式的最瘦大模型

大模型向量去重的N种解决方案！

大模型数据味蕾论

你的数据有多好，你的模型就有多强

学术打假！清华上交大研究颠覆认知：强化学习竟是大模型推理的"绊脚石"

微软发布全球首个1-bit大模型：内存缩至0.4 GB，参数只有0和±1，性能追平全精度

Llama 4 刷榜作弊引热议，20 万显卡集群就做出了个这？

可信AI技术获中国电子学会科技进步一等奖，蚂蚁数科助力破解大模型应用“安全可信”难题

银行科技转型加速，大模型应用深入核心业务

6周搞定18个月的工作量，爱彼迎不满老工具，暴力循环大模型怒迁代码，效果出奇好，怎么回事？谷歌亚马逊也做过类似的事

谷歌的“双子星”，正在围剿一众大模型

华晨宝马与字节跳动火山引擎合作，推动AI赋能汽车营销

知识图谱与其它知识库的关系