大模型

对话顺丰科技网络安全总监梁博：大模型浪潮下物流网络安全的守与破

网络安全中的攻防一直是矛与盾的关系，它们是相互对立且不断发展的。当大模型重塑产业形态时，网络安全的“攻防边界”正在被悄然改写，开始上演一场在用魔法打败魔法的战争，但最终谁会胜利，不得而知。作为承载亿量级用户隐私数据、依托自动化场景运转的物流行业来说，既面临传统网络攻击的持续侵扰，又需应对大模型衍生的新型安全风险。

9/1/2025 9:26:54 AM

小白大模型底层教程：Zero-Shot 、One-Shot、Few-Shot，不训练模型，如何进行微调？

最近，有学员在公司要做一个用户反馈的智能分类功能，需要打上“积极”、“消极”、“中性”这样的标签，他的第一反应是要微调模型了，来问我如何微调模型，我说，并不一定要微调模型，可以先了解一下什么是：Zero-Shot Learning、One-Shot Learning、Few-Shot Learning。假设我们现在有一个需要分类的用户反馈：“这新功能真是太棒了，体验感一流！ ”第一种方式：Zero-Shot (零样本学习)我们直接向模型下达指令，不给它任何参考范例。

9/1/2025 9:04:51 AM

IT周瑜

我是如何玩转Claude100 万 Token上下文的？（附代码实战）

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）进入8月后，Anthropic 推出了一个相当让开发者兴奋的更新！那就是：Claude Sonnet 4 现在支持 100 万 token 的上下文窗口 —— 这相当于在一次对话中处理 75 万个单词，或 7.5 万行代码。（1个token相当于0.75个单词，1行代码大概10个单词长度。

8/29/2025 2:17:01 PM

云昭

数据科学新风口？三大环节搞定ML「资产」管理，VLDB'25最新教程抢先看！

大模型时代，模型、数据与各种「参数/脚本/许可证」等ML资产爆炸式增长，但真正能被发现、复用、合规使用的比例并不高，这正在成为AI生产力落地的「隐形天花板」。以知名开源平台HuggingFace为例，平台目前托管超过150万个模型，每月还在新增约10万个模型，总数据存储量高达17PB。然而超过半数的模型缺乏基本文档说明，不到8%的模型拥有明确的许可证。

8/29/2025 9:16:00 AM

聊聊大模型推理系统之 Arrow：自适应调度实现请求吞吐提升7.78倍背后的三大创新

在大模型（LLM）推理服务中，如何在输入/输出长度剧烈波动的现实场景下，依然保持高吞吐与低延迟？传统静态资源分配策略往往导致计算资源严重浪费。近期，来自中国科学技术大学、北航与京东的研究团队提出了一项名为 Arrow 的自适应调度机制，通过无状态实例与弹性实例池，实现了高达 7.78 倍的请求服务速率提升。

8/29/2025 1:15:00 AM

机智流科技

一场「狼人杀」，考倒了一堆大模型

人工智能越来越像人，但“像人”到底意味着什么？除了会解题、写文，它是否也能理解人类那种充满个性的推理方式？比如在一场狼人杀游戏中，有人逻辑缜密、有人直觉敏锐、有人擅长伪装。

8/28/2025 1:49:00 PM

郑佳美

「精而巧」的端侧大模型为何火了？

大模型爆火伊始，很多厂商提的最多的就是自家的模型（云端大模型）参数有多大，性能有多好。但近两年，相较云端大模型外，端侧大模型的热度被炒的越来越高。很重要的原因在于，越来越多的厂商开始布局端侧大模型赛道。

8/27/2025 4:05:39 PM

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快

今天，我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型，成为行业首个具备“高刷”视频理解能力的多模态模型，看得准、看得快，看得长！高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA，且性能超过 Qwen2.5-VL 72B，堪称最强端侧多模态模型。 MiniCPM-V 4.5 亮点一览 ?

8/27/2025 11:50:00 AM

徐咪

谷歌翻译大变革:实时同声传译+Gemini语言教练，跨国交流无障碍

AIbase报道谷歌翻译近日宣布进行重大升级，正式推出基于其最新Gemini大模型技术的实时同声传译功能，彻底改变了传统的对话模式。这项创新不仅能实现即时语音翻译，同时还配备了实时字幕，让跨语言沟通变得前所未有的流畅与高效。本次升级的核心是Gemini强大的推理和多模态能力。

8/27/2025 11:42:26 AM

AI在线

马斯克掀桌子了，最强开源大模型诞生！Grok-2近万亿参数性能首曝

什么？马斯克终于开源了Grok-2！一大早，xAI正式官宣，向所有人开源Grok-2！

8/25/2025 9:10:00 AM

连烤面包机都能跑的“大模型”！DeepMind 推出超轻量 Gemma 3 270M（≈0.27B）

谷歌 DeepMind 发布了全新的 Gemma 3 270M。它只有 2.7 亿参数，比七百亿参数级别的大模型轻了约 250 倍，却依旧保持强悍。 DeepMind 并不想拿它硬刚 GPT-4o 或 Gemini Ultra，它生来就为极致高效、本地部署而生。

8/25/2025 12:00:01 AM

大模型的基石：LLM预训练全解析

前言过去几年，大语言模型（LLM, Large Language Models）逐渐成为人工智能领域的核心驱动力。从GPT到LLaMA，再到国内外涌现的大大小小模型，它们无一不是在“预训练”这一步骤中打下了坚实的基础。可以说，预训练是LLM的生命起点，是它们从“婴儿”成长为“博学者”的关键阶段。

8/24/2025 9:24:07 AM

AI大模型应用开发

谷歌技术报告披露大模型能耗：响应一次相当于微波炉叮一秒

大模型耗电惊人，舆论一浪高过一浪。现在，谷歌用硬核数据强势还击。一次Gemini查询仅能耗0.24wh，相当于微波炉运行1秒，排放0.03 g CO₂e，甚至比人放一次屁还少，同时消耗约5滴水。

8/22/2025 3:08:38 PM

谷歌Gemini一次提示能耗≈看9秒电视，专家：别太信，有误导性

谷歌最近发布了一项关于其 AI 模型 Gemini 能源消耗的研究报告。博客地址：：，处理一个中位数的 Gemini 文本提示仅消耗约 0.26 毫升水（约五滴）、0.24 瓦时电力（相当于观看电视不到九秒），并产生 0.03 克二氧化碳排放。注：中位数（Median）是统计学中用于描述数据集中趋势的指标之一。

8/22/2025 1:54:00 PM

机器之心

谷歌为美国政府提供 Gemini 人工智能工具，助力数字化转型

谷歌近期宣布，将向美国联邦机构提供其最新的 Gemini 人工智能工具，几乎是以零费用的形式供给。这一消息是在美国总务管理局（GSA）的一份联合声明中公布的，目的是加速政府对人工智能技术的采用。谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)表示:“Gemini for Government 为联邦机构提供了全面的人工智能创新解决方案，帮助他们实现重要的使命。

8/22/2025 1:33:53 PM

AI在线

DeepSeek：世子之争，不过如此

最近，一出“DeepSeek删豆包”的大戏直接冲上热搜，吃瓜群众们看得津津有味，还给这事儿起了个特接地气的名字——“大模型世子之争”。这事儿的来龙去脉嘛，说起来有点好笑：有位网友大概是手机内存告急，就跑去问DeepSeek大模型：“我手机内存不足，DeepSeek和豆包你俩必须删一个，你删谁？ ” 结果DeepSeek毫不犹豫地来了句：“删豆包！

8/22/2025 1:29:21 PM

DataFun

专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述

Google 近期发布了一篇关于人工智能对环境影响的研究论文，指出现有的测量方式过于狭隘，提出了一种 “全栈” 方法来评估其 AI 模型 Gemini 的资源消耗。这项研究声称，Gemini 在处理文本提示时，仅消耗0.26毫升的水，相当于五滴水，同时消耗0.24Wh 的能量，产生0.03克的二氧化碳当量。 Google 表示，在2024年5月至2025年5月期间，其每次排放总量已经减少了44倍。

8/22/2025 10:54:48 AM

AI在线

工业大模型，正在重写制造业的游戏规则

有没有想过，为什么特斯拉能在短短几年内颠覆百年汽车工业？为什么海尔能让家电设计周期从几个月缩短到几周？答案可能比你想象的更简单——工业大模型。

8/22/2025 9:15:51 AM

大数据AI智能圈

资讯热榜

马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升 2025 全球十大工程成就揭晓：DeepSeek入选大的来了：谷歌Gemini 3.0 Pro单次生成网页版操作系统，Win、Mac、Linux一网打尽日本政府对 OpenAI Sora 2 发布版权警告，要求遵守法律规定 OpenAI官宣自研首颗芯片，AI界「M1时刻」九个月杀到！联手博通三年10GW 马来西亚迎来 AI 新纪元，ChatGPT Go 助力数字化转型 OpenAI 与 Sur Energy 签署协议:25亿美元阿根廷数据中心项目启动 OpenAI与博通达成战略合作，推动AI算力革命

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文 LLM 代码算法芯片 Stable Diffusion 苹果腾讯 AI for Science Claude Agent 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具具身智能 Sora RAG 大语言模型 GPU 华为计算字节跳动 AI设计搜索大型语言模型 AGI 场景深度学习视频生成架构 DeepMind 预测视觉伟达 Transformer 编程 AI模型神器推荐亚马逊 MCP

大模型

对话顺丰科技网络安全总监梁博：大模型浪潮下物流网络安全的守与破

小白大模型底层教程：Zero-Shot 、One-Shot、Few-Shot，不训练模型，如何进行微调？

我是如何玩转Claude100 万 Token上下文的？（附代码实战）

数据科学新风口？三大环节搞定ML「资产」管理，VLDB'25最新教程抢先看！

聊聊大模型推理系统之 Arrow：自适应调度实现请求吞吐提升7.78倍背后的三大创新

一场「狼人杀」，考倒了一堆大模型

「精而巧」的端侧大模型为何火了？

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快

谷歌翻译大变革:实时同声传译+Gemini语言教练，跨国交流无障碍

马斯克掀桌子了，最强开源大模型诞生！Grok-2近万亿参数性能首曝

连烤面包机都能跑的“大模型”！DeepMind 推出超轻量 Gemma 3 270M（≈0.27B）

大模型的基石：LLM预训练全解析

谷歌技术报告披露大模型能耗：响应一次相当于微波炉叮一秒

谷歌Gemini一次提示能耗≈看9秒电视，专家：别太信，有误导性

​谷歌为美国政府提供 Gemini 人工智能工具，助力数字化转型

DeepSeek：世子之争，不过如此

专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述

工业大模型，正在重写制造业的游戏规则

谷歌为美国政府提供 Gemini 人工智能工具，助力数字化转型