AIGC宇宙 AIGC宇宙

大模型

对话顺丰科技网络安全总监梁博:大模型浪潮下物流网络安全的守与破

网络安全中的攻防一直是矛与盾的关系,它们是相互对立且不断发展的。 当大模型重塑产业形态时,网络安全的“攻防边界”正在被悄然改写,开始上演一场在用魔法打败魔法的战争,但最终谁会胜利,不得而知。 作为承载亿量级用户隐私数据、依托自动化场景运转的物流行业来说,既面临传统网络攻击的持续侵扰,又需应对大模型衍生的新型安全风险。
9/1/2025 9:26:54 AM

小白大模型底层教程:Zero-Shot 、One-Shot、Few-Shot,不训练模型,如何进行微调?

最近,有学员在公司要做一个用户反馈的智能分类功能,需要打上“积极”、“消极”、“中性”这样的标签,他的第一反应是要微调模型了,来问我如何微调模型,我说,并不一定要微调模型,可以先了解一下什么是:Zero-Shot Learning、One-Shot Learning、Few-Shot Learning。 假设我们现在有一个需要分类的用户反馈:“这新功能真是太棒了,体验感一流! ”第一种方式:Zero-Shot (零样本学习)我们直接向模型下达指令,不给它任何参考范例。
9/1/2025 9:04:51 AM
IT周瑜

我是如何玩转Claude100 万 Token上下文的?(附代码实战)

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)进入8月后,Anthropic 推出了一个相当让开发者兴奋的更新! 那就是:Claude Sonnet 4 现在支持 100 万 token 的上下文窗口 —— 这相当于在一次对话中处理 75 万个单词,或 7.5 万行代码。 (1个token相当于0.75个单词,1行代码大概10个单词长度。
8/29/2025 2:17:01 PM
云昭

数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!

大模型时代,模型、数据与各种「参数/脚本/许可证」等ML资产爆炸式增长,但真正能被发现、复用、合规使用的比例并不高,这正在成为AI生产力落地的「隐形天花板」。 以知名开源平台HuggingFace为例,平台目前托管超过150万个模型,每月还在新增约10万个模型,总数据存储量高达17PB。 然而超过半数的模型缺乏基本文档说明,不到8%的模型拥有明确的许可证。
8/29/2025 9:16:00 AM

聊聊大模型推理系统之 Arrow:自适应调度实现请求吞吐提升7.78倍背后的三大创新

在大模型(LLM)推理服务中,如何在输入/输出长度剧烈波动的现实场景下,依然保持高吞吐与低延迟? 传统静态资源分配策略往往导致计算资源严重浪费。 近期,来自中国科学技术大学、北航与京东的研究团队提出了一项名为 Arrow 的自适应调度机制,通过无状态实例与弹性实例池,实现了高达 7.78 倍 的请求服务速率提升。
8/29/2025 1:15:00 AM
机智流科技

一场「狼人杀」,考倒了一堆大模型

人工智能越来越像人,但“像人”到底意味着什么? 除了会解题、写文,它是否也能理解人类那种充满个性的推理方式? 比如在一场狼人杀游戏中,有人逻辑缜密、有人直觉敏锐、有人擅长伪装。
8/28/2025 1:49:00 PM
郑佳美

「精而巧」的端侧大模型为何火了?

大模型爆火伊始,很多厂商提的最多的就是自家的模型(云端大模型)参数有多大,性能有多好。 但近两年,相较云端大模型外,端侧大模型的热度被炒的越来越高。 很重要的原因在于,越来越多的厂商开始布局端侧大模型赛道。
8/27/2025 4:05:39 PM

多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快

今天,我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长! 高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。 MiniCPM-V 4.5 亮点一览 ?
8/27/2025 11:50:00 AM
徐咪

谷歌翻译大变革:实时同声传译+Gemini语言教练,跨国交流无障碍

AIbase报道 谷歌翻译近日宣布进行重大升级,正式推出基于其最新Gemini大模型技术的实时同声传译功能,彻底改变了传统的对话模式。 这项创新不仅能实现即时语音翻译,同时还配备了实时字幕,让跨语言沟通变得前所未有的流畅与高效。 本次升级的核心是Gemini强大的推理和多模态能力。
8/27/2025 11:42:26 AM
AI在线

马斯克掀桌子了,最强开源大模型诞生!Grok-2近万亿参数性能首曝

什么? 马斯克终于开源了Grok-2! 一大早,xAI正式官宣,向所有人开源Grok-2!
8/25/2025 9:10:00 AM

连烤面包机都能跑的“大模型”!DeepMind 推出超轻量 Gemma 3 270M(≈0.27B)

谷歌 DeepMind 发布了全新的 Gemma 3 270M。 它只有 2.7 亿参数,比七百亿参数级别的大模型轻了约 250 倍,却依旧保持强悍。 DeepMind 并不想拿它硬刚 GPT-4o 或 Gemini Ultra,它生来就为极致高效、本地部署而生。
8/25/2025 12:00:01 AM

大模型的基石:LLM预训练全解析

前言过去几年,大语言模型(LLM, Large Language Models)逐渐成为人工智能领域的核心驱动力。 从GPT到LLaMA,再到国内外涌现的大大小小模型,它们无一不是在“预训练”这一步骤中打下了坚实的基础。 可以说,预训练是LLM的生命起点,是它们从“婴儿”成长为“博学者”的关键阶段。
8/24/2025 9:24:07 AM
AI大模型应用开发

谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒

大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM

谷歌Gemini一次提示能耗≈看9秒电视,专家:别太信,有误导性

谷歌最近发布了一项关于其 AI 模型 Gemini 能源消耗的研究报告。 博客地址::,处理一个中位数的 Gemini 文本提示仅消耗约 0.26 毫升水(约五滴)、0.24 瓦时电力(相当于观看电视不到九秒),并产生 0.03 克二氧化碳排放。 注:中位数(Median)是统计学中用于描述数据集中趋势的指标之一。
8/22/2025 1:54:00 PM
机器之心

​谷歌为美国政府提供 Gemini 人工智能工具,助力数字化转型

谷歌近期宣布,将向美国联邦机构提供其最新的 Gemini 人工智能工具,几乎是以零费用的形式供给。 这一消息是在美国总务管理局(GSA)的一份联合声明中公布的,目的是加速政府对人工智能技术的采用。 谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)表示:“Gemini for Government 为联邦机构提供了全面的人工智能创新解决方案,帮助他们实现重要的使命。
8/22/2025 1:33:53 PM
AI在线

DeepSeek:世子之争,不过如此

最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
8/22/2025 1:29:21 PM
DataFun

专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述

Google 近期发布了一篇关于人工智能对环境影响的研究论文,指出现有的测量方式过于狭隘,提出了一种 “全栈” 方法来评估其 AI 模型 Gemini 的资源消耗。 这项研究声称,Gemini 在处理文本提示时,仅消耗0.26毫升的水,相当于五滴水,同时消耗0.24Wh 的能量,产生0.03克的二氧化碳当量。 Google 表示,在2024年5月至2025年5月期间,其每次排放总量已经减少了44倍。
8/22/2025 10:54:48 AM
AI在线

工业大模型,正在重写制造业的游戏规则

有没有想过,为什么特斯拉能在短短几年内颠覆百年汽车工业? 为什么海尔能让家电设计周期从几个月缩短到几周?  答案可能比你想象的更简单——工业大模型。
8/22/2025 9:15:51 AM
大数据AI智能圈