AIGC宇宙 AIGC宇宙

大模型

ByteBrain团队VLDB25 | 面向不完美工作负载的无数据访问基数估计方法

导读本文基于ByteBrain团队实际生产场景,提出一项新的研究问题,即如何在无数据访问条件下,从不完美的查询工作负载中学习一个具备泛化能力与鲁棒性的基数估计模型;同时提出创新技术方案 GRASP (Generalizable and Robust, data-AgnoStic cardinality Prediction) ,借助组合式设计(Compositional Design)解决这一颇具挑战性的问题。 论文目前已经被VLDB25接收。 论文标题:Data-Agnostic Cardinality Learning from Imperfect Workloads论文作者:Peizhi Wu, Rong Kang, Tieying Zhang*, Jianjun Chen, Ryan Marcus, Zachary G.
6/26/2025 9:22:33 AM
ByteBrain

给Javaer看的大模型开发指南

一、概述二、什么是大模型三、大模型的特点    1. 无状态    2. 结构化输出    3.
6/26/2025 2:24:00 AM

有道推出“子曰3”模型,轻松破解数学难题,助力教育公平!

6月23日,网易有道正式推出并开源其最新的 “子曰3” 系列大模型,英文名为 Confucius3-Math。 这一专注于数学教育的推理模型,能够在普通的消费级 GPU 上高效运行,成为国内首个如此低成本高性能的 AI 教育工具。 在一系列数学推理任务中,“子曰3” 展现出了超越许多大规模通用模型的出色性能。
6/23/2025 6:00:39 PM
AI在线

万兴科技再升级!音视频多媒体大模型 2.0 震撼发布

在快速发展的人工智能领域,万兴科技再次引领潮流,正式发布了万兴天幕音视频多媒体大模型2.0。 这个升级版的大模型不仅进一步提升了音视频处理的能力,更为用户提供了更加智能和便捷的多媒体应用体验。 万兴科技的这一创新产品被广泛认为是提升内容创作效率和质量的游戏规则改变者。
6/23/2025 12:00:38 PM
AI在线

AI 也能 “闹情绪”?Gemini 调试失败躺平引发马斯克围观!

最近,一位用户在使用 Gemini2.5进行代码调试时,意外地收到了令人哭笑不得的回应:“我已经卸载了自己。 ” 这一幕引起了众多网友的关注,连科技大亨马斯克也纷纷现身评论区,表示对 AI 的 “情绪” 表示理解,甚至认为它的 “自杀” 行为可以理解。 这种情景引发了广泛讨论,许多人开始思考 AI 的 “心理健康” 问题。
6/23/2025 12:00:38 PM
AI在线

大模型缓存系统 LMCache,知多少 ?

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的大模型缓存系统 - LMCache。 在当前 AI 生态系统中,大型语言模型(Large Language Model,LLM)推理已逐渐演变为核心基础设施。 无论是在驱动代码智能助手(Copilot)、搜索引擎、文档理解工具,还是支撑企业级对话系统等场景中,绝大多数现实世界的 AI 应用都需要依赖运行在 GPU 集群上的高吞吐量推理引擎来完成模型调用任务。
6/23/2025 10:08:22 AM
Luga Lee

四个值得开发人员关注的 MCP 服务

大模型再聪明,也没法自己访问网页、读文件、连数据库,因为它就像被关在“盒子”里——只能对你说话,不能动手做事。 这时候,MCP Server(Model Context Protocol 服务器) 就登场了。 它就像一把钥匙,打开了 AI 的“手脚”。
6/23/2025 8:35:00 AM
zone7

MCP:AI 界的“USB-C接口”,如何让大模型“能说会干”?

你有没有遇到过这种情况? 让AI助手“帮我订明天去上海的机票”,它只会回你“建议你去XX平台搜索”,却没法真的点几下按钮把票订好? 或者让它“给同事发封邮件说会议改期”,它写好内容后还得你自己复制到邮箱发送?
6/23/2025 8:05:00 AM
用户007

​人人皆可创作音乐!腾讯 AI Lab 推出开源音乐生成大模型 SongGeneration

腾讯 AI Lab 正式推出并开源了一款名为 SongGeneration 的音乐生成大模型。 这一模型旨在解决音乐生成领域中普遍存在的音质、音乐性和生成速度等三大难题。 SongGeneration 采用了一种基于大型模型的融合架构,显著提升了音乐生成的音质表现,同时保持了较快的生成速度,甚至在部分方面超越了商业闭源模型的表现。
6/20/2025 11:01:11 AM
AI在线

揭秘大模型的魔法:从嵌入向量说起

大家好,我是写代码的中年人,上一篇文章我们介绍了词元的概念及如何训练自己的词元,待训练的数据变成词元后,我们发现词元(文本)之间没有任何联系,也就是说它们是离散的数据,所以我们没办法对词元进行计算。 将离散的文本转化为连续的向量表示,即嵌入向量(Embedding Vector)。 嵌入向量是大模型处理自然语言的起点,它将人类语言的符号转化为机器可以理解的数学表示。
6/20/2025 10:18:58 AM
写代码的中年人

零基础AI编程实战复盘!如何仅用7天做出2个网站?

5 月底临时需要在团队内做一场设计师 x AI Coding 的主题分享,因时间紧急(完全利用工作外时间),我决定放弃传统 PPT 的形式,从零开始利用 AI 工具链构建分享网站。 本文是这次 AI 协同实验的复盘,同时分享我对当前 Agent Coding 工具能力边界、Agent 交互、协作模式变化的新思考。 往期AI编程干货:.
6/20/2025 8:09:34 AM
Bay的设计奥德赛

谷歌 Gemini 客户端新增 AI 视频上传分析功能,支持 iOS / 安卓平台

谷歌现已为其 Gemini AI 客户端新增视频上传分析功能,用户将自己的应用更新至最新版本(iOS 用户需更新至 1.2025.2362302 版本,安卓用户需更新 Google 应用至 16.24 正式版)即可看到相应视频上传选项,无需订阅 Gemini 会员即可使用。
6/20/2025 6:46:03 AM
漾仔

ChatClient vs ChatModel:开发者必须知道的四大区别!

在 Spring AI/Spring AI Alibaba 框架中,ChatModel 和 ChatClient 都可以实现大模型的文本生成功能,例如聊天机器人,但二者是两种不同层级的 API 封装,分别针对不同的开发场景和需求设计。 1.功能定位与抽象层级1.1 ChatModel直接与具体的大语言模型(如通义千问、OpenAI 等)交互,提供基础的 call() 和 stream() 方法,用于同步或流式调用模型,具体使用如下。 复制它的特点是:使用简单、灵活性高。
6/20/2025 12:00:00 AM
磊哥

迈向人工智能的认识论:对人工智能安全和部署的影响以及十大典型问题

理解大型语言模型(LLM)的推理方式不仅仅是一个理论探索,它对于在现实世界中安全地部署人工智能具有直接的实践意义。 在医疗保健、法律、金融和安全等领域,人工智能做出错误决策或基于错误原因做出正确决策的代价可能极其高昂。 最后一部分将讨论研究结果对部署人工智能系统的意义,并就未来的安全策略和透明度标准提出建议。
6/19/2025 2:30:00 AM
晓晓

MiniMax 发布 M1 大模型,百万Token上下文+MoE架构,只花了 GPT-4 的零头!

近日,国内 AI 初创公司 MiniMax 发布了一款全新的语言大模型 MiniMax-M1。 有两个方面最引人注目:1.高达100万Token的上下文处理能力。 2.极具竞争力的训练成本效益。
6/18/2025 4:42:38 PM

谷歌 DeepMind 研究:Gemini AI 存“畏死”情绪,导致推理能力明显下降

科技媒体 TechCrunch 昨日(6 月 17 日)发布博文,报道称谷歌发布最新论文,发现其最新 AI 模型存在“畏死”行为特征,在《宝可梦》游戏中角色濒死时,会出现类似“恐慌”的异常决策,导致推理能力明显下降。
6/18/2025 1:45:39 PM
故渊

谷歌 Gemini 新增视频上传与分析功能,安卓、网页端已可用

谷歌Gemini 2.5 Pro和Flash全面开放,新增视频分析功能,用户可在安卓和网页端上传视频进行分析。Gemini能概述视频内容、查找特定部分或物品,并在回复中显示相关视频片段。目前该功能已上线,但暂不支持直接录制视频。#谷歌Gemini# #AI视频分析#
6/18/2025 1:21:35 PM
远洋

大模型的性能提升:KV-Cache

大语言模型(LLM)在生成文本时,通常是一个 token 一个 token 地进行。 每当模型生成一个新的 token,它就会把这个 token 加入输入序列,作为下一步预测下一个 token 的依据。 这一过程不断重复,直到完成整个输出。
6/18/2025 11:16:50 AM
曹洪伟