AIGC宇宙 AIGC宇宙

大模型

入局 AI Infra:程序员必须了解的 AI 系统设计与挑战知识

本文将分享传统后台工程师积累的技术栈和方法论,如何延续并迁移到 AI 系统,并系统性拆解 AI Infra 的硬件、软件、训练和推理挑战。 作者 | rayrphuangAI Infra 和传统 Infra 有什么区别? 程序员积累的技术栈和方法论,如何复用到 AI 系统架构设计上?
7/21/2025 6:30:00 AM
腾讯技术工程

大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案

LLM太谄媚! 就算你胡乱质疑它的答案,强如GPT-4o这类大模型也有可能立即改口。 现在谷歌DeepMind携手伦敦大学的一项新研究发现:这种行为可能也不是谄媚,而是缺乏自信…….
7/20/2025 3:14:30 PM
西风

使用Python构建红楼梦人物知识图谱

一、python环境准备可详细参考使用Python操作nNeo4j中python环境的搭建。 主要python库如下:复制二、数据准备数据一共有4列,381行,命名为triples.csv:source:实体起点。 比如Alice指向Bob,Alice是起点,箭头开始的位置。
7/18/2025 10:35:30 AM
Python伊甸园

广义智能体理论:智能时代通向「万物理论」的新路径?

在现代科学的宏伟蓝图上,「万物理论」(Theory of Everything)代表着一个大一统的梦想:构建一个包罗万象、逻辑自洽的理论体系。 它的雄心在于,用最少的本源法则,去解释宇宙间森罗万象的现象——从宇宙大爆炸的奇点、时空本身的弯曲,到基本粒子的相互作用、再到化学键的构成、DNA链的螺旋,直至智能的萌发与自我意识的诞生。 然而,通往这一「梦想」理论的道路上,横亘着现代物理学最深刻的两大鸿沟:其一,是在宏观尺度上描述引力的广义相对论,与在微观尺度上主导一切的量子力学之间,存在着根本性的不相容;其二,物理学中的四大基本作用力(引力、电磁力、强核力、弱核力)至今未能被纳入一个统一的理论之中。
7/18/2025 10:19:49 AM

大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

在AI竞速的今天,大语言模型(LLM)早已不满足只在象牙塔里「背书解题」。 当GPT-4o刷题通过物理奥赛、DeepSeek熟练搭建网站之后,LLM必须直面一个更现实的问题:这些号称「专家级」的大模型,能不能真的下工地? 能不能帮工程打工人减负?
7/18/2025 10:08:17 AM

刚刚,奥特曼放出ChatGPT「统一智能体」!惊呼真AGI,最卷打工人来了

今晚,ChatGPT和Deep Research、Operator「三剑客」首度合体! 奥特曼亲自带队,25分钟高能直播重磅发布ChatGPT agent,开启人类和智能体协作全新时代。 ChatGPT agent的核心,是一个统一的智能体系统。
7/18/2025 9:59:35 AM

从聊天记录到数字资产:MIRIX 让记忆可买卖

大家好,我是肆〇柒。 当下,LLM 智能体在各种复杂任务中表现得越来越出色。 然而,记忆这一关键要素却始终制约着 LLM 智能体的进一步发展。
7/17/2025 10:08:30 AM
肆零柒

揭秘大模型的魔法:从Transformer架构开始,一步步揭开它的神秘面纱

大家好,我是写代码的中年人,本章我们正式进入Transformer架构的学习。 从 ChatGPT 到文生图,从语音助手到AI绘本的自动生成,背后几乎都躲着一个强大的架构,它像一台“魔法机器”,能读懂语言、生成内容、甚至推理判断。 但这一切魔法的根基,其实都是数学和工程的艺术结晶。
7/17/2025 9:47:07 AM
写代码的中年人

RAG 中文本分块全攻略,这个项目让效率狂飙

在构建 Retrieval-Augmented Generation(RAG)系统时,文本分块作为关键前置环节,其质量直接影响检索精度与生成内容的相关性。 今天给大家推荐一个自己近期整理的项目 ——Awesome-Chunker,一站式聚合并复现了当下主流的文本分块技术,从经典方法到前沿算法应有尽有,助你在 RAG 开发中少走弯路! 1、项目核心价值 让分块不再是难题在 RAG 任务的探索之路上,相信不少研究者都和我一样,为寻找一个能系统提升分块质量的项目而苦恼。
7/17/2025 9:35:26 AM
Goldma

“我没错!”GPT-4o嘴硬翻车,AI在黑天鹅事件面前集体宕机

来自哥伦比亚大学、Vector人工智能研究所以及南洋理工大学的一个联合研究团队发现:人工智能模型在处理意外事件时的推理能力存在严重缺陷。  即便是如GPT-4o和Gemini 1.5 Pro这样的顶尖视觉语言模型(VLM),其表现也远逊于人类,差距最高可达32%。  论文地址:《黑天鹅》的研究指出,当前主流的AI评估方式普遍存在一个根本性问题:大多数基准测试围绕“常规模式”构建,也就是说,它们聚焦于可预测、规律清晰的视觉场景。
7/17/2025 7:19:35 AM
大数据文摘

月之暗面开源 Kimi-K2:万亿参数,超强Agent,全线 SOTA

2023年成立的中国AI初创公司月之暗面,刚刚发布了其最新重量级产品Kimi-K2。 这是一款参数规模高达一万亿的开源大模型,以挑战GPT-4.1和Claude Sonnet 4为目标。 Kimi-K2没有配备专门的“推理模块”,却依然在多个关键领域打破性能壁垒,这一策略让人想起早前Deepseek的发布。
7/17/2025 7:12:45 AM
大数据文摘

大模型合辑 | 主权高墙还是开源洪流,技术路线生死竞速,WAIC 2025大模型论坛亮点前瞻

WAIC 2025  世界人工智能大会论坛:2025年7月26日-28日 上海世博中心展览:2025年7月26日-29日 上海世博展览馆2025年,全球大模型产业站在技术主权与开放创新的战略岔口。 当千亿参数成为基座门槛,行业共识正从“规模竞赛”转向“价值落地”,一场关于生态主导权的暗涌已然成型:国家主导的主权模型与社区驱动的开源体系孰轻孰重? 垂类场景的深度定制能否突破通用智能的垄断?
7/15/2025 3:13:00 PM
新闻助手

AI 为何能查天气、订机票?揭秘大模型背后的“神秘工具箱”

你有没有想过,为什么 AI 能回答“今天上海天气怎么样? ”这种实时问题,甚至帮你预订机票? 明明它的训练数据截止到去年,怎么会对现在的事情了如指掌?
7/15/2025 9:44:16 AM
红绿灯灯灯灯

首个旅游行业超级智能体上线,AI Agent落地垂直领域再下一城

7 月 11 日,马蜂窝的深度个性化的攻略定制产品 “AI 路书” 正式宣布向所有用户开放,同步上线 “AI 代订日本餐厅”、“菜单翻译”、“多语种实时翻译” 等几大实用工具,直击用户出境自由行核心痛点,实现从行程规划到目的地精细化服务的全链路智能化覆盖。 “AI 路书” 在内测时期就曾引起用户广泛关注,该产品突破传统 AI 被动响应模式,首创 “主动提问 - 需求校准 - 精准生成” 全流程。 用户提交初步需求后,AI 会以选择题形式引导补充关键细节,例如 “是否需要避开台阶较多的景点?
7/11/2025 10:09:00 PM
新闻助手

一文搞懂 | 大模型为什么出现幻觉?从成因到缓解方案

1、前言随着大模型(Large Language Models, 以下简称LLM)迅猛发展的浪潮中,幻觉(Hallucination)问题逐渐成为业界和学术界关注的焦点。 所谓模型幻觉,指的是模型在生成内容时产生与事实不符、虚构或误导性的信息。 比如,当你询问“世界上最长的河流是哪条?
7/11/2025 9:50:52 AM
火山引擎云安全

多模态大模型的“安全锁”:SAPT 软提示调优技术

引言:多模态大模型的安全困境在人工智能技术飞速发展的当下,多模态大模型(VLM)正以前所未有的速度融入我们的生活,从智能助手到图像识别,从文本生成到跨模态任务处理,它们展现出了令人惊叹的能力。 然而,随着 VLM 在实际应用中的广泛部署,一个不容忽视的问题逐渐浮出水面——其安全性漏洞正成为潜在的“ ticking bomb”。 近期,一篇题为《The Safety Reminder: A Soft Prompt to Reactivate Delayed Safety Awareness in Vision-Language Models》的论文,为我们揭开了 VLM 安全性研究的新篇章。
7/11/2025 1:23:00 AM
果冻布丁兔

揭开大模型的秘密!那些 “思考词” 背后藏着惊人的信息量

近日,来自中国人民大学、上海人工智能实验室、伦敦大学学院和大连理工大学的研究团队揭示了大模型推理过程中的一个重要发现:当模型在思考时,所使用的 “思考词” 实际上反映了其内部信息量的显著提升。 这一研究成果通过信息论的方法,为我们更好地理解人工智能的推理机制提供了新的视角。 论文地址:,会输出一些看似人类化的语言,比如 “嗯……”、“让我想想……” 或 “因此……”。
7/5/2025 7:46:41 AM
AI在线

Meta-Think ≠ 记套路,多智能体强化学习解锁大模型元思考泛化

本文第一作者为上海交通大学计算机科学四年级博士生万梓煜,主要研究方向为强化学习、基础模型的复杂推理,通讯作者为上海交通大学人工智能学院温颖副教授和上海人工智能实验室胡舒悦老师。 团队其他成员包括来自英属哥伦比亚大学的共同第一作者李云想、Mark Schmidt 教授,伦敦大学学院的宋研、杨林易和汪军教授,上海交通大学的温潇雨,王翰竟和张伟楠教授。 引言最近,关于大模型推理的测试时间扩展(Test time scaling law )的探索不断涌现出新的范式,包括① 结构化搜索结(如 MCTS),② 过程奖励模型(Process Reward Model ) PPO,③ 可验证奖励 (Verifiable Reward) GRPO(DeepSeek R1)。
7/4/2025 8:53:00 AM