大模型

面试官：如何实现大模型的连续对话？

所有的大模型本身是不进行信息存储的，也不提供连续对话功能，所以想要实现连续对话功能需要开发者自己写代码才能实现。那怎么才能实现大模型的连续对话功能呢？大模型连续对话功能不同的框架实现也是不同的，以行业使用最多的 Java AI 框架 Spring AI 和 Spring AI Alibaba 为例，给大家演示一下它们连续对话是如何实现的。

7/21/2025 7:19:00 AM

磊哥

入局 AI Infra：程序员必须了解的 AI 系统设计与挑战知识

本文将分享传统后台工程师积累的技术栈和方法论，如何延续并迁移到 AI 系统，并系统性拆解 AI Infra 的硬件、软件、训练和推理挑战。作者 | rayrphuangAI Infra 和传统 Infra 有什么区别？程序员积累的技术栈和方法论，如何复用到 AI 系统架构设计上？

7/21/2025 6:30:00 AM

腾讯技术工程

大模型自信心崩塌！谷歌DeepMind证实：反对意见让GPT-4o轻易放弃正确答案

LLM太谄媚！就算你胡乱质疑它的答案，强如GPT-4o这类大模型也有可能立即改口。现在谷歌DeepMind携手伦敦大学的一项新研究发现：这种行为可能也不是谄媚，而是缺乏自信…….

7/20/2025 3:14:30 PM

西风

使用Python构建红楼梦人物知识图谱

一、python环境准备可详细参考使用Python操作nNeo4j中python环境的搭建。主要python库如下：复制二、数据准备数据一共有4列，381行，命名为triples.csv：source：实体起点。比如Alice指向Bob，Alice是起点，箭头开始的位置。

7/18/2025 10:35:30 AM

Python伊甸园

在现代科学的宏伟蓝图上，「万物理论」（Theory of Everything）代表着一个大一统的梦想：构建一个包罗万象、逻辑自洽的理论体系。它的雄心在于，用最少的本源法则，去解释宇宙间森罗万象的现象——从宇宙大爆炸的奇点、时空本身的弯曲，到基本粒子的相互作用、再到化学键的构成、DNA链的螺旋，直至智能的萌发与自我意识的诞生。然而，通往这一「梦想」理论的道路上，横亘着现代物理学最深刻的两大鸿沟：其一，是在宏观尺度上描述引力的广义相对论，与在微观尺度上主导一切的量子力学之间，存在着根本性的不相容；其二，物理学中的四大基本作用力（引力、电磁力、强核力、弱核力）至今未能被纳入一个统一的理论之中。

7/18/2025 10:19:49 AM

大模型转行土木工程！首个「打灰人」评估基准：检验读、改工程图纸能力

在AI竞速的今天，大语言模型（LLM）早已不满足只在象牙塔里「背书解题」。当GPT-4o刷题通过物理奥赛、DeepSeek熟练搭建网站之后，LLM必须直面一个更现实的问题：这些号称「专家级」的大模型，能不能真的下工地？能不能帮工程打工人减负？

7/18/2025 10:08:17 AM

刚刚，奥特曼放出ChatGPT「统一智能体」！惊呼真AGI，最卷打工人来了

今晚，ChatGPT和Deep Research、Operator「三剑客」首度合体！奥特曼亲自带队，25分钟高能直播重磅发布ChatGPT agent，开启人类和智能体协作全新时代。 ChatGPT agent的核心，是一个统一的智能体系统。

7/18/2025 9:59:35 AM

从聊天记录到数字资产：MIRIX 让记忆可买卖

大家好，我是肆〇柒。当下，LLM 智能体在各种复杂任务中表现得越来越出色。然而，记忆这一关键要素却始终制约着 LLM 智能体的进一步发展。

7/17/2025 10:08:30 AM

肆零柒

揭秘大模型的魔法：从Transformer架构开始，一步步揭开它的神秘面纱

大家好，我是写代码的中年人，本章我们正式进入Transformer架构的学习。从 ChatGPT 到文生图，从语音助手到AI绘本的自动生成，背后几乎都躲着一个强大的架构，它像一台“魔法机器”，能读懂语言、生成内容、甚至推理判断。但这一切魔法的根基，其实都是数学和工程的艺术结晶。

7/17/2025 9:47:07 AM

写代码的中年人

RAG 中文本分块全攻略，这个项目让效率狂飙

在构建 Retrieval-Augmented Generation（RAG）系统时，文本分块作为关键前置环节，其质量直接影响检索精度与生成内容的相关性。今天给大家推荐一个自己近期整理的项目 ——Awesome-Chunker，一站式聚合并复现了当下主流的文本分块技术，从经典方法到前沿算法应有尽有，助你在 RAG 开发中少走弯路！ 1、项目核心价值让分块不再是难题在 RAG 任务的探索之路上，相信不少研究者都和我一样，为寻找一个能系统提升分块质量的项目而苦恼。

7/17/2025 9:35:26 AM

Goldma

“我没错！”GPT-4o嘴硬翻车，AI在黑天鹅事件面前集体宕机

来自哥伦比亚大学、Vector人工智能研究所以及南洋理工大学的一个联合研究团队发现：人工智能模型在处理意外事件时的推理能力存在严重缺陷。即便是如GPT-4o和Gemini 1.5 Pro这样的顶尖视觉语言模型（VLM），其表现也远逊于人类，差距最高可达32%。论文地址：《黑天鹅》的研究指出，当前主流的AI评估方式普遍存在一个根本性问题：大多数基准测试围绕“常规模式”构建，也就是说，它们聚焦于可预测、规律清晰的视觉场景。

7/17/2025 7:19:35 AM

大数据文摘

月之暗面开源 Kimi-K2：万亿参数，超强Agent，全线 SOTA

2023年成立的中国AI初创公司月之暗面，刚刚发布了其最新重量级产品Kimi-K2。这是一款参数规模高达一万亿的开源大模型，以挑战GPT-4.1和Claude Sonnet 4为目标。 Kimi-K2没有配备专门的“推理模块”，却依然在多个关键领域打破性能壁垒，这一策略让人想起早前Deepseek的发布。

7/17/2025 7:12:45 AM

大数据文摘

大模型合辑 | 主权高墙还是开源洪流，技术路线生死竞速，WAIC 2025大模型论坛亮点前瞻

WAIC 2025 世界人工智能大会论坛：2025年7月26日-28日上海世博中心展览：2025年7月26日-29日上海世博展览馆2025年，全球大模型产业站在技术主权与开放创新的战略岔口。当千亿参数成为基座门槛，行业共识正从“规模竞赛”转向“价值落地”，一场关于生态主导权的暗涌已然成型：国家主导的主权模型与社区驱动的开源体系孰轻孰重？垂类场景的深度定制能否突破通用智能的垄断？

7/15/2025 3:13:00 PM

新闻助手

AI 为何能查天气、订机票？揭秘大模型背后的“神秘工具箱”

你有没有想过，为什么 AI 能回答“今天上海天气怎么样？ ”这种实时问题，甚至帮你预订机票？明明它的训练数据截止到去年，怎么会对现在的事情了如指掌？

7/15/2025 9:44:16 AM

红绿灯灯灯灯

首个旅游行业超级智能体上线，AI Agent落地垂直领域再下一城

7 月 11 日，马蜂窝的深度个性化的攻略定制产品 “AI 路书” 正式宣布向所有用户开放，同步上线 “AI 代订日本餐厅”、“菜单翻译”、“多语种实时翻译” 等几大实用工具，直击用户出境自由行核心痛点，实现从行程规划到目的地精细化服务的全链路智能化覆盖。 “AI 路书” 在内测时期就曾引起用户广泛关注，该产品突破传统 AI 被动响应模式，首创 “主动提问 - 需求校准 - 精准生成” 全流程。用户提交初步需求后，AI 会以选择题形式引导补充关键细节，例如 “是否需要避开台阶较多的景点？

7/11/2025 10:09:00 PM

新闻助手

一文搞懂 | 大模型为什么出现幻觉？从成因到缓解方案

1、前言随着大模型（Large Language Models, 以下简称LLM）迅猛发展的浪潮中，幻觉（Hallucination）问题逐渐成为业界和学术界关注的焦点。所谓模型幻觉，指的是模型在生成内容时产生与事实不符、虚构或误导性的信息。比如，当你询问“世界上最长的河流是哪条？

7/11/2025 9:50:52 AM

火山引擎云安全

多模态大模型的“安全锁”：SAPT 软提示调优技术

引言：多模态大模型的安全困境在人工智能技术飞速发展的当下，多模态大模型（VLM）正以前所未有的速度融入我们的生活，从智能助手到图像识别，从文本生成到跨模态任务处理，它们展现出了令人惊叹的能力。然而，随着 VLM 在实际应用中的广泛部署，一个不容忽视的问题逐渐浮出水面——其安全性漏洞正成为潜在的“ ticking bomb”。近期，一篇题为《The Safety Reminder: A Soft Prompt to Reactivate Delayed Safety Awareness in Vision-Language Models》的论文，为我们揭开了 VLM 安全性研究的新篇章。

7/11/2025 1:23:00 AM

果冻布丁兔

谷歌 Gemini 待发布新技能曝光：AI 帮你生成插画故事书

AI在线 7 月 10 日消息，外媒 Testing Catalog 公布了 Gemini 网页端一个即将推出的新技能：生成“插画故事书”。 TestingCatalog 针对 Gemini 网页版进行代码分析，确认谷歌正在开发名为“Storybook”的 Gemini 模块。随后，在新版 16.26.64.sa.arm64 中，又陆续出现更多与 Storybook 相关的资源。

7/10/2025 7:50:22 PM

清源

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

大模型