简单了解大模型（LLM）智能体，传统软件工程思维依然适用

作者：春哥大魔王 2024-11-14 10:48

说到大模型应用的理想态，我相信很多人都可以想到《钢铁侠》里面的贾维斯，可以根据环境、天气、对手火力等情况，给钢铁侠提供决策指导或者自主决策。大模型Agent就是人们希望借助大模型实现的类似于贾维斯一样智能助手能力，它具备环境感知能力、自主理解、决策制定以及行动执行的能力。在实现Agent架构过程中，有很多思维方式和传统软件工程思维是相似的。

说到大模型应用的理想态，我相信很多人都可以想到《钢铁侠》里面的贾维斯，可以根据环境、天气、对手火力等情况，给钢铁侠提供决策指导或者自主决策。

大模型Agent就是人们希望借助大模型实现的类似于贾维斯一样智能助手能力，它具备环境感知能力、自主理解、决策制定以及行动执行的能力。

在实现Agent架构过程中，有很多思维方式和传统软件工程思维是相似的。

软件工程是对物理世界的逻辑映射，所以面向对象思想大行其道（领域驱动的内核也是面向对象）。

Agent架构，则是面向目标的架构，通过感知、思考、行动的紧密结合，完成复杂任务。

图片

智能体（Agent）是一个可以自主思考，理解用户需求，还能进行任务拆解，通过调用外部工具扩展自身能力的大模型应用。

图片

主要包含以下几部分：推理规划、获取存储记忆、调用外部工具、执行推理动作。

图片

感知组件：是Agent与外部世界互动的桥梁，负责收集和解析环境数据，就像自动驾驶车辆的雷达、摄像头、传感器等感知元器件。

规划组件：是Agent的大脑，将目标任务拆解为可执行的步骤，制定实现目标的策略，比如项目管理Agent，可以根据项目日期调配资源，分配任务给组员。实现方式主要借助提示词工程，如ReAct、COT推理实现，使得Agent可以精准拆解任务，分步解决。

记忆组件：记忆分为长期记忆和短期记忆，允许Agent对记忆的存储和检索。短期记忆如客服的多轮对话，长期记忆的如存储用户特征，业务数据等，通常借助向量数据库实现快速存取。

工具使用：Agent通过调用外部工具增强自身能力。一般是各种工具或者API、插件等。

行动组件：是Agent执行任务的具体行为，完成对环境的响应。比如一个智能家居控制系统，可以根据环境湿度、光度调节家中照明。

图片

在具体落地上看，智能体（Agent）是一套工作流，比如可以用coze或者dify以工作流的方式搭建一个智能体，每个编排节点都是调用的外部的API（类似于function call）。

比如UC伯克利打造的端侧Agent，slogan就是“为函数调用而生！”

也可以和RAG结合，Agent通过RAG获取专业知识，如专业数据、学术报告、行业报告等，增强智能体知识的广度和深度。

图片

比如一份财报分析Agent，可以自动完成数据收集、分析、报告生成，技术上包括架构设计、Prompt设计、数据获取、RAG检索、LLM处理、报告生成等。

图片

实现Agent，可以借助如LangChain或者LlamaIndex主流大模型基础组件，里面已经对大模型、文档加载器、向量数据库、嵌入模型等做了抽象封装，可以极大简化开发过程。

但结合到具体业务之下扩展性较差，难以和企业中现有的IT系统进行低成本集成，也可以选择自建Agent架构的方法。

在Agent架构落地上，其实和传统的软件架构非常像。

最简单的思路，你可以将大模型视为一个高内聚的存储与检索基础服务。

比如，当用户通过Prompt发起一个需求时，一个路由组件对Prompt进行推理解析，以及意图分拆，并将不同的意图任务路由分发到不同的专有小模型上（可能是通过特定数据微调过的模型）。

图片

如果需要进行更复杂的任务拆解，可以将路由模块中的任务推理模块单独拆出来，然后将各种专有模型的答案汇总，生成一个较为全面的答案。

图片

如果想要提升请求响应的速度和解决模型幻觉和推理慢的问题，可以在架构中引入缓存或者向量数据库。

因为有了缓存，后续类似Prompt的检索答案生成速度就很快了。

图片

上面几种架构面对的都是较为简单的场景需求，但它们也算是Agent，一个标准的Agent应该是包含规划、执行、观测、重新规划几部分的。

图片

对于用户输入的Prompt，Agent首先做规划，将需求拆解成若干子任务，然后对每个子任务分别执行，同时对每一步执行过程和结果进行观测，如果出现观测不合格的情况，就重新规划-执行，直到观测结果合格生成答案。

图片

更复杂的Agent架构，是将以上几种模式组合起来。

图片

随着大模型越来越成熟，很多问题幻觉、成本问题陆续被解决了。

学习和掌握大模型也不再需要特别专业的知识了，掌握基本的微调基本上可以满足业务需求，基本上你可以把他当做一个存在和检索中间件使用了。

在了解和落地大模型应用过程中，越来越发现传统的软件工程的价值并不是消失，反而变大了。

因为软件工程思想，本质上是一种工程思维，是一种以合理抽象、低成本扩展为核心的建模思想，大模型再强大，目前也只能是工具属性，作为整个数字化、智能化业务架构中的一环，软件工程思维，可以非常直观的让你知道大模型应该嫁接在哪里，以及如何更好的发挥大模型的价值。

相关标签：

大模型智能

相关资讯

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云宣布完成对深度求索（DeepSeek）大模型的深度整合——正式上线DeepSeek-R1和V3原版模型的API接口，并创新性接入自研大模型知识引擎，同步开放联网搜索能力。凭借腾讯云在推理并发和生成速率等方面的优化，用户可以获得更加稳定、安全、低门槛的使用体验。开发者只需在云上简单三步即可实现API接口调用，并通过大模型知识引擎提供的文档解析、拆分、embedding、多轮改写等能力，灵活构建专属的AI服务。

2/8/2025 2:09:00 PM

AI在线

微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

近日，微信宣布其搜索功能接入 DeepSeek-R1模型，目前处于灰度测试阶段。部分用户在微信搜索框选择 AI 搜索时，可体验到 DeepSeek-R1提供的深度思考功能。微信方面表示，引入大模型旨在提升搜索的智能化和精准度，更好地理解用户搜索意图，分析处理复杂查询。

2/19/2025 11:18:00 AM

AI在线

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型

今日凌晨，全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布，DeepSeek-R1在 Hugging Face 上获得了超过10000个赞，成为该平台近150万个模型中最受欢迎的大模型。这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。

2/24/2025 9:30:00 AM

AI在线

testab