AIGC宇宙 AIGC宇宙

企业智能体:为AI投资带来丰厚回报

作者:
2024-12-05 02:50
基于AI的智能体当下可谓风头正劲。 最近几个月来,这个话题也已渗透到不少技术供应商的宣传和营销当中,包括Salesforce、Microsoft、ServiceNow、SAP、亚马逊云科技以及谷歌。 从多方面来讲,人们对AI智能体的关注有其道理:智能体代表着生成式AI的下一个发展阶段,有望进一步提高AI的自主性水平。

企业智能体:为AI投资带来丰厚回报

基于AI的智能体当下可谓风头正劲。最近几个月来,这个话题也已渗透到不少技术供应商的宣传和营销当中,包括Salesforce、Microsoft、ServiceNow、SAP、亚马逊云科技以及谷歌。从多方面来讲,人们对AI智能体的关注有其道理:智能体代表着生成式AI的下一个发展阶段,有望进一步提高AI的自主性水平。智能体不仅可以像聊天机器人那样回答问题,还能接受人类甚至是其他智能体委托给它们的任务。而且与AI领域的其他成果一样,智能体同样保持着迅猛的发展速度。

短短两个月前,关于智能体的新闻和产品公告还主要集中在应用程序内等传统场景之下。这类智能体的作用是在平台环境下实现个体的生产力与任务自动化。例如,可以设计一个定期扫描多份文档、总结其中信息并向最终用户推荐相应操作的个人生产力代理。以Salesforce为例,这可能意味着其产品会每季度扫描潜在客户渠道,观察是否存在新的数字营销机会并提供策略建议。这些个人生产力智能体将为希望快速完成更多工作的最终用户带来巨大助益。

个人生产力智能体的局限性

虽然个人生产力智能体作用不小,但影响力或者说想象空间却相当有限。首先需要承认,这些部署在应用平台内的个人生产力智能体其实很强,能够提升现有技术投资来展示智能体的整体潜力,而且会随着时间推移而加深用户与平台之间的联系。然而,真正的业务影响力应当让企业看到明确的投资回报并为此加大资源投入,而不只是带来种种“锦上添花”的效果。遗憾的是,我认为个人生产力智能体无法达到这样的地位,具体原因有三。

遗憾团队使用往往反而影响业务开展——当一名员工找到更高效的工作方式时,那确实不错,但却远不足以带动其他团队成员乃至整个职能架构来改进工作流程。换句话说,一、两个开发人员编程速度加快是好的,但这不太可能推动应用程序的提前发布。

个人生产力的提升不会增加高级用户或者超级用户的数量——虽然AI拥有巨大潜力,但我们观察到个人生产力应用的技术突破似乎迟迟没有来临。几十年下来,人人的电脑里都装上了电子表格软件,而虽然这些软件也一直在不断进步,但高级用户在总体用户中的比例是否发生了变化?答案似乎是否定的。当然,也没有明确的办法来定义高级用户并量化他们的影响力。

面向个人的工具难以由IT部门统一管理和掌控——多年以来,许多工具都实现了个人生产力的提升。低代码和无代码工具供应商们一直宣扬让人们自主开发工具来实现自我赋能。虽然确有典型案例表明这种方式对个别人有效,但这些工具也给IT部门造成了不小的麻烦。应用程序蔓延就是种明确趋势,许多人都在独自创建功能大体相同的应用程序。随着时间推移,其中大部分工具自然就被遗忘掉甚至从未被真正使用。这些平台产生的成本、治理和安全问题对于资金本就紧张的IT团队来说,无疑构成了严峻挑战。

真正有影响力的智能体应当以企业为中心

同样的,个人生产力智能体虽也具有实用性,但生成式AI的生态系统仍需要提供更可量化的商业价值来证明战略投资的合理性。最近一段时间,已经出现了相关的积极势头。UiPath就通过开发企业智能体来匹配其机器人流程自动化解决方案,从而实现更为高效的业务流程。通过采用不同的治理和智能体开发方法,UiPath在构建跨企业智能体应用方面获得了更大的施展空间。

再来看其他案例。IBM等咨询公司也在重新调整其交付企业系统集成项目的方式,运用自己的企业内智能体开发体系来缩短交付周期并提高项目质量。在研究这些公司及其他致力于企业AI智能体厂商时,我们发现尽管具体技术形式不同,但其实施仍然依赖于过去40年发展而成的完善IT实践。其中的核心原则包括:

从有意义的跨职能业务问题起步——就是说项目应当至少拥有一项受到影响的业务指标,例如部署的技术应在不增加销售人员数量的前提下增加收入。

高度重视变更管理——虽然难以对高级用户在总体用户中的比例做出精准量化,但大多数IT负责人表示,只有不足20%的用户属于高级使用者。因此,引入任何技术进步都必须要能渗透至普通用户、或者配合充分的变更管理才能得到广泛应用。例如,凭借大语言模型提供的核心功能,智能体成功以在线咨询的形式为普通用户带来帮助,并由此得到了迅速普及。

建立坚实的技术基础——取得成功的一大前提,在于建立起坚实的技术基础。智能体应用涉及大量不同数据,因此必须确保数据得到妥善保护。随着时间推移,以可靠的计算与存储形式存在的基础设施也非常重要,这将决定应用程序能否被扩展至整个企业范围。

以深思熟虑的方式设计应用框架——要确保项目稳步推进,我们需要一整套明确的目标框架来衡量整个项目生命周期。这些目标和量化标准应当来自内部开发或者由信誉良好的第三方提供的应用框架。除了IBM Consulting Advantage等解决方案之外,Zavvis等初创公司也在尝试将常见的职能角色(例如CFO)归入自动化框架。

注意培养用户粘性,并确保多年可用——一时兴起建立的项目纯粹是心理安慰。不要单纯着眼于解决当下的问题,而应当在设计解决方案时确保其成为新的运营流程,能够切实提供价值并防止项目废弃引发的风险。

AI投资回报=企业智能体+成熟IT实践

再闪重申,我并不是要贬低当前这波个人生产力智能体。它们确实效果不错,而且老实说,它们也是让决策者们适应和了解AI的合理形式。然而,当领导团队决定押注新技术时,我认为门槛还应该再高一些。

好消息是,如今越来越多的云服务商、企业和初创技术供应商都在为此积极努力,此类新型AI智能体也在各种实践场景下得到应用和发挥。总之,面对大好的形势,请各位戒骄戒躁、保持谨慎,毕竟以往因盲目冒进而折戟沉沙的企业级技术已然难计其数。

相关标签:

相关资讯

关于智能体 Agent 的实现技术之思维链和函数调用 (function call) 的思考

Agent技术也被业界称为智能体技术,本质上是使得大模型具备独立思考和解决问题的能力;被广泛应用于各种应用场景,而且也被称为是实现通用人工智能的一种技术手段。 但在此之前对于智能体的理解比较肤浅,而今天突然发现原来智能体没我们想象中的那么简单,也没想象中的那么复杂。 今天我们就从Agent的两个实现技术之思维链和函数调用来重新理解智能体。
3/27/2025 8:10:00 AM
AI探索时代

关于大模型智能体意图识别不准确问题:function call 的缺陷

最近在研究大模型智能体也就是Agent的过程中,遇到了一个很严重的问题,直接影响到Agent的质量和效果;那就是意图识别不准确,也可以说是Agent的幻觉问题。 其产生的原因就在于大模型有时无法准确识别出用户意图,无法准确调用相应的函数。 意图识别不准确现在大模型技术在应用方面,主要有两大方向;其一就是大模型的创作能力,简单来说就是内容生成方面,如生成图片,文字,视频,也包括RAG等。
4/1/2025 12:10:00 PM
DFires

机械臂+大模型+多模态:打造人机协作具身智能体

在人工智能快速发展的浪潮中,多模态大模型已成为技术前沿,使AI能够同时理解文本、图像、音频等多种信息。 这一突破为具身智能体开辟了新天地。 最近我在github中就找到了一个这样好玩的项目vlm_arm,其将机械臂与多模态大模型结合,打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。
4/25/2025 2:30:00 AM
贝塔街的万事屋
  • 1