AIGC宇宙 AIGC宇宙

广大、清华等开发EdgeAIGC,让边缘缓存命中率飙升41%,AIGC延迟与成本双降

编辑丨&2024 年,ChatGPT、Sora、Stable Diffusion 等人工智能生成内容(AIGC)工具把算力需求推上新高,全球的推理请求连年出现高增长率递增,云端往返动辄出现极高延迟。 有没有这么一种方法,在保证服务质量的同时还可以优化 AIGC 模型的计算需求呢? 有的,广州大学、清华、浪潮联合团队给出的答案是——把大模型切成「即取即用的乐高」,用 TD3 算法实时拼搭。
图片

编辑丨&

2024 年,ChatGPT、Sora、Stable Diffusion 等人工智能生成内容(AIGC)工具把算力需求推上新高,全球的推理请求连年出现高增长率递增,云端往返动辄出现极高延迟。

有没有这么一种方法,在保证服务质量的同时还可以优化 AIGC 模型的计算需求呢?有的,广州大学、清华、浪潮联合团队给出的答案是——把大模型切成「即取即用的乐高」,用 TD3 算法实时拼搭。

在有限的边缘存储空间、带宽资源和计算资源的约束下,此次研究致力于减少用户模型服务请求的响应时间与成本。

该研究以「EdgeAIGC: Model caching and resource allocation for Edge Artificial Intelligence Generated Content」为题,于 2025 年 7 月 4 日发布在《Digital Communications and Networks

图片

EdgeAIGC 框架

整体框架由云服务中心、边缘服务层和用户层组成。

云服务中心包括一个具有丰富计算资源和存储空间的云服务器(CS),存储了许多预训练的 AIGC 模型,如文本转语音、文本转文本等,可以满足所有用户推理服务请求,但提供的服务也将花费更多的时间和成本。

图片

图示:EdgeAIGC 框架。

网络架构由 1+E+U 节点组成,CS 与 边缘服务器 ES 的计算资源由 A800 GPU 的数量表示。由于需要考虑到用户关注的效率与成本以及运营商关注的成本利润,研究者将会考虑优化所有请求服务执行中的平均响应时间与成本。

把框架搭好了,TD3 才好决定「存什么」、「给谁用」。

TD3 算法

在资源分配里,动作空间是连续的,带宽资源、计算资源分配等都是连续变量,TD3 算法能够有效解决连续动作空间的问题,并且对高维状态空间也有很好的适应性。

它可以学习最优的连续动作策略来确定最佳缓存决策和资源分配方案,并引入延迟更新策略网络的机制,使策略网络的更新更加稳定。

在本次研究中,问题 P 被形式化为一个马尔可夫决策过程(MDP),由状态空间、动作空间和奖励组成。

图片

图示:TD3 架构。

算法架构中包含了六个神经网络,通过 Actor、Critic 网络抑制 Q 值过估,延迟更新策略网络防止震荡。

训练过程里,Actor 网络输出策略发生剧烈变化,难以收敛到稳定的策略,容易错过最优解。这证明 TD3 算法对学习率的设置有较高要求。TD3 通过双评论家网络和延迟更新策略显著提高了学习效率和稳定性,并在奖励优化方面比 DDPG 算法提高了约 1.72%。

随着用户数量的增加,模型命中率也增加。在此过程中,TD3 算法的模型命中率始终优于其他基准算法,与 DDPG、GCRAS、PCRAS相比最大改善率分别为为 41.06%,50.93%,57.85%。

小结

这是一种基于 TD3 算法的边缘智能模型缓存与资源分配联合优化框架。通过构建 EdgeAIGC 网络架构,结合动态模型流行度等,实现了边缘服务器的模型缓存决策及带宽和计算资源的协调分配。

与基线方法相比,TD3 算法将模型命中率至少提高了约 41.06%,为未来边缘计算与 AIGC 的融合提供了新的思路和方法。

相关资讯

ChatGPT一路狂飙,我们的安全带在哪儿?

自去年 11 月 30 日发布以来,OpenAI 的 ChatGPT 已经在短短的三个月内席卷了各个社会领域:普通人用它当搜索引擎;办公室文员用它来写文案、做会议纪要,程序员用它来写代码。
3/7/2023 4:41:00 PM
机器之心

十二年穿越周期,“AIGC第一股”出门问问今日挂牌上市

4月24日,“AIGC第一股”出门问问有限公司(简称“出门问问”或“公司”,股份代号:2438),正式登陆香港交易所主板,股份代号为2438.HK,每手买卖单位1,000股股份。截至9:40,出门问问报于每股3.23港元,市值48.18亿港元。据配发结果公告显示,此次出门问问(02438.HK)全球发售8456.8万股股份,国际发售4228.4万股股份,公开发售4228.4万股股份,其中,公开发售获117.39 倍认购。最终发售价每股3.8港元,全球发售净筹约2.67亿港元。据悉,出门问问在招股期认购异常火爆,创下
4/24/2024 11:18:00 AM
新闻助手

被《AIGC体验派》硬控25分钟,大模型落地还能这么玩?

2024年的大模型厂商在做什么?拿着「锤子」,满世界找「钉子」。回想2022年,文生图的爆发让「AIGC」走进大众的视线。2023年,大模型热潮来袭,人们津津乐道的是AI对话机器人如何有趣,以及背后的大模型技术有什么进展。2024年,大部分人的关注焦点转移到了应用层,希望AIGC从「有趣」变为「有用」。实际上,在金融、教育、医疗、能源、汽车等各行各业,我们都已看到AIGC初步显现的影响力和未来巨大的想象空间。我们也知道,大模型在各行各业落地是一个渐进的过程,新技术带来的深远影响将在很长的一段周期内逐渐显现。本质上,
6/14/2024 12:09:00 PM
机器之心
  • 1