AIGC宇宙 AIGC宇宙

光学算法简化模拟人工智能训练

作者:ScienceAI
2023-03-15 04:27
编辑 | 白菜叶研究人员开发了一系列模拟和其他非常规机器学习系统,期望它们将证明比今天的计算机更节能。但是训练这些人工智能来完成它们的任务一直是一个很大的绊脚石。NTT 设备技术实验室和东京大学的研究人员现在表示,他们已经提出了一种训练算法(NTT 上个月宣布),该算法对让这些系统实现其承诺大有帮助。他们的结果建立在光学模拟计算机上,代表了在获得研究人员长期以来从「非常规」计算机架构中寻求的潜在效率增益方面取得的进展。现代人工智能程序使用一种名为人工神经网络的受生物学启发的架构来执行图像识别或文本生成等任务。控制计

光学算法简化模拟人工智能训练

编辑 | 白菜叶

研究人员开发了一系列模拟和其他非常规机器学习系统,期望它们将证明比今天的计算机更节能。但是训练这些人工智能来完成它们的任务一直是一个很大的绊脚石。NTT 设备技术实验室和东京大学的研究人员现在表示,他们已经提出了一种训练算法(NTT 上个月宣布),该算法对让这些系统实现其承诺大有帮助。

他们的结果建立在光学模拟计算机上,代表了在获得研究人员长期以来从「非常规」计算机架构中寻求的潜在效率增益方面取得的进展。

现代人工智能程序使用一种名为人工神经网络的受生物学启发的架构来执行图像识别或文本生成等任务。控制计算输出的人工神经元之间的连接强度必须使用标准算法进行修改或训练。这些算法中最突出的称为反向传播,它会更新连接强度以减少网络错误,同时处理试验数据。由于对某些参数的调整取决于对其他参数的调整,因此需要计算机进行主动信息传递和路由。

正如 Spectrum 在别处解释的那样,「错误反向传播就像反向运行推理,从网络的最后一层回到第一层;weight update 然后将来自原始前向推理运行的信息与这些反向传播的错误结合起来,以一种使模型更准确的方式调整网络权重。」

以复杂性换取效率的替代计算架构通常无法执行算法所需的信息传递。因此,网络的训练参数必须从整个硬件设置及其信息处理的独立物理模拟中获得。但是创建足够质量的模拟本身就具有挑战性。

「我们发现将反向传播算法应用于我们的设备非常困难。」参与该研究的研究人员之一、NTT 设备技术实验室的 Katsuma Inoue 说,「由于多种因素,例如物理噪声和不准确的建模,数学模型与真实设备之间始终存在差距。」

实施反向传播的困难促使作者研究和实施替代训练算法。它建立在一种称为直接反馈对齐(DFA)的算法之上,该算法于 2016 年在一篇论文中首次引入。该算法减少了训练期间传递信息的需要,因此减少了物理系统需要模拟的程度。作者的新「增强 DFA」算法完全消除了对任何详细设备模拟的需要。

光学算法简化模拟人工智能训练

论文链接:https://arxiv.org/abs/2204.13991

为了研究和测试算法,他们在光学模拟计算机上实现了它。其中,神经元之间的连接表示为穿过光纤环的光强度,而不是数字表示的数字。神经网络的连接用穿过环形光纤的光束的强度表示。「这是一个绝对必要的演示。」法国公共研究机构 FEMTO-ST 研究所的 Daniel Brunner 说。Brunner 开发了与研究人员在研究中使用的类似类型的非常规光子计算机。「这种特殊算法的美妙之处在于它在硬件中实现起来并不难——这就是为什么它如此重要。」

相关报道:https://spectrum.ieee.org/analog-ai-optical-training

相关标签:

相关资讯

阿尔特曼畅想 AI 未来:“魔镜”变革交互、智能体实现速度跃迁、新硬件奏响时代凯歌

科技媒体 The Decoder 昨日(10 月 3 日)发布博文,报道称山姆・阿尔特曼(Sam Altman)在 OpenAI 的 DevDays 活动上,分享了他对人工智能(AI)互动未来的想法。AI在线附上完整演讲视频如下: 构想未来 AI 系统阿尔特曼在活动中描述了一种可以改变我们使用计算机和与世界互动方式的人工智能系统。在他勾勒的未来场景中,用户可以走到一块“镜子”前,说出想要的任何内容。先进的推理模型和代理将为每个请求实时创建自定义界面,用户可以通过对话或导航个性化的视频源进行互动。阿尔特曼表示:“这将
10/4/2024 11:43:48 AM
故渊

提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。 官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。 该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。
11/3/2024 3:24:59 PM
沛霖(实习)

AI 赋能游戏开发:Valve 工程师借助 ChatGPT 改进《Deadlock》匹配算法

感谢Valve 工程师 Fletcher Dunn 昨日在社交媒体上分享了他使用 ChatGPT 改进《Deadlock》匹配算法的经历。他表示,ChatGPT 就像一个高级搜索引擎,能够帮助他找到所需的解决方案。Dunn 在《Deadlock》的测试阶段向 ChatGPT 提出了改进匹配算法的需求,ChatGPT 建议他使用匈牙利算法。Dunn 采纳了这个建议,并表示他对 ChatGPT 的强大功能感到惊讶。Dunn 认为,ChatGPT 的强大之处在于能够理解自然语言并提供相关信息。即使在专业领域如游戏开发,C
10/4/2024 6:40:36 PM
远洋
  • 1