用可扩展的增强学习来部署大规模控制系统论文标题为Efficient and scalable reinforcement learningfor large-scale network control,发表在2024年7月的Nature Machine Intelligence子刊上。作者来自北京大学。
本章首先提出了了一个概念,是如何部署一个可扩展的decision-making策略来构造一个大规模控制系统,其关键在于设计一个去中心化的决策优化策略(decentralized policy optimization network)以减少每一个agent之间的数据交互。传统的中心化学习(centralized learning)需要每一个agent都产生一个全局性的观测,然后将这些观测上传至服务器,服务器再根据观测针对每一个agent产生策略。这样做的缺陷是,算法的复杂度极其庞大,很容易就触碰到IO墙,以至于无法满足scalable的需求。所谓scalable decision-making即是将神经网络分布在边缘端,之后让这些边缘端的AI自主与外界进行交互并于其余的agent进行合 ...
