近日,新葡萄侯健博士关于分布式容错系统的工作“Reinforcement Learning based Multi-agent Resilient Control: From Deep Neural Networks to an Adaptive Law”(以下简称RLMRC)和“Random Grouping based Resilient Beamforming”(以下简称RGRB)分别被计算机/人工智能顶级会议The Thirty-Fifth AAAI Conference on Artificial Intelligence (AAAI-21)和控制领域顶级期刊Automatica录用。两项工作都以新葡萄作为第一完成单位录用和发表。
第一项工作RLMRC致力于将多智能体容错系统与多智能体强化学习两个领域相融合,通过强化学习中的DDPG策略,识别并剔除多智能体系统中的异样节点。随后将算法进一步扩展为分布式自适应策略,更加高效、准确的对异样节点进行甄别。所提方法将两个交叉领域进行贯通,为分布式容错问题提供了新的解决思路,并应用在机器人实物实验当中。第二项工作RGRB致力于通讯领域中具有异常节点的分布式波束形成问题。工作首先通过分组的策略进行各节点状态更新,实现无异常节点的波束形成能量最大化。接着利用强化学习中的多臂赌博机(MAB)方法将多个节点进行集合划分,并逐步淘汰所有具有错误可能的节点。
AAAI(Association for the Advance of Artificial Intelligence)协会是人工智能领域最主要的学术组织之一,其主办的年会AAAI Conference on Artificial Intelligence是世界范围的顶级人工智能学术会议之一,是中国计算机学会(CCF)推荐的人工智能领域A类会议,AAAI-21录取率约为21%。Automatica是IFAC(International Federation of Automatic Control)旗下系统和自动控制领域的顶级期刊,位列Q1区。
侯健博士于2013年6月毕业于浙江大学电气学院,师从颜钢锋教授和林志赟教授。于2016年4月加入我校信息学院丁佐华教授领衔的智能软件团队,主要从事多智能体系统与强化学习研究,并应用在航天、工业领域。