人机所团队获2021年腾讯开悟多智能体强化学习大赛季军-西安交通大学-人工智能学院

当前位置: 首页 > 新闻动态 > 正文

人机所团队获2021年腾讯开悟多智能体强化学习大赛季军

发布时间：2022-05-17 点击量：

4月14日，第二届“腾讯开悟多智能体强化学习大赛”决赛在成都落幕，来自20多所顶尖高校的AI研发团队，经过半年来的比拼，共有4支团队进入决赛。经过激烈角逐，由兰旭光教授指导的XJTU_太初队荣获本届大赛季军。

本次比赛遵循王者荣耀游戏环境规则：玩家（智能体）将被分成两个阵容，并从地图的两端同时发起攻击。玩家（智能体）将控制他们的英雄互相合作，获取资源并击败他们的对手。胜利条件为摧毁敌人总部的水晶。

初赛 - 1v1 墨家机关道

参赛队伍需要在指定的时间内，在给定的资源下训练露娜、鲁班七号、橘右京等三位英雄的最优模型，并最终部署好使用最优模型的AI服务器，提交系统进行墨家机关道1v1对战。初赛主要考查单智能体解决方案，模型结构设计，强化学习算法设计和训练方式探索。

复赛与决赛 - 3v3 长平攻防战

参赛队伍需要在指定的时间内，在给定的资源下训练出赵云、李元芳、貂蝉等三位英雄的最优模型，并最终部署好使用最优模型的AI服务器，提交系统进行长平攻防战3v3对战。

相比于初赛，复赛与决赛涉及到多智能体解决方案（更强调AI之间的配合协作），并且比赛使用的游戏环境具有更大的状态空间，需要更复杂的模型结构与强化学习算法。此外，参赛选手还要考虑奖励函数设计，训练方式探索等内容。