4月14日,第二届“腾讯开悟多智能体强化学习大赛”决赛在成都落幕,来自20多所顶尖高校的AI研发团队,经过半年来的比拼,共有4支团队进入决赛。经过激烈角逐,由兰旭光教授指导的XJTU_太初队荣获本届大赛季军。
本次比赛遵循王者荣耀游戏环境规则:玩家(智能体)将被分成两个阵容,并从地图的两端同时发起攻击。玩家(智能体)将控制他们的英雄互相合作,获取资源并击败他们的对手。胜利条件为摧毁敌人总部的水晶。
初赛 - 1v1 墨家机关道
参赛队伍需要在指定的时间内,在给定的资源下训练露娜、鲁班七号、橘右京等三位英雄的最优模型,并最终部署好使用最优模型的AI服务器,提交系统进行墨家机关道1v1对战。初赛主要考查单智能体解决方案,模型结构设计,强化学习算法设计和训练方式探索。
复赛与决赛 - 3v3 长平攻防战
参赛队伍需要在指定的时间内,在给定的资源下训练出赵云、李元芳、貂蝉等三位英雄的最优模型,并最终部署好使用最优模型的AI服务器,提交系统进行长平攻防战3v3对战。
相比于初赛,复赛与决赛涉及到多智能体解决方案(更强调AI之间的配合协作),并且比赛使用的游戏环境具有更大的状态空间,需要更复杂的模型结构与强化学习算法。此外,参赛选手还要考虑奖励函数设计,训练方式探索等内容。