人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊

中新网客户端北京7月15日电(采访人员 宋宇晟)“整体的感觉就是AI太猛了 , 它们总是能做出异于常人的反应……”
在1:3输给人工智能后 , 有王者荣耀电竞职业选手这样说到自己对战时的感受 。
此后更有网友在社交媒体直言 , “人类连玩游戏也打不过AI了”“人类再次一败涂地”……
那么 , 让人工智能去玩《王者荣耀》就是为了“虐菜”吗?中新网采访人员最近和该AI模型负责人聊了聊 。

人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

【人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊】比赛现场 。 受访者供图
3:1 “属于正常发挥”
几天前 , 在世界人工智能大会现场 , 一款名为“绝悟”的游戏AI与五位来自王者荣耀职业联赛的选手现场进行了一场表演赛 。
有报道指出 , 人工智能在比赛中相继打出了“蹲草”“前后拉扯输出”“辅助开团”等操作 , 并在团队合作上颇具专业意识 。
在这场五局三胜的赛事中 , 人工智能以3:1的比分战胜了五位职业选手 。
尽管胜负成绩成了关注这场比赛的网友讨论的热点话题 , 但王者绝悟AI模型负责人邱福浩却告诉采访人员 , 团队对比赛的胜负没有预期 。
作为研发人员 , 他们更希望人工智能可以把握与高水平玩家切磋的机会 , 验证能力并不断成长 , 虽然这样的成绩“属于正常发挥” 。

人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

比赛现场 。 受访者供图
此外 , 很多网友猜测 , 相较于人类职业选手的反应速度 , 人工智能或许在操作方面有着“绝对优势” 。
然而 , 邱福浩却向采访人员明确表示 , 在数值和操作上 , 王者绝悟AI并没有独特的优势 , 在游戏中的客观条件限制是一致的 。
“在英雄的自身状态参数上 , AI并没有额外的加成 , 与人类玩家相同;AI在视野观测上与人类玩家保持一致 , 对于战争迷雾中的不可见单位 , AI同样也看不到;AI的操作反应也做了客观限制 , 其反应分布和均值与KPL职业选手是相接近的 。 根据实际观察 , 人类玩露娜等英雄会比AI更秀 。 ”

人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

比赛现场 。 受访者供图
AI一天对局数≈人类440年
既然客观条件没有什么不同 , 人工智能为何能战胜人类职业选手?
邱福浩给出的答案是训练量 。 “AI的优势在于其庞大的训练量 , 一天对局数约等于人类440年 。 ”
用研发团队的话说 , 自2017年启动项目 , 王者绝悟AI从模仿人类的监督学习 , 到自我博弈的强化学习 , 经过了多次迭代 , 攻克了多个难题 , 才逐步进化成了全英雄职业电竞水平的“完全体” 。
邱福浩介绍 , 2018年 , 王者绝悟AI还只是顶尖业余玩家的水平;到了2019年 , 王者绝悟AI不再需要模仿人类数据 , 而是通过自己和自己对战 , 进一步提升微操水平和大局观 , 已达到了王者荣耀职业电竞水平;去年 , 它学会了更多英雄玩法 , 并用40个英雄首次接受玩家们的挑战;最新版本中 , 团队又在竞技比赛的局前和局内阶段 , 进行了针对性优化 。

人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

资料图:2016年的围棋人机大战 。
几年前 , AlphaGO击败人类职业围棋选手时 , 一度震惊世界 。
与围棋相比 , 《王者荣耀》是一个不完全信息博弈场景 , 需要多个AI协作完成任务 , 且需在复杂连续的决策空间下进行长期决策 。
换句话说 , 教会人工智能玩《王者荣耀》 , 比让人工智能下围棋更难 。
邱福浩说 , 围棋的动作空间多达10的172次方 , 而AI在王者荣耀一局游戏中的操作可能性则多达10的20000次方 。

人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

比赛现场 。 受访者供图
让AI打游戏不是终点
但 , 进行如此复杂的研发、训练 , 就只是为了让人工智能在游戏中打败人类吗?
邱福浩并不这么看 。 因为人工智能最终是要服务于人类的 。
他告诉采访人员 , 团队之所以就此进行研发 , 首先是因为“这是一个多人协作的游戏场景 , 它在设计上的高复杂度、高挑战性 , 满足了对高水平AI+游戏的研究需要” 。
“从近年AI发展的关键事件可以看到 , AI的下一个里程碑很有可能就是在复杂策略游戏中诞生 。 ”
而人工智能进行复杂游戏训练的 , 是为了帮助人类解决现实生活中的问题 。

人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

比赛现场 。 受访者供图
邱福浩说 , AI在虚拟环境学习通用的感知、决策能力 , 未来可能在现实世界中发挥更大作用 。 以无人车研究为例 , AI学习外界环境 , 感知道路环境信息并加以表达 , 进而作出驾驶决策;再如机器人在虚拟世界仿真学习 , 再在现实世界对环境的未知变化做出反应 。
他认为 , 未来 , AI研究还将覆盖到更多场景 。 对于不少研究人员和开发者来说 , 多智能体技术研究依然存在显著的现实困难 , 包括环境的不确定性、信息获取的局限性、个体目标与全局目标的一致性 , 以及对高算力的要求 。
在邱福浩看来 , “AI+游戏”研究将是团队攻克AI终极研究难题——通用人工智能(AGI)的关键一步 。 AGI代表研发能在通用系统中执行多种复杂命令 , 达到或超越人类水平的AI 。
“这中间的经验、方法与结论 , 长期来看 , 有望在大范围内 , 如医疗、制造、无人驾驶、农业到智慧城市管理等领域带来更深远影响 。 ”(完)

    推荐阅读