7月8日 , 2021世界人工智能大会腾讯王者荣耀展区 , 上演了一场人类与AI的较量——王者荣耀电竞职业选手和AI战队“王者绝悟”正面对决 。AI的胜利 , 像极了2017年“阿尔法狗”战胜柯洁 。 那么 , “王者绝悟”是否真的已经完全超越人类?同是AI , “王者绝悟”和“阿尔法狗” , 甚至其他游戏人工智能的区别在哪里?“王者绝悟”的存在价值是什么?
最终 , 五局三胜的赛事 , AI以3:1提前结束 。 “AI确实太猛了 。 ”落败后 , 职业选手道出了内心的“绝望” 。
比赛结束后 , 面对媒体 , “王者绝悟”技术负责人杨光表示 , AI的学习能力于人类而言是碾压级的 , AI一天的训练量就相当于人类440年的训练量 。
7月14日 , 红星新闻采访人员联系到腾讯“王者绝悟”团队 , 他们讲述了“王者绝悟”背后的故事 。
文章图片
↑人机大战(图据王者荣耀团队)
『3:1』
AI战胜人气职业选手队
在这样一场人类与AI的较量中 , 五位职业选手分别是成都AG.无痕、重庆QG.Hurt、辰鬼、深圳DYG.小义和武汉ES.诺言 , 均为在役的人气职业选手 。 “王者绝悟”作为游戏AI , 在比赛中相继打出了蹲草、前后拉扯输出、辅助开团等操作 , 并在团队合作上颇具专业意识 。
第一局 , 职业选手出其不意 , 选择了两名“法师”角色——干将莫邪和嬴政(常规比赛中多只有一名“法师”) 。 不过“王者绝悟”并不惧怕 , 不费吹灰之力就赢下第一局 。
第二局 , 职业选手们谨慎了些 , 选择的阵容回归保守 。 但这依然无法阻挡“王者绝悟”的气势 , 在AI面前 , 职业选手仿若人机 。 “王者绝悟”又赢了 。
第三局 , 职业选手再次改变阵容 , 针对性地优化了英雄阵容 。 这一尝试非常管用 , AI强大的算力没跟上节奏 , 人类战队终于扳回一局 。
由于游戏阵容不允许与上局相同 , 第四局比赛因此进行得极其艰难 。 时间慢慢流逝 , 职业选手的状态逐渐疲惫 , 但AI依旧精神抖擞 。 第四局 , “王者绝悟”再次获胜 。
至此 , 五局三胜的赛事 , AI最终以3∶1提前结束了该赛事 。
一边是全国排名前10的5名职业选手 , 一边是空无一人的五张椅子 。 AI的胜利 , 像极了2017年“阿尔法狗”战胜柯洁 。 “AI确实太猛了 。 ”落败后 , 职业选手辰鬼道出了内心的“绝望” 。
文章图片
↑5名人气职业选手(图据王者荣耀团队)
『“王者绝悟”是谁?』
2018年首次登场后一直在进化
腾讯的“王者绝悟”产品是由腾讯AI Lab与王者荣耀联合推出 , 展现了AI在人类生活场景的想象力 。 据报道 , 在2019年 , “王者绝悟”团队曾在接受媒体采访时表示 , 和业内所有研究机构一样 , 他们追求的目标都是“通用人工智能” 。近日 , “王者绝悟”技术负责人杨光——这支AI“梦之队”的总教练 , 在比赛结束后 , 面对媒体表示 , AI的学习能力于人类而言是碾压级的 , AI一天的训练量相当于人类440年的训练量 。 而且 , AI不受情绪、性格影响 , 配合障碍更低 。 那么 , “王者绝悟”是否真的已经完全超越人类?
7月14日 , 红星新闻采访人员联系到腾讯“王者绝悟”团队 。 对于这个问题 , 团队认为 , “‘王者绝悟’经过了多次迭代 , 如今已经进化成全英雄职业电竞水平的‘完全体’ 。 ”
从模仿人类的监督学习 , 到自我博弈的强化学习 , “王者绝悟”实力发展 , 可以通过以下几个重要里程碑全面了解到:
2018年12月 , “王者绝悟”在KPL总决赛首次登场 。 这一版本通过监督学习方法 , 模拟学习了KPL职业选手的操作 , 达到了顶尖业余水平;2019年 , 随着团队在深度强化学习、多智能体决策课题上的研究不断深入 , “王者绝悟”不再需要模仿人类数据 , 而是通过自己和自己对战 , 进一步提升微操水平和大局观 , 达到了王者荣耀职业电竞水平;2020年 , “王者绝悟”通过课程学习方式 , 学会了更多英雄玩法;同年5月份 , 它用40个英雄首次接受玩家们的挑战 。
目前 , 在“王者绝悟”的最新版本中 , 团队进一步引入了多轮组合博弈和层次化的强化学习算法 。 也就是在竞技比赛的局前和局内 , 都做了针对性优化 , 提升它的整体能力和战术对抗水平 。
『独具优势?』
人类玩露娜等英雄会比AI更秀
在局前 , 也就是大家熟悉的BP环节(就是BAN/PICK , 指的是排位赛的时候禁选英雄的阶段) , “王者绝悟”既会考虑当前对局双方阵容的胜率 , 也会更长远地为后续对局“留招” , 最大化多轮比赛的胜率 。
在局内 , 通过自我博弈学习同时提升宏观战术策略和具体微操水平 。 在保持高强度微操能力的情况下 , 对不同的敌方战术策略 , 如五人抱团、四一分推、gank入侵等战术 , 做出更加合理的应对 。
不过 , 虽然已经进化成全英雄职业电竞水平的“完全体” , 但团队认为 , 数值和操作上 , “王者绝悟”并没有独特的优势 。
一方面 , 在英雄的自身状态参数上 , AI并没有额外的加成 , 与人类玩家相同;另一方面 , AI在视野观测上与人类玩家保持一致 , 对于战争迷雾中的不可见单位 , AI同样也看不到;最后 , AI的操作反应也做了客观限制 , 其反应分布和均值与KPL职业选手是相接近的 。 根据实际观察 , 人类玩露娜等英雄会比AI更秀 。
『不同于“阿尔法狗”』
“王者绝悟”算法挑战更大
大家常说的阿尔法围棋(AlphaGo阿尔法狗) , 是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人 。 它由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发 , 其主要工作原理是“深度学习” 。 同是AI , “王者绝悟”和“阿尔法狗” , 甚至其他游戏中的人工智能的差别在哪里呢?
文章图片
↑比赛现场(图据王者荣耀团队)
“王者绝悟”团队认为 , 和其它游戏不同 , 王者荣耀是个不完全信息的复杂游戏 。 “比如像围棋这样的游戏 , 大家一眼就能看到全局 , 就是完全信息游戏 。 而在王者荣耀里面 , 玩家视角只能看到地图的一部分 , 还有草丛这样的隐藏空间 。 在这样的前提下 , ‘王者绝悟’要快速而准确地做出一系列复杂的决策操作 , 本身就是更加困难的一件事 。 ”
直观来说 , 王者荣耀的对局有多复杂?一是王者英雄非常多 , 有100多个 , 阵容组合爆炸 , 达到10-15种可能性 , 而且不同组合在能力和打法上有很大差异 。 二是游戏中的状态、动作空间复杂 , AI在策略规划、目标选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择 。 “我们预计AI在一局里有高达10的20000次方种操作可能性 。 而整个宇宙原子总数也只是10的80次方 。 ”该团队介绍 , 如此庞大的运算空间里 , 要做高效准确的决策 , 对算法的挑战非常大 。
『超越人类?』
职业玩家不服:下次 , 干翻AI!
回到比赛的那一幕 , 在赛后采访环节 , 职业选手也感受到了AI“王者绝悟”的强大 , “AI确实太猛了 , 总能做出异于常人的反应 , 让我们招架不住 。 ”已是第二次对战“王者绝悟”的选手辰鬼觉得 , AI的配合较上一次更为默契 。
那么 , “如果还有下次 , 你们愿意‘复仇’吗?”现场解说员问 。
职业选手们答道:“下次 , 干翻AI!”
除了职业选手 , AI“王者绝悟”也引起了众多游戏玩家的关注 。 有人觉得AI就是人机 , 没什么可怕的 , 不过 , 在看过比赛以后 , 不少玩家的态度发生了转变 。
正如王者荣耀五年玩家小曾觉得 , AI的技能把控准确度和超强的计算血量、躲技能 , 以及不受心态影响 , 是职业选手很难达到的 。 同时 , AI思想是统一的 , 就像AI是一个人控制5个人 , 而职业选手有5个人的思想 , 思想不一致 , 怎么能够对付思想完全一致的“绝悟”呢?并且 , AI记录了大量高手比赛对局到数据库里 , 从而不断重复学习 , 强化自己 。 小曾认为:“今后 , 随着AI技术的完善 , 学习的深入 , 完全超过人类是必然的 。 ”
文章图片
↑比赛现场(图据王者荣耀团队)
『未来的价值?』
不是战胜人类 而是应用于生活
归根到底 , 人类还是喜欢和人类玩耍的 , 有人甚至觉得 , 和AI的游戏无异于单机游戏 。 那么 , “王者绝悟”的存在到底有哪些价值?
团队从玩家角度出发认为 , “王者绝悟”过去在重要节点以活动的方式出现在游戏中 , 确实让广大用户体验到了AI的最新进展和魅力 。
从更长远的角度来看 , “王者绝悟”的研究是希望在王者这种复杂状态策略博弈的环境下 , 让AI学会类似人的长期策略规划和多智能体协作决策 。 随着团队对相关课题不断深入的研究和积累 , 将把“王者绝悟”的能力迁移到其他类型的游戏 。 如今 , “王者绝悟”已经有了几个兄弟 , 可以应用于足球、FPS、RTS游戏 , 并且都达到了国际领先水平 。
“王者绝悟”能够从0到1去学习进化 , 并发展出一套合理的行为模型 。 这中间的经验、方法与结论 , 长期来看 , 团队希望它能在更多的不同场景 , 如医疗、制造、无人驾驶、农业以及智慧城市管理等领域带来更加深远的影响 。
同时 , 科研、科教价值也不可忽视 。 据介绍 , 腾讯AI Lab和王者荣耀还联手打造了“开悟”AI+游戏开放平台 , 为学术研究人员和算法开发者开放腾讯在算法、脱敏数据、算力方面的优势能力 。 去年腾讯举办了第一届开悟AI学术交流赛 , 18所国内名校的同学们参赛 , 并取得了不错的成绩 。 今年下半年即将举办第二届赛事 , 希望能为人工智能教学、科研提供帮助 。
事实上 , AI的目的并不是要在游戏里战胜人类 , 而是通过越来越复杂的游戏训练 , 最终解决现实生活中的问题 。
红星新闻采访人员 戴佳佳
编辑 于曼歌
【王者|王者荣耀职业选手输给AI 对话团队负责人:战胜人类,意味着什么?】(下载红星新闻 , 报料有奖!)
推荐阅读
- 王者荣耀|挑战者杯大名单公布,多支kpl队伍首发或成绝唱,冠军是唯一机会
- 王者荣耀|王者荣耀女玩家天生不如男?大锤率队迎战女生队:2分钟越2塔
- 王者之魄|【CF手游】王者武器库全解析,你想知道的都在这!
- 王者荣耀|挑战者杯预报丨选拔赛BO1揭幕,XYG再战巅峰赛大佬
- 猫德|魔兽TBC:P3有4个职业抢一件装备,猫德情况特殊需要2件蓝色装备
- pokémon go|21年全球八款手游营收破10亿!《王者》《原神》进前三
- dnf|DNF:110版本将不受欢迎的职业,红眼哥再次上榜,剑帝迎来最低谷
- 王者荣耀|王者荣耀:赛场上公然打拳?大锤哥一口气欺负五个妹妹
- 魔兽世界怀旧服|魔兽怀旧服:野团最不容易遇见的职业,只有竞速和公会团才会需要
- 王者荣耀&鲁班七号|王者荣耀最奇葩的6个被动技能 第一个“全屏嘲讽”