未来的AI会不会干掉人类?这个问题还有点遥远,但是有一点是可以肯定的,那就是AI超强的学习能力可以让他们越来越强大,在各种比赛中赢过人类精英已经没什么悬念了。前两年谷歌Deepmind团队的AlphaGo在围棋上以4:1战胜了人类,随后Deepmind在围棋上已经无敌了。这两年他们开始征战电竞游戏,旗下的AlphaStar在两场比赛中以10:1的成绩赢了职业选手TLO及Mana。
Deepmind方面昨天在网上公布了他们开发的AlphaStar
AI程序在星际争霸II中跟人类选手过招的结果,对战的是职业选手TLO及Mana,比赛分别在12月10日及12月19日完成了,两次都是5:0完胜人类高手,昨天公布的是当时比赛的回放,有兴趣的可以看看Deepmind官方的介绍。
玩过星际的人应该知道这个游戏的复杂,对反应及微操要求都很高,还有APM(每分钟操作数)这个指标来衡量专业选手的能力,职业选手的APM一般能达到200-300,有个韩国选手朴圣俊有过818APM的记录,不过APM这事在AI上就没什么意义了,可以轻松实现数万个APM的水平。
也正因为此,这两次的比赛中实际上限制了AlphaStar的APM数,平均为280APM,这比专业选手的水平要差,同时还增加了AlphaStar“观察-行动”之间的延迟到350毫秒,这也是故意限制AI的性能,因为人类选手需要看地图再反馈的时间。
尽管有这么多限制,但是AlphaStar在对战人类职业选手的比赛中还是轻松取胜了,而且是10:0,人类毫无还手之力。为了训练AlphaStar,Deepmind团队使用谷歌的TPU
v3创建了一个分布式训练系统,从数千场星际II比赛实例中学习训练,只用14天就积累了大约200年的实战经验,这个水平是永远超过正常的职业选手训练量的。