谷歌的人工智能公司DeepMind研发的阿尔法狗在今年三月击败韩国围棋世界冠军李世石,为人工智能科技树立了一座里程碑。围棋作为一项中国传统棋类游戏,它的规则虽简单,但棋子排列的复杂性很高,需要棋手认真思考,这就是为什么对计算机而言这个游戏难以逾越。但阿尔法狗使用神经网络和深度学习技术,成功击败了李世石。

现在DeepMind公司接受了一个更大的挑战,它将与暴雪合作完成《星际争霸2》,这一决定在暴雪的年度会议上发布,两个团队将联手为《星际2》打造一个AI环境。

“《星际争霸》是个有趣的测试环境,因为它帮助AI接触通往现实世界的桥梁,” DeepMind科学家Oriol Vinyals说,他曾是西班牙顶尖的星际争霸职业选手。“玩家在游戏环境中使用的技能也会被用于处理他们在日常生活中的任务,” 他说。创造强大的星际争霸AI能极大提高游戏体验,私人订制的游戏教练可以帮助玩家不断升级。

《星际争霸》是一款非常复杂的战略游戏,需要资源管理、侦查和制定战斗策略等多项技能,和围棋一样,玩家刚开始不能看到战斗的全貌,这就意味着他们需要在缺少情报的条件下做战斗规划,在这一过程中玩家的记忆力、适应力和长远规划力都受到考验。“很明显,下围棋时你能看到棋盘全貌,这对计算机来说简单些,” DeepMind创始人Demis Hassabis说。在今年年初的采访中,暴雪总制作人Chris Sigaty说两个团队“进行了一番讨论”。

《星际争霸2》现有AI系统的运作方式和DeepMind的AI完全不同,Sigaty说。现有AI是全手动制作,能在不同难度级别下工作。它也会作弊,因为它拥有人类玩家无法获得的信息,它能随时给所有部队发送指令。暴雪打算让AI在不作弊的情况下胜过人类玩家。

这款游戏对DeepMind来说是个空前的挑战,但Vinyals说他很高兴有机会和一个大型战略型游戏合作,之前公司只尝试过让计算机学习简单的雅达利游戏。“通过解决《星际2》中的各种问题,AI研究能被推向一个新高度,” 他说。

暴雪和DeepMind计划在明年第一季度发布一个AI环境,向感兴趣的AI研究者们公开。环境将采用一个简化版的新界面,界面上只显示一些基本的视觉信息,以便计算机学习系统的使用;一个简化的应用程序界面也将对AI开放,方便它们提取游戏数据。暴雪会发布游戏重播,给AI建立一个学习数据库。测试目的是让机器人具备像人类一样凭借视觉信息作出决定的能力。

尽管阿尔法狗击败李世石这一事件超乎人们的预期,但两家公司还是连一个让AI击败顶尖职业选手的大致日期都没有给出。“我觉得一些职业选手可能会误解我们的决定,” Sigaty说,但他相信玩家社群总体上会对实验持积极态度。在预期本次电脑击败人类所需的准备时间之前,研究者们必须努力工作,而《星际2》也要尽力为研究提供合适的平台。