新浪科技讯 北京时间12月7日上午消息,年初时,曾有消息说DeepMind取得重大技术突破。DeepMind引入一种名叫“强化学习”(reinforcement learning)的AI技术,增强AlphaGo,不需要人类数据,它就可以自己获得超人一般的围棋技法。只需要划定下棋规则,AI就会随机对弈,制定出色的战略。谷歌将增强后的AlphaGo取名叫作AlphaGo Zero,因为它不需要人类输入信息。
现在DeepMind在arXiv发表论文,说AlphaGo Zero已经具备很强的通用性,可以学着完成其它任务。团队举了两个例子,说它可以学习国际象棋和将棋,将棋是日本的一种游戏,与国际象棋类似。在两个案例中,AlphaGo Zero 24小时内就能获得超人一般的棋艺,达到击败世界冠军的水平。
为什么在两个游戏中AI可以获得卓越的技能呢?因为国际象棋与将棋没有围棋复杂。DeepMind有能力让AlphaGo Zero具备通用性,这样它就可以掌管不同的游戏,这说明机器学习的能力越来越强。
当然,还有一些游戏是AI目前无法掌握的。最大的挑战可能是复杂的线上策略游戏,比如《星际争霸》,在这款中人类仍然占据上风。如果机器想打败人类,必须学会新技能,比如记忆、规划。还要多久才能战胜人类呢?可能不用等太久。(德克) |