无需人类指导 100比0击败无敌前辈新版“阿法狗”从零开始“自学成才”

来源：中国科技网时间：2017-10-20

人工智能领域出现新突破——据英国《自然》杂志18日发表的论文报道，一款新版的“阿法狗”（AlphaGo）计算机程序能够从空白状态起，在不需要任何人类指导的条件下，迅速“自学成才”。这款名叫“阿法狗—零”（AlphaGo Zero）的新程序，以100比0的战绩打败了旧版“阿法狗”。

人工智能的最大挑战，是研发一种能从零开始、以超人类的水平学习复杂概念的算法。在2016年3月一场世所瞩目的比赛中，谷歌旗下深度思维（DeepMind）公司的“阿法狗”软件击败了人类围棋世界冠军。但为了赢得这场比赛，科学家在训练“阿法狗”时，同时用到了监督式学习（基于上百万种人类专业选手的下棋步骤）和基于自我对弈的强化学习。其训练过程长达几个月，用到多台机器和48个TPU（神经网络训练所需的专业芯片）。

此次在最新论文中，英国深度思维公司“阿法狗”项目主要负责人戴维·西尔弗、戴密斯·哈萨比斯及其同事，报告了新版“阿法狗”软件——“阿法狗—零”。与前辈版本在刚开始学习围棋时要依靠人类知识不同，新软件的学习从“零”开始，且单纯基于与自己的对弈，人类的输入仅限于棋盘和棋子，没有任何其他数据。“阿法狗—零”仅使用一台机器和4个TPU，依靠一张经过训练的神经网络来预测程序自身的棋步和棋局的赢家，在每次自我对弈中飞速进步。

通过几天的训练——包括近500万局自我对弈——“阿法狗—零”已能够超越人类并打败所有之前的“阿法狗”版本。在程序训练的过程中，它独立发现了人类用几千年才总结出来的围棋规则，还建立了新的战略，为这个古老的游戏带来新见解。

1．凡本网注明“来源：高新科技网”的所有作品，版权均属于高新科技网所有，未经本网授权，任何单位及个人不得转载、摘编或以其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“高新科技网”。违反上述声明者，本网将追究其相关法律责任。

2．凡本网注明“来源：XXX（非高新科技网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。

无需人类指导 100比0击败无敌前辈 新版“阿法狗”从零开始“自学成才”

无需人类指导 100比0击败无敌前辈新版“阿法狗”从零开始“自学成才”