|
作者:Demis Hassabis
来源:《自然》
发布时间:2016/1/28 16:24:42
电脑程序首次击败围棋专业选手
英国《自然》杂志16-1-27日公开的论文,报道了一种能在传统策略游戏——围棋上击败专业选手的电脑程序。围棋被认为是人工智能领域一个非常具有标志性的“大挑战”,这项成果可能会给人工智能领域其他看似难以实现的人类级别能力的项目带来希望。
现在的国际象棋领域,人类顶尖选手都会被电脑杀得丢盔弃甲,围棋则不然。围棋起源于中国,两个选手在矩形格子上交换下黑子和白子,目标是在比赛结束时比对方占领更多的地盘。正是源于围棋巨大的搜索空间,很难估计局面和下子,让围棋被视作人工智能领域“难以搞定”的标志性项目。迄今最成功的围棋计算机程序,能达到业余人类选手的程度,但还不能和专业选手在不让子的情况下一较高下。
此次,位于英国伦敦的谷歌旗下DeepMind公司的戴维·西尔弗、艾佳·黄和杰米斯·哈萨比斯与他们的团队,开发了一个叫“AlphaGo”的程序,利用“价值网络”去计算局面,用“策略网络”去选择下子。训练这些深度神经网络的,是对人类专业棋局的监督学习以及让它和自己对弈的增强学习。
“AlphaGo”程序在和其他围棋程序的对抗中获得了99.8%的胜率,并且在一项竞赛中以5比0的成绩战胜了欧洲围棋冠军。计算机程序能在不让子的情况下,在完整的围棋游戏中击败专业选手,这还是第一次。原本人们认为,要到10年后人工智能才能达到这一成就。
“AlphaGo”程序的下一个挑战对象将是过去10年来的世界围棋冠军李世石。这场人工智能与人类的博弈将于16-3月份在首尔举行。(张梦然)
http://www.nature.com/nature/jou ... ll/nature16961.html
http://paper.sciencenet.cn/htmlpaper/201612816244283338541.shtm L |
-
nature16961-f1.jpg
(56.92 KB, 下载次数: 56)
图1 :神经网络训练管线和建筑。一,快速部署策略pπ和监督学习(SL)政策网络pσ进行培训,以预测位置的数据集人类专 ...
|