注册 找回密码
搜索
查看: 1691|回复: 9
打印 上一主题 下一主题

《自然》:电脑程序首次击败围棋专业选手 谷歌Al 深度学

[复制链接]
跳转到指定楼层
1#
发表于 2016-1-31 10:39:41 | 显示全部楼层 回帖奖励 |倒序浏览 |阅读模式
作者:Demis Hassabis

来源:《自然》

发布时间:2016/1/28 16:24:42

电脑程序首次击败围棋专业选手

英国《自然》杂志16-1-27日公开的论文,报道了一种能在传统策略游戏——围棋上击败专业选手的电脑程序。围棋被认为是人工智能领域一个非常具有标志性的“大挑战”,这项成果可能会给人工智能领域其他看似难以实现的人类级别能力的项目带来希望。

现在的国际象棋领域,人类顶尖选手都会被电脑杀得丢盔弃甲,围棋则不然。围棋起源于中国,两个选手在矩形格子上交换下黑子和白子,目标是在比赛结束时比对方占领更多的地盘。正是源于围棋巨大的搜索空间,很难估计局面和下子,让围棋被视作人工智能领域“难以搞定”的标志性项目。迄今最成功的围棋计算机程序,能达到业余人类选手的程度,但还不能和专业选手在不让子的情况下一较高下。

此次,位于英国伦敦的谷歌旗下DeepMind公司的戴维·西尔弗、艾佳·黄和杰米斯·哈萨比斯与他们的团队,开发了一个叫“AlphaGo”的程序,利用“价值网络”去计算局面,用“策略网络”去选择下子。训练这些深度神经网络的,是对人类专业棋局的监督学习以及让它和自己对弈的增强学习。

“AlphaGo”程序在和其他围棋程序的对抗中获得了99.8%的胜率,并且在一项竞赛中以5比0的成绩战胜了欧洲围棋冠军。计算机程序能在不让子的情况下,在完整的围棋游戏中击败专业选手,这还是第一次。原本人们认为,要到10年后人工智能才能达到这一成就。

“AlphaGo”程序的下一个挑战对象将是过去10年来的世界围棋冠军李世石。这场人工智能与人类的博弈将于16-3月份在首尔举行。(张梦然)

http://www.nature.com/nature/jou ... ll/nature16961.html



http://paper.sciencenet.cn/htmlpaper/201612816244283338541.shtm  L

nature16961-f1.jpg (56.92 KB, 下载次数: 56)

图1 :神经网络训练管线和建筑。一,快速部署策略pπ和监督学习(SL)政策网络pσ进行培训,以预测位置的数据集人类专 ...

图1 :神经网络训练管线和建筑。一,快速部署策略pπ和监督学习(SL)政策网络pσ进行培训,以预测位置的数据集人类专 ...
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于都市网 | 服务条款 | 开放平台 | 广告服务 | 商务洽谈 | 都市网招聘 | 都市网公益 | 客服中心 | 网站导航 | 版权所有

手机版|小黑屋|Comsenz Inc.  

© 2001-2013 源码论坛 Inc.    Powered by Weekend Design Discuz! X3.2

GMT+8, 2024-5-5 07:06 , Processed in 0.076558 second(s), 21 queries .

快速回复 返回顶部 返回列表