阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯·哈萨比斯、大卫·席尔瓦、黄士杰与他们的团队开发。其主要工作原理是“深度学习”。
2016年3月,该程序与围棋世界排行靠前、职业九段选手李世石进行人机大战,并以4:1的总比分获胜;2016年末2017年初,该程序在棋类网站上以“大师”(Master)为注册帐号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩。不少职业围棋手认为,阿尔法围棋的棋力已经达到甚至超过围棋职业九段水平,在世界职业围棋排名中,其等级分曾经超过排名人类优先的棋手柯洁。
2017年1月,谷歌Deep Mind公司CEO哈萨比斯在德国慕尼黑DLD(数字、生活、设计)创立大会上宣布推出真正2.0版本的阿尔法围棋(AlphaGo)。其特点是摈弃了人类棋谱,只靠深度学习的方式成长起来挑战围棋的极限。
阿尔法围棋(AlphaGo)是一款围棋人工智能程序。其主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行准确复杂的处理,就像人们识别物体标注图片一样。
阿尔法围棋用到了很多新技术,如神经网络、深度学习、蒙特卡洛树搜索法等,使其实力有了实质性飞跃。美国脸书公司“黑暗森林”围棋软件的开发者田渊栋在网上发表分析文章说:“‘阿尔法围棋’这个系统主要由几个部分组成:一、走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋;二、快速走子(Fast rollout),目标和走棋网络一样,但在适当牺牲走棋质量的条件下,速度要比走棋网络快1000倍;三、估值网络(Value Network),给定当前局面,估计是白胜还是黑胜;四、蒙特卡洛树搜索(Monte Carlo Tree Search),把以上这三个部分连起来,形成一个完整的系统。”