首页 > 资讯 > 环球视野 > 正文

星期文库 机器博弈之四 阿尔法狗横空出世 谢立章

文章来源:大手笔网 作者:
字体:
发布时间:2020-06-25 16:21:07
2016年、2017年,阿尔法狗(AlphaGo)先后战胜世界围棋冠军李世石、柯洁,引爆了人工智能狂潮,计算机终于攻克人类智慧的堡垒!阿尔法狗的成功,是多方面的原因。算法方面包括了蒙特卡洛树搜索、深度学习、增强学习。同时,分布式计算以及GPU带来的算力大爆发,这一切加起来,才足以支撑其与顶尖棋手李世石的对决。
 
蒙特卡洛是一座赌城,意味着筛子与随机。大家可能好奇,为什么会需要一种随机的算法?这就是概率的功劳了,由于围棋的复杂度高达10的360次幂,这个时候,依赖于确定路径的搜索,反而不如随机的搜索。因为,所有的随机,也会产生一种规律,概率上称之为分布。蒙特卡洛的思想,还有很多应用,比如计算圆周率,就可以通过足够的随机模拟求得,模拟得越多,精度越高。蒙特卡洛树搜索算法靠一己之力,把人工智能的围棋水平带到了业余四段的水平。这个时候,深度学习登场了。深度学习算法是当下最重要的人工智能算法,阿尔法狗通过深度学习,学习了人类上百万次对局。通过其强大的特征提取能力,学习在某种局面下如何落子。最终,它的落子水平能达到业余二到四级。
 
大家想一想,两个业余四级能干吗?
 
可能结果是令人震惊的,阿尔法狗凭借着两个业余四级,竟然达到了顶级人类棋手的水平。为什么会这样呢?其实这和深蓝的原理有一定的相似之处。蒙特卡洛树搜索算法这位业余四级选手,它能够往后看很多步,虽然看的每一步质量都不高,全都靠猜(随机)。而深度学习这位选手,能力也一般,但是它学了上百万个棋局,它的落子能力很强,因而两者的结合是爆炸性的。蒙特卡洛树搜索算法具备往后看很多步的能力,而深度学习能较好地把握每一个落子点的质量,而不是原本的随机猜子,结合在一起,很快人工智能的棋力就得到了很大的提升。
 
阿尔法狗还有一个创造性的提升,即增强学习,也就是左右互搏,不断进化,这个是其很厉害的一点。一个强大的人工智能“棋手”,不用吃喝拉撒,每天就知道下棋,最终导致下棋能力的爆炸性增长,完完全全拉开了和人类棋手的差距。甚至,能完全摆脱人类高手的经验,独创超出人类高手想象的妙局。
 
在计算能力方面,阿尔法狗得到了分布式计算的支撑,通过多台GPU加速计算,把计算分配到多台计算机上,这样尽可能支撑蒙特卡洛树搜索算法可以往后多思考几步。
 
深度学习出现多年,但是由于计算能力一直不够,而且没有大数据的支持。近几年,大数据、强计算能力、优秀的算法(如蒙特卡洛树搜索算法、深度学习、增强学习)结合在一起,最终人工智能才攻克了围棋这一极其坚固的堡垒。
 
http://www.dashoubi.org/news/shwx/2020-06-25/136349.html