正在阅读:柯洁别做梦了!人类再进化5000年也干不过AlphaGo

柯洁别做梦了!人类再进化5000年也干不过AlphaGo

2016-03-13 18:14 未知 admin

 

柯洁别做梦了!人类再进化5000年也干不过AlphaGo

 

 

腾讯科技精选优质自媒体文章,文中所述为作者独立观点,不代表腾讯科技立场。

文/蓝馨晴(微信公众号:极客视界)

这是一场毫无意义的比赛,因为胜负早已注定。李世石赢不了,就算赢一场也是侥幸,柯杰来了也没用,吴清源复活也没用。

如果你对 AlphaGo 或者如今的 AI 发展稍微有点了解的话,你就会明白为什么人类下不赢电脑,就算再进化 5000 年也没用。

先来解释一下阿尔法狗是怎么下棋的。

围棋有 361 个格子,理论上讲,黑子的第一步有 361 种选择,然后白子有 360 种应对,然后黑子 359 ,以此类推。每一步棋最终可能会导致各种各样的结果,如果你能穷尽所有结果,看看其中有多少是获胜的,有多少是失败的,就可以计算出这步棋有多大的可能性让你赢。每次轮到你下棋时,都选择赢面最大的那一步棋,最终你就是独孤求败,永远都不会输了。这就是从深蓝到阿尔法狗都会使用的「蒙特卡罗树」搜索方法。

人工智能又一次挑战世界冠军,人脑还能坚持多久?

当然,这只是理论上的,因为穷尽所有是不可能的。经过估算,围棋的全部可能性为 10^170 种,全宇宙的原子数量加起来才 10^80,阿尔法狗还没流弊到能计算全宇宙的原子。既然不能穷尽,就只能拿有限数量的棋局来进行估算,这就组成了阿尔法狗的核心部分:「Policy Network」,称为策略网络。从 5000 年前中国人发明围棋开始算起,全人类下过的棋局可能也不过几十万局到几百万局,有大量的变化和局面还未有人尝试,这显然不能满足阿尔法狗的胃口。于是它发明了一种制造棋局的方法:自己跟自己下。据说它的「快速走子」2 微秒可以下一步棋,1秒钟已经下完了几千盘棋局了。它在和李世石比赛之前已经储备了 3000 万个棋局,这里面有多少对局可能是人类再下 5000 年棋也创造不出来的。

如果光是这样,那也还做不到独孤求败,毕竟和电脑相比人类还有「棋感」、「经验」、「灵光一现」这类无法量化的东西。围棋号称「千古无同局」,经常会出现一步棋让盘面发生翻天覆地的变化,就像天龙八部里的珍珑棋局所描述的那样。为了防止人类通过奇招、怪招打败阿尔法狗,它还有另外一套计算方法:「Value Network」称为估值网络。它从储备的 3000 万个棋局(按1秒钟下几千盘棋局来算,现在估计又增加了很多)里提取了 3000 万个局面,然后通过『蒙特卡罗树』的推演来评估局面的变化,一来可以砍掉大量不值得分析的分叉提高计算效率,另外更重要的是可以推演出与之相关可能出现的新局面。将可能产生的有利或不利局面倒推回来,堵住一切人类有可能出奇制胜可能性,而选择自己更容易下出「珍珑棋局」的局面。比如通过算棋得出下一步走 A 位可继续保持优势,但评估局势认为 B 位有可能改变整个局势,那么就会选择B位。大家看直播,也发现阿尔法狗经常这么做。控制住了局面也就基本控制了由于样本有限而没有覆盖到的怪招、妙招的威胁。

 

柯洁别做梦了!人类再进化5000年也干不过AlphaGo

 

当然,由于围棋计算无法穷尽,人和机器看上去是在同一起跑线上。但阿尔法狗每1秒钟又学习了几千盘新棋局,其中的「珍珑棋局」大多都是人类闻所未闻的,这简直就是降维攻击。人类还是洗洗睡吧。

这场比赛让我想起了百年前英国人让马车与火车进行比赛,刚开始火车还输了呢!这些比赛都没有意义,因为计算机程序将不可避免地超越人类。当然有人说电脑程序怎么进化也写不出一首优美的诗,机器无法理解人类的喜怒哀乐。这是当然的,但是计算机技术悄然地改变着人类的生活,并在某些方面超越我们,但最终它们还是要为我们所用。

 

柯洁别做梦了!人类再进化5000年也干不过AlphaGo

 

至于计算机会对围棋界产生什么样的影响?看看现在国际象棋界就知道了,有的棋手用电脑来学习和训练,而有的则用它来作弊。2010 年,法国大师 Sebastien Feller 在比赛中接收电脑提示而被 FIFE(国际象棋联合会)判决提前回老家。当然,现在主流的做法是棋手们使用「象棋程序」来辅助训练,经过电脑的计算可以排除大部分没有意义的分支,棋手们现在一天可以研究的棋局可能超过过去几十年甚至几百年的总和。有车不坐为啥非要走路呢?我猜想未来棋类运动将会朝几个方面发展:要么完全去电脑化回归人类运动的本质,就像火箭都上天了奥运会还有跑步一样;要么像国际象棋那样让电脑来协助比赛;即使最终被「穷尽」了,回到「琴棋书画」这类艺术活动的范畴也不无不可。

 

柯洁别做梦了!人类再进化5000年也干不过AlphaGo

 

AlphaGo 的意义根本不在于下棋,而是计算机所进化出的超强学习能力。算法的进化可以大量节约 CPU 的计算能力,就像围棋这样如果真的要 「穷尽」可能要用到全宇宙的原子才行,而现在只需要几千万盘对局就几乎破解了这个游戏。同理像 Siri 这种语音助手,想要穷尽人类所有的词语表达也几乎是不可能的,但让计算机从有限数量的语言库中学习人类是怎么说话的已经变为可能。

另一方面,计算机的算法依然是大数据+逻辑计算,离人类的抽象思维、自我意识什么的还很远。它们所扮演的角色依然是作为人类更加便捷的工具,有时候让人变得更「懒」,有时候让人变成「超人」。归根结底计算机是人类发明的,如果人类输掉了这场比赛我们应该欢欣鼓舞,因为人类又一次战胜了自己。当然,如果未来人类没有利用好这个工具,并像科幻电影描述的那样成为一种威胁,要怪也只能怪我们自己。

Geek's view

多说两句。之前柯洁质疑说李世石签了保密协议回避打劫,我只想说呵呵。田渊栋博士在知乎上详细分析了阿尔法狗的原理,除了上面说到的两个系统之外,阿尔法狗还有一套快速走子程序,就是前面提到的可以 2 微秒走一步棋。打劫前后无非几十步,加上所有可能性至多无非百千步走法,阿尔法狗不到一秒都计算好了。而且这个是运行在本地的,不需要通过网络搜索,来中国战都毫无压力。

返回新闻资讯频道 (责任编辑:中华新闻文化网)