王路:阿尔法狗,阿尔法元,阿尔法人

发布时间:2025-01-05 17:29

昨天看了AlphaGo Zero(阿尔法元)的新闻,有很多感想。这些感想中,绝大多数,和大家差不多,就不再重复了。制造冗余信息,是一种罪过。所以,只聊聊剩下的。

1、

阿尔法元是靠跟自己下棋成长起来的。人类也是。阿尔法元达到目前人类的棋力,只花了3天时间,大约70小时,下了490万局。很多人说,阿尔法元3天,超过了人类3000年。我想补充一种视角。整个人类历史上,下过的所有围棋局数,也就是数百万的量级。如果针对个体看,比如柯洁,他看过的所有盘数,不会超过10万局,目前人类的顶级棋手,一生最多看过的局数都没有超过10万。相当于阿尔法元的五十分之一不到。从这个意义上讲,人类的学习能力,不能说是很弱的。

整个20世纪,人类棋力进步的幅度超过了此前两千年。但这么比没有意义。之前的人类围棋,缺乏交流传授的机制。很多前人走过的路,后人要从头再走一遍。这就好比,把阿尔法元放到70台机器上,每台跑1小时,和放在1台机器上跑70个小时,是没法比的。

阿尔法元达到人类顶级水平,用了70个小时。如果我们把它比喻成一个人,70个小时看作70年。会发现,这样的进步方式,在人类社会,是行不通的。——你按照这种成长路径,可以在70岁时,成为人类顶级高手。但你在50岁以前,始终要人被虐,以至于根本不能进入围棋圈子。

阿尔法元幸运在哪里呢?它被允许在50岁以前很笨。——纵然很笨,它仍然可以坚持既定路线,按照自己的方式去成长。如果是一个人,你在30岁,还比不上同龄人,你就被社会淘汰了。社会不会等你到70岁。所以人类学棋,从小就要背棋谱、学定式。你要先拿到门票,才能走上这条路。你要先向时代妥协,等本事大了,再试图挣脱时代束缚,去克服时代的局限性。想上来就克服时代的局限性,就会先被时代克服掉。而一旦你先向时代妥协,就势必染上时代气息,后来再想克服时代的局限性,就很难了。——时代的局限性,已经成了你的局限性。不过,你可以生个儿子,克服你所在时代的局限性。

这就是为什么阿尔法狗要花几千万局战斗经验,才达到人类水平,阿尔法元只花了几百万局。其实,有很多围棋软件,在最初设计时就考虑过完全不用人类棋谱,结果根本不行,上来就被人类打的稀里哗啦。阿尔法元为什么可以?因为阿尔法元是从阿尔法狗来的,它虽然是一张白纸,但白纸的质地上,带着阿尔法狗的基因。这就好比,阿尔法狗先向人类学习,拿到门票,又生个儿子阿尔法元,克服了人类的局限性。

2、

阿尔法元很幸运:在他能够打败对手之前,始终是靠自己跟自己下棋来成长的。这就避免了,一些很好的苗头被扼杀在摇篮中。最开始,它是不会征子的,它可能过了十个小时以上,才慢慢学会征子和点三三。如果人类棋手,学棋十年才会征子和点三三,老师早就让他改行了。但阿尔法元并不因此吃亏。因为他的对手和他一样,也是慢慢学会征子、点三三的。如果一开始对手就是人类或者阿尔法狗,就会因此被痛虐。为了应付人类,它就会放弃一些可能发展很好的下法,被人类带着走,受到人类下棋模式的染污。

这就好比,一个创业公司,哪怕别的方面很强,很先进,就因为融资能力不行,就要被淘汰。它没有办法活下来。因为活不下来,那些先进的地方,也会随着它的死掉而死掉。

再比如,一个孩子很有物理天赋,完全有潜力成为一流的物理学家。前提是,他要进入好的大学。但是,他的英语不好。因为英语不好,他连一本都考不上。假如他的竞争者英语和他一样差,他就可以靠物理的优势,进入好的大学,成为物理学家。他最终没有成为物理学家,并不是因为他的物理不行,而是因为英语差,拖了后腿。

这个世界上,很多人不能充分发挥天赋,是因为不能像阿尔法元那样,始终成长在自己和自己竞争的环境里。人类社会,面临的是和别人竞争。你为了成为物理学家,要把很多精力花在补英语上。很多时候,我们要首先关注自己的短板,而不是发挥自己的长项。从短期看,和他人竞争会让自己在一开始时少吃亏;但从长期看,它会制约成长速度。

现在很多基础学科,人才流失很严重。如果一个人智商很高,十分适合去研究基础数学、物理。但是他会转行搞金融、计算机。因为来钱更快。我们活在世界上,要和别人竞争。如果搞基础研究,能拿到热门领域待遇的话,整个世界的科学进步会更快。这就是为什么,阿尔法元进步比阿尔法狗快。

有人讲,阿尔法元的例子,是不是说明,我们以后做研究就不用写文献综述了?阿尔法元表明,可以在一个新领域内从一张白纸出发,做到顶级水平。

但是,这有个前提,就是你要活得足够久。比如说,你从零开始研究物理,起步是阿基米德时代普通人的物理水平,不受人类历史上一切物理学家的影响,独立研究。你完全有可能在第1000年或者2000年的时候,研究出来超过人类现在水平的成果。但问题是,你在活到100岁之前就死了。阿尔法元成功的前提是,战斗经验超过这世界上任何人类50倍以上。它在10万局经验内和人类对弈,是要被吊打的。如果你可以保证你的寿命是一般人的50倍,你可以不写文献综述,不基于别人的任何研究。

还可以延伸到其他事上,比如婚姻。“门当户对”很重要,或者说:旗鼓相当。这样,彼此能够共同成长,谁也不嫌谁幼稚。如果出发时两人就认知相差太远,有依附与控制的关系,对谁的长远发展都不会太好。

3、

再说定式。实际上,没有什么定式。在阿尔法元70小时经验里,没有任何定式是一开始就有的。一切定式(我们把对局中出现概率大于某个数值的下法组合叫定式),都是到了某些时间节点才出现的,慢慢达到峰值,又渐渐下降,在某个时间节点后,渐渐消失。

这和人类定式发展的过程差不多。100年前的定式,现在有很多淘汰了,有些还保留着。保留至今的,也不代表一定成立,只是寿命比那些淘汰掉的更长一点。如果某个定式寿命超出了一代人,从你学棋的时候,就知道它是定式,等你死的时候,它还是定式。你就可能认为这个定式是天经地义的。实际上,可能再过两年,它就不成立了。

所谓定式,只是当对方棋力在某一水平区间内时,你按照这个套路下,不容易吃亏。一旦对方棋力突破了那个区间,旧有的定式就废掉了。我们看古代让子棋的很多下法,现在是不成立的。这种不成立,是在现在的人类棋力下不成立。古人当时那么下,考虑到对手的水平,用这个套路欺负他,是没毛病的。

我想从定式聊聊佛教。佛教有八万四千法门,可以看成八万四千定式。每一种定式,都有它适合的契机和土壤。过去的人可以靠某个法门成佛证果,现在的人就不一定行。因为任何定式,都有它适用的条件和环境。如果有永恒的定式,佛陀只需要说一个法门就够了,没有必要开演八万四千法门。

有些声闻乘修行者,不承认大乘佛教,认为大乘不是佛说的。这就好比,阿尔法元在前30小时里没有出现的定式,就认为它不成立。佛教有个词叫“圣言量”,释迦牟尼佛说过的,就叫圣言量。实际上,不止释迦牟尼佛说过的才叫圣言量。其他人只要证到圣果,说的话,也是可以作为依据的。阿罗汉、八地菩萨也是圣者,他们的话,也是可以作为依据的。如果认为,只有释迦牟尼的话才叫圣言量,才是唯一的依据,就否认了其他众生也可以修行成佛,否认了过去未来十方诸佛的存在。

释迦牟尼佛有些东西没明讲,是因为他在娑婆世界只示现了80年世寿。但不能仅仅通过80年的有限示现,去理解他全部的智慧。就好比阿尔法元在第40个小时中,不会下出一切定式,很多定式是后来才出现的。《解深密经》说:阿陀那识甚深细,我于凡愚不开演。为什么不开演?因为当对手在这个水平的时候,很多别的定式是不需要的。到现在,南传佛教不承认中有身,不承认第八识。理由是没见释迦牟尼佛明讲过那些定式。不过,虽然不承认中有身、第八识,但也承认“有分心”,靠“有分心”建立起三世流转。这“有分心”,与潜在相续的“细心”、“第八识”等,只不过是定式的不同变化,是并没有什么矛盾的。

再比如,念佛法门。如果去考察梵文,会发现“念佛”的“念”,本义是用心系念,不是口念称名。有些人就讲,中国传下来的净土法门搞错了,错会了经文意思。这就是不了解,法无定法,“定式”是不断变化的。过去合用的定式,后来可能就不好用了。最早的时候,念佛是要观想佛像的,这是此前流行很久,在印度就流行的定式。到了后来,不好用了,照这个定式修,能成就的人越来越少。为什么?因缘变化了。

“法”有不同的时代:正法时代、像法时代、末法时代。正法时代的定式,到像法时代就不好用了,像法时代的定式,到末法时代也不好用了。据此,道绰法师强调了新的念佛法门,到了善导大师,发扬光大。佛教不是像考古学,过去有的东西,就是成立的,没有的,就不成立。更像是科学,后起的研究,承续了前人,在表现上有所不同,只要内在精神一致,就是应当信受的。而表现形式不同,正是内在精神一致的必然要求。

今天,汉传佛教的修行者,一般都说现在是末法时代。但南传佛教不这么认为,上座部认为现在是正法时代。这并不矛盾。上座部到现在还流行着传统而古老的法门。这就好比,针对不同的对手,应该下不同的“定式”。所谓定式,并非一成不变,永恒有效。

4、

阿尔法元在官子方面,和人类下法相差不大。这没有任何疑问。因为官子是一种有固定解的题目。既然有固定解,谁下都差别不大。但阿尔法元在布局方面,和人类相似,可能说明两点:1、阿尔法元的布局还没有达到最高阶段。2、人类很聪明,在没有达到阿尔法元棋力的时候,就可以下出和阿尔法元接近的布局了。

如果在人类内部,比方假定,中日韩的围棋,不能进行任何交流,各自封闭发展一段时间,棋力应该会出现明显的高下之分。但这并不意味着,彼此下棋天赋有差距,而意味着其他变量的差别。一旦放开交流机制,彼此棋力就会渐渐趋同。因为,人和人在构造上,差别是很小的。而人类和人工智能,棋力不可能趋同,因为彼此的构造不一样。

不过,由人类研发的不同人工智能,未来有一天,会达到同样的棋力水平,那个时候,就接近了围棋的终点。也就是说,人类是可以穷尽围棋的。人类穷尽围棋,并不能靠自己死下,而是要借助人工智能。当围棋被穷尽的时候,也不是人工智能穷尽了围棋,而是人类穷尽了围棋。

阿尔法元虽然目前棋力已经高出人类很多,但并不是围棋的终点。什么时候会是围棋的终点呢?可以从两方面看,一方面,棋力最高的人工智能自己跟自己下,胜负完全取决于执白执黑,就接近围棋的终点了。

另一方面,不同的围棋软件,给定某个局面,会下出非常接近、甚至一样的下法——不是说某一手的下法,而是说随后到终局的序贯下法,那就接近围棋的终点了。为什么说“接近”呢?因为,能不能给出一致的下法,主要取决于给定局面进展到什么程度。越接近收官,越容易趋同;在布局阶段就下得一样,是不太容易的。假如说现在的顶级围棋AI,平均在100手的时候,能够给出一致的判断,未来会慢慢变成50手,甚至20手,10手。如果在给定任意10手的情况下,不同的围棋AI,能给出完全一致的胜负判断。就是说,下十手,棋就结束了,胜负已定。我们可以说,穷尽了围棋。

5、

现在很多文科博士不好毕业。很多文科博士很累,并不是因为需要你有多聪明,而是需要你看很多文献。这样的工作,是可以被人工智能取代的。有了数据库,我们做学术和古人做学术就很不一样了。清朝的乾嘉学派做了很多考据工作,那些工作如果交给AI做,很快就完成了。那些人如果生在今天,就会不幸一些,他们博闻强识的长处,没有办法发挥得淋漓尽致。我们照着过去的路子做学术,很多时候就不再能走得通。很多人想,过去的大师有什么禀赋,如果我也有,就可以达到跟他一样的高度,这是不会的。禀赋要跟时代结合起来才有意义。吴承学老师写了一篇《微信上的万里校书记》,放在过去,是不可以想象的。过去谁做了这样的工作,非常不容易。今天,完全有可能一个文科博士,花了七八年时间做好一篇博士论文,在他快写成的时候,人工智能介入,半个小时完成了同样的工作。

人工智能的介入,会给很多职业带来冲击。很多人首先想到的是一些体力劳动者,比如送外卖,装卸货。实际上,难道写论文就不是体力劳动吗?体力劳动在博士研究生的工作中,占到了很大的比重。很多时候你能做出成果,不是因为你比别人更聪明,更有洞见,只是因为你比别人更勤奋,更走运,有机会见到别人见不到的材料。

我的职业写作,人工智能也很容易介入。现在人工智能已经可以写新闻稿,写地震报道、财经稿件。很快,也能够写流行鸡汤,随笔散文。今天,还有很多新媒体从业者报名学习“如何写出10万加的文章”,明天,人工智能就可以批量生产10万加了。不过,这并不会对业已赚到钱的人造成太大打击,因为他们已经赚到钱了。很少有什么钱可以赚一辈子,如果有什么钱可以赚一阵子,又合理合法,就非常不错了。

这种变化,从根本上讲,并不是人工智能带来的。任何事情,都有它的生命周期。即便没有人工智能,像学京剧、吹唢呐、说书,这些行当也慢慢不行了。但它们的变体仍然可以在新的时代找到新的适应方式,比如当演员、谈钢琴、讲脱口秀。有些定式彻底废弃不用了,有些定式局部做了改进,演化出新的变化。

有种说法,未来的时代,人人都得会编程,不会就是废材,会被淘汰掉。有人三四十岁了,听到这话,赶紧去学编程。这是没有必要的。为什么呢?因为即便到了那个时代,你也已经死掉了,至少是退休了。所以完全不用担心。

我们不需要与人工智能赛跑。就好像老虎要吃人,我们不需要比老虎跑得快,只需要比周围人跑得快,就不会被吃掉。如果你周围很多人都不会编程,你有什么好害怕的呢?如果把50岁的孔子扔到现在,他也会很麻烦,很多东西,他已经很难再掌握了。他会出现很难与时代适应的问题。但如果是把10岁的孔子扔到现在,就一点问题也没有,他会适应得很快。所以,我们的最大问题,并不是不懂什么,而是不再年轻,不再了解新一代人。不过这个问题也不要紧。

只要我们不比周围的人跑得慢,就无需太过担心。有些人什么都不会,只会种地,人工智能来了,他们就要受苦了吗?不。从另一个角度看,他们要享福了。人工智能要帮他种地了。他就可以躺在家里因为失业而领国家补贴了。虽然发不了财,但相比付出来讲,还是不吃亏的。

只要我们能大体保证和周围人一样的节奏和步伐,就完全不用担心自己变成废材。变成废材的唯一路径是,活得足够久——活到别的不适应新时代的人都死了,自己还没死,就真的成了废材。但鉴于自己不可能那么长寿,所以废材的问题自然而然解决了。

有人否认这一点。他们认为,人工智能会带来天翻地覆的变化,此刻的人类正站在节点上。未来,永生是可能的。这个观点,就牵涉到另外的话题了。我并不想做更多的说明,只想简单说一句:以佛教的看法,并没有什么永生和死亡,有的只是,新东西不断替换掉旧东西。

未来会阿尔法元统治世界,人类变成乞丐吗?不会的。未来世界的统治者,即便不是人类,也不会是人工智能,只会是智能人——人类的智能后代。唯一的问题是衰老,如果持续地衰老下去,就会沦为乞丐。但死亡替我们解决了这个问题。而死亡,正意味着新生。

网址:王路:阿尔法狗,阿尔法元,阿尔法人 https://mxgxt.com/news/view/667708

相关内容

阿尔法和埃尔法的区别,阿尔法埃尔法指的是什么车
阿尔法
阿尔法狼
阿尔法围棋
阿尔法亚麻酸
阿尔法和埃尔法的区别是什么
阿尔法狗是什么
阿尔法和埃尔法的区别有什么啊
王小川:人类要重新思考与“阿尔法狗”的关系
王宏伟、阿尔法都来啦!

随便看看