走近 2050【第一部分】:机器真的会取代人类吗?人类又该何去何从?

北京师范大学系统科学学院副教授、集智俱乐部创始人张江老师的“走近 2050”讲座获得一致好评,讲座中涉及的知识面非常广,对各行各业都有所启发。
为了满足更多读者的需要,我们采取了众包的形式,在一众朋友的帮助下整理出了讲座的文字版,特将此文(共四部分)奉上。

 

第一部分:本文

第二部分:关于注意力

第三部分:占意理论

第四部分:展望未来

PART 1
人与机器

第一部分的主要内容是介绍人与机器之间的关系,包括人机大战、AI 发展现状、AI 的艺术可能以及 AI 威胁论,当中张老师还介绍了有趣的“奇点”,究竟人类将何去何从请看文章找到答案。

 

 人机大战

2016 年 3 月结束的人机大战:Alphago vs 李世石,让理工科特别是研究 AI 人工智能的人第一次直起了腰。

我从 07、08 年开始做 AI,那时候就处于抬不起头来的状态。不仅因为你做的事不赚钱,而且也得不到别人的认可。那时,机器人连走路都走不稳,你会好意思说自己是做机器人的吗?

但是今年发生了巨大的变化,“Alphago 事件”以后,人工智能变成了大众关注的焦点,而我也受到了各方关于介绍 AlphaGo 的邀请。

与此同时,我也听到了很多提问和质疑的声音。

恐慌

大家担心的是现在人工智能如此强大,是不是有可能真的像终结者电影里所说的那样——征服人类,或者更靠谱一点的说法是,是不是我们马上就要被人工智能(或机器人)抢走我们的饭碗(工作),然而现实真的是这样吗?

事实上,要知道人工智能的爆发,并不是诞生于今年,而是从大概 07 年开始,和一套叫 Deep Learning 的技术有关,也就是神经网络技术。神经网络技术在 80 年代兴起,07 年突然爆发,原因是因为网络变深了。什么是网络变深了?也就是说以前神经网络只有很浅的 3 层,现在是 5/6/7/8 层,变深以后就和人类头脑认知结构非常相似。

神经网络从人体的视觉系统中得到很多启发,包括如何引发深层的结构变化。另外,与此同时,由于互联网技术的发展,用大数据去补给新的神经网络,进行大量的学习。很快神经网络在模式识别、成像识别上的准确度提高了 10%。

 

过去,人们有这样的观点,人擅长形象思维,而机器擅长逻辑思维,但事实上,你会发现这种说法不完全对,因为计算机同样擅长形象思维,至少在视觉上。

我们来看一些数据。比如在计算机视觉识别人脸领域,机器能做到什么样的程度呢?

香港一个团队开发了一套用 Deep Learning 技术进行人脸识别,机器能达到的准确度是 99%,而人类的准确度则是 97.5%。

也就是说,机器识别人脸已经远高于人类的准确度。现在人脸识别这项技术已经很成熟了,马上会有工业化的应用。最简单就是,以后刷淘宝不需要什么密码,指纹,直接刷人脸就行了,它比人更准。

人脸识别技术不仅能识别人脸,它还能看图说话。

前年,Google 团队做了一个研究,像对待小孩一样给机器一张图,看完图以后机器能把图上的事情描述出来。下图这两个例子说明机器的描述还是相当靠谱准确的。现在机器近似能达到到 2~3 岁小孩的认知水平。

AI 在图像这块还有很多你想象不到的应用。因为人看世界的尺度是很有限的,人看的是日常的范围。但是一旦 AI 具有了视觉识别能力,它可以看更大尺度的东西,比如大数据。

上图这个应用,非常荣幸的介绍给大家。开发这个应用的是集智俱乐部的一个男孩,也是忠实的粉丝之一。大概 10 年加入俱乐部读书会,读书会散了以后,别人都走了,而他却辞掉了高薪的淘宝工程师的工作,自己去开发了一套系统,就把我说的人工智能在人工识别、视觉这一块应用起来。

其实我们可以从卫星去看这个云彩、水汽、运行的情况,然后根据这个来做天气预报。于是他们做了一版 APP,叫做彩云天气。这款 APP 可以精准地定位到你所在的位置、坐标,而且告诉你,两个小时以内是否会下雨,准确率达到 97%。

当这个 app 出来以后,事实上反响最大的不是 AI,而是气象行业,因为气象行业多年以来一直是靠人来盯着卫星云图看,所以需要一帮人来看图。但其实这种识图方式并不好,一来不准,二来很累人。现在好了,用机器就可以做精准的判断,这对气象行业来说是一个巨大的冲击。但是气象行业转型很快,马上就接受了这样一款人工智能程序,气象局很快就开始给彩云天气提供数据,同时把他们列为中国气象局的官方合作伙伴。现在彩云天气 APP 页面里会显示两个 logo,一个是中国气象局,还有一个就是集智俱乐部。

AI 的发展

AI 还可以听懂人话。最有代表性的事件就是另一场人机大战。这场大战在中国并不是很有名,但是如果你关注 AI 的发展,你应该知道,在 2010 年的时候,美国 IBM 公司开发了一款大型机叫做沃森。沃森和人类选手同台去参加一个“危险边缘”智力问答的游戏,主持人会问很多问题,这些问题来自各种学科、政治、经济、文化、科技,都有可能,然后人要在很短时间内判别出来这个问题问的是什么意思,同时要给出正确的回答。沃森和两位高水平的人类玩家同台竞技,结果沃森胜出了。

这意味着什么呢?

首先,人工智能能听得懂人话,不仅仅是能把你说的话变成一段文字,还能理解它。因为这是个电视节目,主持人很幽默,所以他经常会用一些夸张的,有时甚至是反讽的手段来提问题,所以机器必须对问题进行精确的理解。显然现在机器已经可以做到了。

AI 还能在无监督、无指导的情况下学习很多事情,比如说打游戏。2015 年一篇论文发表在一个重磅的学术刊物上,称 AI 可以学习打游戏,这个会打游戏的 AI 就是 AlphaGo 那个开发团队做的。你可能会觉得 AI 打游戏并不新鲜,游戏本来就是计算机设计的,计算机再自己去打。但是请注意一个区别:这个打游戏指的是,计算机盯着像素级别的屏幕,然后同时,什么信息都没有,只有动作和相应的输赢反馈。然后它就像人一样在没有导师指点的情况下,反复的玩这款游戏,最后把这个游戏玩会。也就是像人一样学习打游戏,可见计算机有很强的学习能力。

小时候你们肯定都玩过 PingPong(撞球游戏,有杆把球弹出去打砖块得分,不能把球漏掉)。计算机学习打砖块,能学到什么程度呢?跟人一样能找到窍门,比如说,打砖块的时候就有一个窍门,就把中间旁边一块给打穿,打穿后,把球打上去,这样就能得分。计算机可以自己学到这个窍门,没有人教就能学会,这就是现代人工智能发展的程度。

发展不仅仅是在软件这个层面,同时在身体硬件配备上,机器人走进我们的生活,成为一种新物种。


全世界最厉害的一个机器人公司叫波士顿 dynamics。他们生产了一款大脚四足机器人,走路的姿态和驴或马是一致的。右图是最新款的人型机器人,(Atlas) 阿塔拉斯,走路相当平稳,而且人把他推倒,他自己可以站起来。图灵机器人是北京汽车俱乐部的一个合作伙伴做的,他们的产品现在全国各地卖得非常火,马上会来到我们日常的生活。
那么有人开始议论,机器人是很牛主要是在认知这个领域,像看图、理解人的语言等等其他方面机器人还是无法超越人类,比如说人类擅长创造性思维,但机器能不能创造?实际上这最后一个避风港湾,也马上会被机器所抢占,关于机器的创造性,接下来我给大家展示几个最新的一些进展。

AI 与艺术

在艺术方面,这张图是由神经网络,就是上文中提到的深度学习技术,绘制出来的进行加工再加工的一张图,那么你会发现由机器画的图,是抽象的而且很诡异。

实际上这是一套神经网络学习的结果,人工智能看了大量图片,然后再从图片中提取一个模式,最后在图上进行了相应的操作。如果给这个网络看大量的世界名画,那么最后能做到什么程度?非常有趣的是他能从看的画里面,学出来所谓的风格,我们说艺术家他绘画有风格,比如梵高的星空,一看就知道那是梵高的那个画,所以有深深的烙印在你脑子里,尽管他画的不是星空,你也能知道这个梵高的作品,因为他有一个所谓的 style。风格这件事情,现在机器也可以学会,而且他还可以去应用。

 

奇点临近

我们能明确地感知到压力,作为人生存的一种压力,一个新的物种真的慢慢在向我们逼近。事实上,大概在 09 年,库兹韦尔是美国的一个所谓的未来学家,在美国有很多这种人,像凯文·凯利,大家都熟悉的 KK。库兹韦尔在 09 年根据机器的发展趋势曲线做了一个预言,他发明的是指数增长,把这个做一个拟合,横坐标是时间轴,多少多少年,纵坐标轴是机器的计算能力,机器就相当于芯片那个速度去做衡量,然后把机器的发展就点成三点,同时去用指数的曲线去做拟合,拟合以后还可以去做外推,得到一条外推曲线,外推到什么时候呢?就是和不同的物种的计算能力去做对比,所以你看这里面是细菌,它的计算能力可以到这个水平,10^-3,细节我们不展开,总而言之,是一种手段衡量出来的计算能力,智力水平吧,这是线虫,这是老鼠,人是在这个位置,比较高的一个位置,于是他就做一个外推,看什么时候这条外推的曲线和人会在一个交汇点,那么一看这个交汇点发生在 2045 年左右,于是库兹韦尔,就提出来那个词叫奇(qí)点。

注意这个词,很多人会念“jī”,奇数、奇偶性。我被一位老先生纠正过,那个来源于是英文 Singularity, single 是奇异的,所以他应该是奇异点,所以他就提出来一个奇点临近理论,他说到 2045 年,机器的计算能力将会超过人类,这个是技术曲线看到的,但是到 2045 年超越人类的时候,会发生什么?其实这件事数据没有告诉我们任何答案,于是库兹韦尔老先生开始大发厥词,提出了很多设想,他说人类将面临着 2 种命运:一种命运是将会被机器征服;另外一种可能命运是人类将实现永生。这两个好像截然相反的猜测,总会有一个对的。因为人都是有猎奇心理的,马上就有了一些追随者, 包括很多中国人,也包括我自己在内。

 

AI 威胁论

2045 年真的是快来了,阿尔法狗把人类干掉了,事实上越来越多的关于 AI 威胁论的声音出现。对于人类将会被机器战胜这件事,还并没有很多人相信,更多的人觉得真正的威胁在于,我们的工作将会被机器所取代。

这个问题很实在的,因为大家电视上也有看到一些报导,自动驾驶技术已经很成熟了。如果正式投入使用,那马上就将有一批司机失业,因为机器去开车,平稳、花钱又少,为什么不让它去开呢。所以很多很多人就将面临失业,这个数字来源于一个 1 月份刚刚开的世界经济论坛,它给出了一个报告,预测在未来的 5 年,将会有 15 个主要国家的就业岗位将会减少 710 万,这是一个相当可观的数字,那么什么样的人就有可能失业呢?报告表明有三分之二的失业人员属于行政人员,比如银行职员,或者坐办公室的没事看看报纸,开个发票的这类人最有可能是失业者。为什么,其实也很简单,因为这种工作真的是不需要什么脑力,而且这种领域让人去做,还有可能会滋生腐败,各种人性的东西可能会暴露出来,所以用机器去替代反而可以规避一些问题。包括美国莱茨大学的一名教授也提供了一种说法,在 2045 年,失业率将超过百分之五十,这是很恐怖的一件事。

我们人类和机器到底是一种什么样的关系?

读读历史,你就会发现,中国人特别喜欢去想,人怎么去治人,人和人怎么去斗,西方人特别擅长于去思考我怎么去制造机器,怎么去研究自然。但其实我最关心的是一个更新更有意义的命题,那就是人和机器到底是一个什么样的关系?

人和机器将会怎样去交互?

在未来的这几年,在奇点来临的时候,

在 2050 年的时候人和机器的关系到底是什么?

于是,我就开始要做这样的一个思考:思考人和机器的关系,要么就是机器要么就是人,那我到底是站在哪一边呢?首先我给大家一个回答,因为我是一个人,这个毋庸置疑,我一定要站在人这边,至于机器人这边,那是人工智能这个学科。我们主角是站在人这一面,那么人面对机器,什么又是人本质的东西呢?实际上我们需要用一些禅宗的思维,我真的去练习冥想,练习静坐。

深思,什么是人的本质?首先我是一个人,那么人的本质是什么。当我思考我的本质的时候,就会想到一个笛卡尔的那句话:“我思故我在”。这句话经常会被人们误解,不是说我思考所以我存在,实际上是说,笛卡尔他在质疑这个世界,这个世界可能一切都是假的,一切都可能是一个缸中之脑。但是我唯一可以确认不是假的东西是什么呢?就是那个正在思考的我,这个是我思故我在的原始含义。也就是说,那个正在思考的我是其实就是一个自我意识,或者用今天讲座的主题之一,就叫做注意力。注意力实际上是我们的意识的一种线性流动的过程,这个东西才是我的最本质的东西。既然已经知道了我的最本质的东西,我相信我是人,那么人最本质的东西也应该如此,于是,就得到了一个答案,我们人类和机器之间要发生联系,那么这个联系的中介就是注意力。发现了这样一个重要的突破点以后,我就得到了一个非常庞大的景观,好像真的看见一样,而且非常凑巧的是,这样一个人和机器的景观,事实上已经拍成一个非常著名的电影,叫做黑客帝国,matrix。这个电影太重要了,它给我们描绘了一个非常遥远的未来,首先机器给人类提供了一个大型的虚拟世界,每一个人一出生就插了一个插孔,转瞬就进入一个虚拟世界去生存。这是一个大型的网络游戏,一方面机器给人提供的是一个沉浸的虚拟世界,另外一方面,人给机器提供的是什么呢?人给机器提供的是生物的能量。

这个电影假设,在未来,由于核战争地球表面被乌云遮蔽,没有太阳光。机器没有能量的获得,它就只能从人的身上获取生物能。所以机器把人类圈养在虚拟世界里面,人的生物能量源源不断给机器发电。这个景象像恐怖的种植农场。这个黑客帝国所描述的景象,跟我刚才顿悟的东西有啥关系呢?

首先,第一句话,机器给人提供是一个大型的沉浸的虚拟世界,另一句话是说,人给机器提供的是生物能量。你只要把这句话里面的能量换成注意力,或者反过来说,注意力你理解成一种能量,那么你就会发现黑客帝国里的这个世界实际上已经来临。我们现在正在给一个大型的机器提供能量,这个能量就是注意力。首先,这是有科学根据的,另外一方面,中国强调修身养性,有一种说法,说我们人有精力。精力、精气神,实际上注意力就是一种精,是广义的一种能量。

所以注意力不能耗得太多了。但实际上我们已经耗的太多,为什么呢?因为我们在面对大量屏幕,不要小看这些屏幕,它们很恐怖的,它们其实就是在吸收你们的“精”。你有没有发现你醒的时间,80%以上都是在面对各种屏幕。比如你来听我的讲座,这里显然是一个屏幕啊。我们这是个投影,投影也是一个屏幕。你说你讲课没劲,我看我自己的手机。手机是什么,还是一个屏幕啊,你说你们能逃脱屏幕吗?逃不掉啊。那么屏幕是什么? 当然屏幕不仅仅是一个平面。他的背后实际上连的是互联网,或者更广义地说,它其实联系的就是一个机器世界。而机器世界恰恰是因为获取了人的注意力,它才能够演化进化发展。当然这个逻辑链条现在看起来没那么直接,没那么自动化。你看的东西越多,也就意味着您使用这种东西越多。使用的越多意味着什么?意味着你会给商家做反馈。那么商家就有可能更有动力去调整它的产品,来去适应你对他的期望。

比如你使用一个手机 APP,你使用多了他这个商家才有可能获得更多的投资。他会把更多的钱用于去改进它。比如说微信这样的精益创业。实际上它背后就有一个庞大的机器,而且人在推动它进化。如果说注意力是这样的源源不断的能量,那么我们知道真实世界的能量,会有马达、引擎这个东西,源源不断地把它输出用于做工。让汽车能够跑起来,让发电机能发电……

我们自然会问这样一个问题:

我们如何能够把人类的注意力源源不断地提炼出来呢?或者换句话说,机器对于我们来说,到底会起到用什么作用呢?

实际上这是第二论段,这个论断就是说:游戏事实上是注意的引擎,就像我们发的发动机一样,它可以源源不断把注意力提炼出来,用于推动机器的演化。这就构成了这样的关系,在未来的世界将会看到越来越多的这种游戏,它可以源源不断地把人的注意力给抓取过来。同时推进我们这个机器世界的发展。

讲了这么多,其实仅仅是一个的背景知识。后面,我们将会更进一步的把我上文中提到的这样一个大的宏观的景象,也就是人和机器的关系来做进一步的延展。

 

第一部分:本文

第二部分:关于注意力

第三部分:占意理论

第四部分:展望未来

 

发布者:Cara,转载请注明出处:http://www.makercollider.com/post/4687

发表评论

登录后才能评论
QR code