幾乎所有人都在享受人工智能帶來(lái)的便利,但你了解它是如何運(yùn)作的么?
這個(gè)問(wèn)題也曾困擾著谷歌前工程專(zhuān)家肖恩·格里什(SeanGerrish)。這位普林斯頓大學(xué)機(jī)器學(xué)習(xí)博士說(shuō):“我花了無(wú)數(shù)時(shí)間在學(xué)術(shù)界和產(chǎn)業(yè)界研究和實(shí)踐機(jī)器學(xué)習(xí),但我仍然不能堅(jiān)定連貫地回答這個(gè)問(wèn)題?!?/span>
這個(gè)困擾成為強(qiáng)大動(dòng)力,他決定弄清楚一個(gè)問(wèn)題:智能機(jī)器如何思考。這八個(gè)字也成為他新書(shū)的標(biāo)題《智能機(jī)器如何思考:深度神經(jīng)網(wǎng)絡(luò)的秘密》?!斑@是一本如果我不懂機(jī)器學(xué)習(xí),我將會(huì)想讀的書(shū)?!彼f(shuō)。
“在用清晰易懂的方式描述這些系統(tǒng)的本質(zhì)時(shí),肖恩利用10多年的行業(yè)和學(xué)術(shù)經(jīng)驗(yàn)解決了機(jī)器學(xué)習(xí)帶來(lái)的一些最棘手的問(wèn)題……由于市場(chǎng)上缺乏對(duì)機(jī)器學(xué)習(xí)通俗易懂的專(zhuān)業(yè)介紹,這本書(shū)將成為引導(dǎo)你理解底層技術(shù)的理想方法,它可以幫助你更好地判斷哪些言論值得相信,哪些說(shuō)得天花亂墜的謬論應(yīng)該被拋棄。”微軟CTO(首席技術(shù)官)凱文·斯科特說(shuō)。
“計(jì)算機(jī)和軟件,是21世紀(jì)的杠桿、齒輪和發(fā)動(dòng)機(jī)”
兩千年來(lái),人類(lèi)總被“自動(dòng)機(jī)”驚艷。
違背“水往下流”自然規(guī)律的噴泉,曾驚艷了兩千多年前的古希臘,其實(shí)就是早期的自動(dòng)機(jī)
1737年,一個(gè)可以像真人一樣用長(zhǎng)笛演奏音樂(lè)的雕塑,成為兩百多年前歐洲富人趨之若鶩的新奇玩意,這是法國(guó)機(jī)械天才雅克·德·沃康松的杰作。
今天,自動(dòng)駕駛汽車(chē),能與人類(lèi)自如交流的機(jī)器人索菲亞,不斷刷新著人們對(duì)于“自動(dòng)機(jī)”的認(rèn)識(shí),甚至誕生了對(duì)“人工智能”的恐慌,“自動(dòng)機(jī)”究竟發(fā)生了怎樣的變化?
讓我們先回到1737年,工業(yè)革命的黎明時(shí)分,長(zhǎng)笛演奏者誕生的那一年。
當(dāng)他出現(xiàn)時(shí),公眾很喜歡但并不太驚訝,因?yàn)檫@樣的裝置已經(jīng)出現(xiàn)過(guò)。但當(dāng)這位長(zhǎng)笛演奏者把真實(shí)的長(zhǎng)笛舉到嘴邊,用它的機(jī)械肺把空氣送入樂(lè)器,吹出一個(gè)個(gè)音符,然后通過(guò)移動(dòng)嘴唇,調(diào)整吹氣的力度,控制手指精確地在長(zhǎng)笛孔上移動(dòng),吹出一系列音符,組成一首完整的樂(lè)曲時(shí),依然吸引了眾人的目光。沃康松甚至向一小部分觀眾收取相當(dāng)于一周薪水的費(fèi)用,讓他們觀看這個(gè)奇怪的裝置。
有人懷疑雕塑里面藏著人暗地操作,沃康松直接向觀眾展示了長(zhǎng)笛演奏者的內(nèi)部機(jī)制,那是由風(fēng)箱、氣管、軸、小螺柱、彈簧、杠桿組成的機(jī)器。“它只不過(guò)是在遵循編碼到它機(jī)械內(nèi)臟中的一系列指令?!毙ざ鲗?xiě)道,“自動(dòng)機(jī)之所以受歡迎,正是因?yàn)樗雌饋?lái)是完全自主的,而且它似乎復(fù)制了人類(lèi)的智能?!?/span>
今天,自動(dòng)駕駛的汽車(chē),戰(zhàn)勝柯潔的AlphaGo,似乎都已與兩百多年前的長(zhǎng)笛演奏者截然不同,因?yàn)樗麄兛梢韵袢嘶騽?dòng)物一樣自主運(yùn)行,甚至似乎可以“獨(dú)立思考”。
但肖恩卻說(shuō):“事實(shí)證明,技術(shù)專(zhuān)家在過(guò)去的幾個(gè)世紀(jì)里沒(méi)有太大變化,他們?nèi)匀辉谠O(shè)計(jì)自動(dòng)機(jī)并給它們編程,以此復(fù)制人類(lèi)的思想和身體。唯一的區(qū)別是,技術(shù)專(zhuān)家已經(jīng)把工具升級(jí)為計(jì)算機(jī)和運(yùn)行在計(jì)算機(jī)上的軟件,它們是21世紀(jì)的杠桿、齒輪和發(fā)動(dòng)機(jī)。”
“無(wú)人車(chē)”:如何“看”世界?
首先,我們來(lái)看看自動(dòng)駕駛汽車(chē)。
人類(lèi)開(kāi)車(chē)最關(guān)鍵的是觀察路況,而路況是復(fù)雜的,如穿越馬路的行人、丟失的井蓋、逆行的汽車(chē)……那么,自動(dòng)駕駛的汽車(chē)又是如何“睜開(kāi)眼看世界的”。
肖恩用2005年美國(guó)無(wú)人車(chē)挑戰(zhàn)賽上獲勝的斯坦利為例,講述這輛由斯坦福車(chē)隊(duì)制造的賽車(chē)如何觀察路況,如何感知這個(gè)世界。
斯坦福大學(xué)人工智能實(shí)驗(yàn)室為斯坦利設(shè)計(jì)了由三個(gè)獨(dú)立部分組成的架構(gòu):硬件層,感知層,思考層。
硬件層就像人的眼睛、耳朵和雙腿,負(fù)責(zé)收集數(shù)據(jù)以及執(zhí)行“大腦”傳來(lái)的指令,比如“轉(zhuǎn)向、剎車(chē)、加速”。硬件層包括傳感器和執(zhí)行器,傳感器有攝像機(jī)、激光掃描儀和GPS系統(tǒng)等。
思考層就像汽車(chē)的“大腦”,負(fù)責(zé)決定汽車(chē)的實(shí)際駕駛方式,將命令發(fā)送給硬件層去執(zhí)行。
中間的感知層則負(fù)責(zé)“翻譯”,將硬件層收集到的信息及原始數(shù)據(jù)轉(zhuǎn)換成可解釋的模型,提供給思考層完成工作。
斯坦利具體是如何“看”的?當(dāng)人類(lèi)看到一條道路的照片時(shí),一眼就能清楚地看出照片的哪一部分是道路,哪一部分是道路的邊緣,哪一部分是天空。對(duì)計(jì)算機(jī)程序而言,這些細(xì)節(jié)一開(kāi)始并不明顯。斯坦利需要一步步地從攝像機(jī)的圖像中找到道路。
“為了做到這一點(diǎn),斯坦利采用了機(jī)器學(xué)習(xí)中一種被稱(chēng)為聚類(lèi)(clustering)的技術(shù),把具有相似顏色的像素組織在一起。這樣它才可以更好地判斷一個(gè)像素是屬于道路的一部分,還是屬于道路邊緣的一部分?!?/span>
肖恩用通俗的方式解釋說(shuō):請(qǐng)想象你是一個(gè)剛洗了一大堆襪子的吸血鬼,吸血鬼最喜歡的顏色是紅色和黑灰色。從洗衣店回家后,你開(kāi)始整理這些襪子,將它們攤開(kāi)放在床上,把同色系的襪子放在一起。一段時(shí)間后便會(huì)出現(xiàn)一堆紅襪子和一堆黑灰襪子,它們可能會(huì)在深紅色和深灰色相交的地方重疊。但你發(fā)現(xiàn)了一只亮綠色的襪子,這只襪子顯然不屬于兩堆襪子中的任何一堆,所以你扔掉了它。
這正是斯坦利推理攝像機(jī)圖像像素的方式。它通過(guò)查看代表汽車(chē)前方路面的像素來(lái)創(chuàng)建道路像素的聚類(lèi)。在沙漠中,你可以想象代表這些道路的像素可能是灰色和棕色的混合,這會(huì)導(dǎo)致斯坦利最終得到一個(gè)灰色像素聚類(lèi)和一個(gè)棕色像素聚類(lèi)。然后,斯坦利會(huì)測(cè)試圖像中其他像素是否與這兩個(gè)聚類(lèi)匹配。如果與聚類(lèi)匹配,它們就是道路的一部分,否則,斯坦利就會(huì)拒絕它們,認(rèn)為它們不是道路的一部分,就像你扔掉綠襪子一樣。
今天的無(wú)人汽車(chē)“看”的方式比斯坦利更加復(fù)雜,但“分類(lèi)”依然是它的重要任務(wù),明確對(duì)象是什么。
智能體:沒(méi)人教,也能學(xué)會(huì)打游戲
在自動(dòng)駕駛汽車(chē)項(xiàng)目如火如荼之際,谷歌收購(gòu)了一家名為DeepMind的神秘小公司。在谷歌一次每周五召開(kāi)的全員會(huì)議上,DeepMind給大家展示了計(jì)算機(jī)程序玩《太空入侵者》的一段視頻。
在這款游戲中,玩家必須移動(dòng)屏幕底部的一艘宇宙飛船來(lái)射擊外星人,阻止外星人降落到底部。計(jì)算機(jī)程序無(wú)可挑剔地玩著游戲,完美地贏了一局游戲,房間里爆發(fā)出一陣歡呼。
為什么圍觀的谷歌工程師如此興奮?“IBM難道不是早在近20年前的1997年就創(chuàng)造了‘深藍(lán)’,擊敗了世界上最好的國(guó)際象棋棋手加里·卡斯帕羅夫嗎?谷歌的工程師難道不知道他們的自動(dòng)駕駛汽車(chē)已經(jīng)在道路上行駛了近70萬(wàn)英里?如果連自動(dòng)駕駛汽車(chē)都是可能的,那為什么所有人都對(duì)計(jì)算機(jī)攻克一款簡(jiǎn)單的電子游戲嘖嘖稱(chēng)奇?況且此時(shí),計(jì)算機(jī)可以高水平地玩電子游戲也已經(jīng)有多年歷史了?!?/span>
肖恩說(shuō):“這個(gè)計(jì)算機(jī)程序之所以讓人贊嘆,是因?yàn)樗鼘W(xué)會(huì)了在沒(méi)有人類(lèi)指導(dǎo)的情況下玩游戲。而早期的突破需要相當(dāng)大程度的人類(lèi)判斷力和對(duì)算法的調(diào)整。對(duì)于自動(dòng)駕駛汽車(chē),人類(lèi)需要精心開(kāi)發(fā)探測(cè)可行駛地形的功能,然后告訴汽車(chē)可以在哪種地形上行駛。相比之下,程序員從來(lái)沒(méi)有告訴過(guò)DeepMind程序向左輕撥操縱桿會(huì)讓飛船向左移動(dòng),按下按鈕會(huì)發(fā)射導(dǎo)彈,甚至也沒(méi)告訴程序向外星人發(fā)射導(dǎo)彈會(huì)摧毀外星人并贏得積分?!?/span>
那么,沒(méi)有人指導(dǎo),計(jì)算機(jī)是如何學(xué)會(huì)玩游戲的呢?答案是強(qiáng)化學(xué)習(xí)。
“就像當(dāng)你給寵物狗食物的時(shí)候它會(huì)學(xué)會(huì)聽(tīng)從命令一樣,通過(guò)強(qiáng)化學(xué)習(xí)來(lái)學(xué)習(xí)的智能體也會(huì)學(xué)會(huì)聽(tīng)從你的命令。”
肖恩用訓(xùn)練智能體打高爾夫球?yàn)槔?。有一個(gè)很大的高爾夫球場(chǎng),球場(chǎng)上到處都有會(huì)爆炸的地雷,有復(fù)雜的地形比如果嶺、球道、沙坑等,智能體需要避開(kāi)所有的障礙,揮舞球桿將高爾夫球打到球場(chǎng)盡頭的球洞中。這些障礙和風(fēng)險(xiǎn),智能體一開(kāi)始可能并不知道,“但我們?nèi)匀豢梢越探o它好的策略,方法就是讓它玩一段時(shí)間。當(dāng)它達(dá)到終點(diǎn)位置時(shí),游戲結(jié)束,我們立即給它一塊巧克力作為獎(jiǎng)勵(lì)。如果智能體踩到地雷,我們會(huì)用電擊懲罰它,相當(dāng)于減去半塊巧克力”。
這多么像著名心理學(xué)家斯金納提出的“強(qiáng)化理論”。他曾設(shè)計(jì)一種動(dòng)物實(shí)驗(yàn)儀器即著名的“斯金納箱”。箱內(nèi)放進(jìn)一只白鼠或鴿子,并設(shè)一杠桿或鍵,動(dòng)物在箱內(nèi)可自由活動(dòng),當(dāng)它壓杠桿或啄鍵時(shí),就會(huì)有一團(tuán)食物掉進(jìn)箱子下方的盤(pán)中,動(dòng)物就能吃到食物。
斯金納認(rèn)為,無(wú)論是人還是動(dòng)物,為了達(dá)到某種目的,都會(huì)采取一定的行為,這種行為將作用于環(huán)境,當(dāng)行為的結(jié)果對(duì)他或它有利時(shí),這種行為就會(huì)重復(fù)出現(xiàn);當(dāng)行為的結(jié)果不利時(shí),這種行為就會(huì)減少重復(fù)出現(xiàn)的可能。這就是環(huán)境對(duì)行為強(qiáng)化的結(jié)果。強(qiáng)化理論最初只用于訓(xùn)練動(dòng)物,后來(lái)用于人的學(xué)習(xí),并發(fā)明了程序教學(xué)法和教學(xué)機(jī)。
人類(lèi)的成長(zhǎng)不也是通過(guò)一步步試錯(cuò),獲得正反饋或負(fù)反饋從而調(diào)整自己的行為,最后形成自己的行為規(guī)范?這不得不讓人想起哲學(xué)家笛卡爾1662年的《人類(lèi)論》中的一句話(huà):
我想,身體也只是一個(gè)工具或機(jī)器……就如同我們的鐘表、人工噴泉、鋸末機(jī)和其他類(lèi)似的機(jī)器,即便它們只是由人類(lèi)做成,但他們能夠按自己的規(guī)律做自己的事。
未來(lái):我們的機(jī)器總有一天會(huì)思考,這是大勢(shì)所趨
人工智能的發(fā)展并非一帆風(fēng)順。
在過(guò)去的20年里,許多在人工智能領(lǐng)域引起轟動(dòng)的想法與半個(gè)世紀(jì)前的20世紀(jì)60年代末引起轟動(dòng)的想法如出一轍。
“當(dāng)時(shí),人工智能領(lǐng)域貌似在飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)得到了改進(jìn),國(guó)際象棋和圍棋等游戲的算法得到了開(kāi)發(fā),行業(yè)會(huì)議上的成果以及隨著微處理器的出現(xiàn)而呈指數(shù)級(jí)增長(zhǎng)的硬件全都令人感到興奮,人工智能會(huì)議似乎場(chǎng)場(chǎng)爆滿(mǎn)——所有這一切都發(fā)生在人工智能領(lǐng)域進(jìn)入一個(gè)被稱(chēng)為‘人工智能寒冬’的黑暗時(shí)期之前。后來(lái)人工智能研究的資金枯竭了幾十年。人工智能甚至成為一些研究人員口中的笑柄。在20世紀(jì)80至90年代的大部分時(shí)間里,這種恐慌一直在持續(xù),直到人工智能領(lǐng)域在過(guò)去20年里重獲新生?!?/span>
今天,機(jī)器越來(lái)越像人類(lèi),人類(lèi)似乎也越來(lái)越像機(jī)器。
會(huì)不會(huì)有一天,機(jī)器可以獨(dú)立思考、產(chǎn)生情感甚至駕馭人類(lèi)?
盡管肖恩刻意回避對(duì)人工智能的未來(lái)做過(guò)多猜測(cè),但他認(rèn)為:“首先,我們?cè)谖磥?lái)創(chuàng)建的自動(dòng)機(jī)將會(huì)始終遵循程序……這些機(jī)器將會(huì)遵循越來(lái)越復(fù)雜的程序。辨別它們?cè)谧鍪裁词虑橐矔?huì)變得越來(lái)越困難,但是我們始終有可能將它們執(zhí)行的每一個(gè)動(dòng)作追溯到一組確定的指令。”
“一些哲學(xué)家認(rèn)為,這表明機(jī)器永遠(yuǎn)不會(huì)思考。我個(gè)人的信念是,人類(lèi)也是機(jī)器,我們是模擬機(jī)器,如果我們相信人類(lèi)可以思考,那么就沒(méi)有什么能阻止我們有朝一日設(shè)計(jì)出可以思考的數(shù)字計(jì)算機(jī)。我們的機(jī)器總有一天會(huì)思考,這是大勢(shì)所趨,它們會(huì)產(chǎn)生情感、觀點(diǎn)和自我保護(hù)的愿望,這些總有一天會(huì)與我們?nèi)祟?lèi)發(fā)生沖突?!?/span>