新聞中心
人物動(dòng)態(tài) | 明斯基:差點(diǎn)將AI扼殺在搖籃里的人工智能之父
馬文·明斯基
1月24日,在波士頓去世的馬文·明斯基(Marvin Minsky)的身后,有一長(cháng)排讓人肅然起敬的稱(chēng)號:人工智能之父、世界上首個(gè)人工智能實(shí)驗室——麻省理工學(xué)院人工智能實(shí)驗室的聯(lián)合創(chuàng )始人、計算機領(lǐng)域頂級獎項圖靈獎的獲得者、虛擬現實(shí)先驅等等等等。但明斯基最重要的遺產(chǎn),是神經(jīng)網(wǎng)絡(luò )技術(shù)。沒(méi)有明斯基,今天大部分的科技應用,或許和你根本無(wú)緣。
舉例來(lái)說(shuō),當你使用語(yǔ)音助手查詢(xún)天氣、進(jìn)行語(yǔ)音輸入時(shí),用搜索引擎去搜索某張圖片時(shí),和朋友聊天使用實(shí)時(shí)翻譯服務(wù)時(shí),你可能不會(huì )注意到,這些工具背后的一個(gè)共同點(diǎn):深度學(xué)習技術(shù)。過(guò)去幾年,深度學(xué)習,以及作為其基礎的人工神經(jīng)網(wǎng)絡(luò )正在快速發(fā)展,國內的阿里巴巴、百度、科大訊飛,國外的谷歌、微軟、IBM等公司都試圖在這一領(lǐng)域搶占先機。
《紐約時(shí)報》在訃告中,引述明斯基的同事、計算機科學(xué)家艾倫·凱(Alan Kay)的評價(jià):“馬文在計算領(lǐng)域中具有罕見(jiàn)的卓識,他把計算機從花瓶般附屬機器的定位中解放出來(lái),并意識到計算機的使命,是成為有史以來(lái),人類(lèi)能力最強大的放大器?!泵魉够倪h見(jiàn)如今已經(jīng)成為現實(shí),但是在人工智能的搖籃期,他卻差點(diǎn)親手扼殺了我們今天享受到的一切。
深度學(xué)習技術(shù)的早期工作可以追溯至20世紀40、50年代,而明斯基正是這一領(lǐng)域的先行者。在哈佛大學(xué)讀本科期間,他曾開(kāi)發(fā)了早期的電子學(xué)習網(wǎng)絡(luò )。在普林斯頓大學(xué)念研究生時(shí),他又建造了第一臺神經(jīng)網(wǎng)絡(luò )學(xué)習機SNARC。1956年,明斯基與“人工智能”的提出者約翰·麥卡錫(John Mcarthy)以及信息論之父克勞德·香農(Claude Shannon)等人一同發(fā)起了“達特茅斯會(huì )議”,促成了人工智能革命的到來(lái)。
然而1969年,明斯基與西蒙·派珀特(Simon Papert)合著(zhù)的著(zhù)作《感知機》卻被業(yè)內普遍認為極大地阻礙了神經(jīng)網(wǎng)絡(luò )的發(fā)展。明斯基在這本書(shū)中著(zhù)重闡述了“感知機”存在的限制。他指出,神經(jīng)網(wǎng)絡(luò )被認為充滿(mǎn)潛力,但實(shí)際上無(wú)法實(shí)現人們期望的功能。
在他看來(lái),處理神經(jīng)網(wǎng)絡(luò )的計算機存在兩點(diǎn)關(guān)鍵問(wèn)題。首先,單層神經(jīng)網(wǎng)絡(luò )無(wú)法處理“異或”電路;其次,當時(shí)的計算機缺乏足夠的計算能力,滿(mǎn)足大型神經(jīng)網(wǎng)絡(luò )長(cháng)時(shí)間運行的需求。
由于被明斯基這樣的權威人士看衰,神經(jīng)網(wǎng)絡(luò )和深度學(xué)習技術(shù)的研究迅速陷入了低谷,70年代則成為了“人工智能的寒冬”。2014年加入谷歌的人工智能專(zhuān)家杰弗里·辛頓(Geoffrey Hinton)當時(shí)正在讀研究生,他也感受到了這樣的“惡意”。當時(shí),當他告訴周?chē)俗约赫谘芯咳斯ど窠?jīng)網(wǎng)絡(luò )時(shí),人們總會(huì )這樣回應:“難道你不明白么?這些東西沒(méi)用?!?/span>
相關(guān)研究直到1978年才開(kāi)始逐漸復蘇,而其中的關(guān)鍵人物則是辛頓和哈佛大學(xué)神經(jīng)生物學(xué)博士特里·謝伊諾斯基(Terry Sejnowski)。據《紐約時(shí)報》記者約翰·馬爾科夫(John Markoff)在《與機器人共舞》一書(shū)中介紹,1982年,辛頓舉辦了一場(chǎng)夏季研討會(huì ),主題是聯(lián)想記憶的并行模型,而與會(huì )的謝伊諾斯基當時(shí)正在探索如何通過(guò)新方式來(lái)為大腦建模。他們的理念一拍即合。隨后幾年,從并行分布處理方法起步,他們創(chuàng )造了新的多層網(wǎng)絡(luò )“玻爾茲曼網(wǎng)絡(luò )”。這項研究也證明,《感知機》一書(shū)中所做的預言,即感知機無(wú)法被推廣至多層網(wǎng)絡(luò ),是完全錯誤的。
辛頓和謝伊諾斯基隨后嘗試通過(guò)語(yǔ)言問(wèn)題來(lái)展示新技術(shù)的力量。第一步,他們讓神經(jīng)網(wǎng)絡(luò )去學(xué)習一本兒童讀物。在啟動(dòng)的不到1小時(shí)內,神經(jīng)網(wǎng)絡(luò )就開(kāi)始工作。最初,它能正確說(shuō)出兩個(gè)單詞,而之后詞匯量開(kāi)始越來(lái)越豐富,并開(kāi)始自我完善。隨后,他們向神經(jīng)網(wǎng)絡(luò )提供了更復雜的學(xué)習材料,例如一本有兩萬(wàn)多個(gè)單詞的詞典。在經(jīng)過(guò)不斷學(xué)習后,神經(jīng)網(wǎng)絡(luò )甚至能朗讀從未見(jiàn)過(guò)的新詞。
他們將這一程序命名為Nettalk。這一神經(jīng)網(wǎng)絡(luò )集成了300個(gè)被稱(chēng)作“神經(jīng)元”的模擬電路,并分為三層,包括用于捕捉單詞的輸入層,用于表達語(yǔ)音的輸出層,以及連接兩者的“隱藏層”。Nettalk的大獲成功重新點(diǎn)燃了研究人員對神經(jīng)網(wǎng)絡(luò )和深度學(xué)習的熱情,并成為了隨后所有相關(guān)研究的基礎。
實(shí)際上,在進(jìn)入80年代后,《感知機》一書(shū)提到的兩大問(wèn)題都已得到解決。一方面,摩爾定律的應驗使計算機處理能力飛速提升,計算能力不再成為制約神經(jīng)網(wǎng)絡(luò )的因素。另一方面,反向傳播算法的提出解決了關(guān)于“異或”電路實(shí)現的難題。隨后的近30年中,隨著(zhù)軟件算法和硬件性能不斷優(yōu)化,深度學(xué)習技術(shù)終于可以大展拳腳。近年來(lái),移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展、數據量的激增則給神經(jīng)網(wǎng)絡(luò )提供了充足的學(xué)習材料。
然而,明斯基仍不看好神經(jīng)網(wǎng)絡(luò )和深度學(xué)習技術(shù)。2007年,在新書(shū)《情感機器》出版的不久后,《Discover》雜志的蘇珊·克魯格林斯基(Susan Kruglinski)對明斯基進(jìn)行了采訪(fǎng)。后者再次重申了自己的觀(guān)點(diǎn):
“人工智能領(lǐng)域的每個(gè)人都在追求某種邏輯推理系統、遺傳計算系統、統計推理系統或神經(jīng)網(wǎng)絡(luò ),但無(wú)人取得重大突破,原因是它們過(guò)于簡(jiǎn)單。這些新理論充其量只能解決部分問(wèn)題,而對其他問(wèn)題無(wú)能為力。我們不得不承認,神經(jīng)網(wǎng)絡(luò )不能做邏輯推理。例如,在計算概率時(shí),它無(wú)法理解數字的真正意義是什么?!?/span>
關(guān)于理想中的人工智能技術(shù),他認為重要的一點(diǎn)是使其具備常識性知識,而不僅僅是對圖像和語(yǔ)音的模式識別。在他看來(lái),人工智能應當類(lèi)似于人腦,而 “人類(lèi)解決問(wèn)題的方式首先是具備大量常識性知識”。隨后,他還希望能實(shí)現《情感機器》一書(shū)中描述的思維體系結構,使人工智能在各種思維方式間切換。
行業(yè)的發(fā)展并沒(méi)有按照明斯基的設想去推進(jìn)。被譽(yù)為當前“人工智能三駕馬車(chē)”的辛頓、延恩·勒昆(Yann LeCun)和約書(shū)亞·本吉奧(Joshua Bengio)正受到業(yè)內的追捧,而他們關(guān)注的領(lǐng)域均為深度學(xué)習。辛頓已加入谷歌,而勒昆則成為了Facebook的人工智能業(yè)務(wù)負責人。
2011年左右,谷歌啟動(dòng)了Google Brain項目,而最初的項目負責人吳恩達是深度學(xué)習領(lǐng)域的專(zhuān)家。利用來(lái)自YouTube的上千萬(wàn)數字圖像,谷歌的神經(jīng)網(wǎng)絡(luò )進(jìn)行了自我訓練,而學(xué)習效果超過(guò)了此前所有項目。由于YouTube上大量關(guān)于貓咪的影像,這一系統甚至自己學(xué)會(huì )了識別小貓??茖W(xué)家將這種機制形容為大腦視覺(jué)皮層控制論的“表親”。這一實(shí)驗采用了1.6萬(wàn)顆處理器構成的神經(jīng)網(wǎng)絡(luò )集群,但與人腦的數十億個(gè)神經(jīng)元相比,這只是九牛一毛。
利用深度學(xué)習技術(shù),谷歌是否已踏上了“人工大腦”的道路?這個(gè)問(wèn)題正引起越來(lái)越大的爭議。但業(yè)內普遍認為,深度學(xué)習技術(shù)幫助人工智能研究在視覺(jué)和語(yǔ)音領(lǐng)域取得了長(cháng)足進(jìn)步。在硅谷,越來(lái)越多科學(xué)家和工程師認為,深度學(xué)習將最終帶來(lái)“強人工智能”:機器的智慧水平將超過(guò)人類(lèi)。
2013年,明斯基在麻省理工學(xué)院的學(xué)生、知名未來(lái)學(xué)家雷伊·庫茲韋爾(Ray Kurzweil)接替吳恩達,出任Google Brain項目負責人。在谷歌強大的神經(jīng)網(wǎng)絡(luò )的基礎上,庫茲韋爾的到來(lái)或許將可以幫助明斯基實(shí)現未盡的目標。
人工智能的未來(lái)或許可以用明斯基2014年的一段話(huà)來(lái)總結:“如果你讓計算機自己待著(zhù),或是讓許多計算機待在一起,那么它們可能會(huì )試圖了解,它們從何而來(lái),它們是誰(shuí)。如果它們突然看到一本關(guān)于計算機科學(xué)的圖書(shū),那么可能會(huì )嘲笑著(zhù)說(shuō):‘這太假了?!煌挠嬎銠C群體可能也會(huì )有不同想法?!?/span>