是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學,所涉及的領域也非常廣泛。因此,一說到人工智能,可能會有很多人認為它是一項比較復雜的技術,但事實上它要比我們想象的簡單。
我們需要多少信息來構建一個人,更具體地說是一個人的大腦?
畢竟,我們是迄今為止地球上最復雜的物種。為了解決這個問題,我們的一些大腦認為我們的大腦是宇宙中最復雜的結構!
然而,番茄比人類具有更多的基因,準確地說是7000多。
查看我們的基因,我們很難弄清我們所有復雜性的編碼位置。
大約只有20000個基因開始,其中大約有一半與其他事物有關,例如建立手腳和重要器官。
從數學上講,我們的基因組在無損存儲后僅攜帶了2500萬字節的大腦設計信息壓縮。
成年人在新皮層中所具有的10的15次方個連接,新皮層是大腦的最新部分,僅存在于靈長類動物中,并且在智人中異常大。如果我們對基因的理解不完全錯位,那么假設我們的大部分知識和能力直接在基因中編碼是不合理的。
唯一的選擇是,需要一種更簡單、更有效的方法來定義我們的大腦和新皮質的藍圖。
并以此構建原型智能系統。
統一的腦功能理論
杰夫?霍金斯(Jeff Hawkins)在他的《關于智力的書》中抱怨說,大腦的普遍圖片由高度專業化的區域組成。
他將這種情況與19世紀的生物學家越來越詳細地研究了各種各樣的物種而沒有留意生命背后的統一原理進行了比較。直到道金斯(Dawkins)提出了他的進化論之前,還沒有人知道如何用一種籠統的敘述來描述自然世界的多重表象。
同樣,大腦看起來可能由許多不同的高度專業化的大腦區域組成,但是它們明顯的專業化不應使我們得出結論,即它們可能并非全部基于相同的解剖學和算法原理而工作。
實際上,我們觀察到新皮層的解剖結構具有令人驚訝的同質性。神經可塑性表明,大多數大腦區域可以輕松承擔以前由其他大腦區域執行的任務,從而在其設計原理后面顯示出一定的通用性。
諾曼?道奇(Norman Doidge)在暢銷書《改變自身的大腦》中講述了令人印象深刻的故事,講述了患者將整個感覺系統重新映射到大腦的新部分的過程,例如人們通過用相機記錄的視覺刺激,直接將視覺刺激映射到嘴里來學會用舌頭觀察。
對中風患者的研究同樣表明,中風喪失的能力通常是由新的大腦區域重新獲得的,而聾啞人可以重新繪制其Broca區域(負責語言處理)以控制其手部動作,并通過手語進行交流,而不是他們的嘴巴運動,以便與他們說話。
大腦發揮不可思議的能力和靈活性來學習新事物。大多數人可以學習與他們一起成長的任何一種語言,或者選擇在以后的生活中學習一種新的語言,也可以學習他們選擇的任何一種工具(公認地獲得了不同的成功),依此類推。
可塑性和靈活學習的事實可以解釋為,根據我們基因中信息的稀疏性,指向了新皮層的生物學設置及其所使用的學習算法所基于的通用結構。
思想的結構
很難將概念本身概念化,但是存在某些結構和模式,并且這些結構和模式深深地貫穿了我們認知的各個方面。
正如雷?庫茲韋爾(Ray Kurzweil)在他的《如何創造思維》一書中所解釋的那樣:
我們以一種分層的方式來感知世界,這種方式由復雜度不斷提高的簡單模式組成。他認為,模式識別是所有思想的基礎,從最原始的模式到高度抽象和復雜的概念。
以語言和寫作為例。細線構成了我們可以識別為字母的模式。各種字母組成單詞,然后是句子。句子形成段落,整篇文章。最后,從以高度特定的方式排列的少量最小模式中,出現了敘事和意義。
模式識別生物學
現代神經影像學數據表明,新皮層由稱為皮質柱的結構的均勻組合組成。每個人都由大約100個神經元組成。
Kurzweil提出,這些列構成了他所謂的最小模式識別器。通過將模式識別器的各層彼此連接起來,可以創建概念層次結構,每個模式識別器都專門根據許多可能的感官模式(如眼睛,耳朵,鼻子)的輸入來識別單個模式。
在基本特征提取(例如檢測視覺刺激中的邊緣或識別音調)的基礎上,這些模式會疊加起來以形成越來越復雜的模式。
分層檢測視覺數據中復雜程度不斷提高的模式,從而導致諸如"大象"或"企鵝"之類的抽象標簽。
模式識別器不限于處理視覺或聽覺刺激。它可以將各種信號作為輸入處理,并根據輸入中包含的結構生成輸出。學習意味著連接模式識別器并學習其權重結構,基本上是他們對彼此輸入的反應有多強,以及它們彼此之間有多少相互聯系,類似于學習神經網絡時所做的。
但是,大腦在善于解決許多不同任務的同時又如何如此均質呢?答案可能在于神經科學和計算機科學的交集。
信息的作用
視覺,聽覺和感覺信息有什么共同點?顯而易見的答案是,這些都是某種信息。
坦率地說,信息的定義有些棘手,并且在信息時代被扔得太多了,但在大腦進行信息處理的背景下,它具有技術意義。要了解這種體系結構如何對我們如此有效,就要邁出第一步,那就是要意識到可以將大腦視為一種信息處理設備。
神經元(神經計算的基礎貨幣)的輸入有很多統一性。大腦正在處理的任何信號,總是由神經元的時空激發模式組成。我們在外部世界中觀察到的每種模式都在我們的感覺器官中編碼為神經激發模式,然后根據庫茲韋爾的說法,模式識別器的層次結構會向上和向下流動,直到成功提取含義為止。
神經科學證據得到計算機科學思想的支持。佩德羅?多明戈斯(Pedro Domingos)在他的《大師算法》一書中提出,我們可能會找到一種通用算法,只要有正確的數據,該算法就可以使我們學習到幾乎所有我們能想到的東西。
這種通用學習算法甚至可以由已經存在的學習算法(例如貝葉斯網絡、連接論或符號論方法、進化算法,支持向量機等)的混合組成。
盡管我們還不確定如何從算法的角度學習大腦,但是大腦也可能使用類似于該通用算法的東西。作為最基本的例子,當然有希伯來語學習,它已在某種程度上發生在大腦中。對于更復雜的算法,研究人員一直在嘗試尋找生物學上可行的機制來在大腦中實現反向傳播,以及其他許多方面。
但是很明顯,大腦非常擅長學習,并且需要以一種原則上可以理解并且很可能在計算機上建模的方式來做到這一點。
神經網絡中的信息丟失
識別模式的訣竅是對其進行解碼,以解析隱藏在信號內部的相關信息。了解大腦的行為方式可能是了解智力如何運作的關鍵步驟之一。
On Intelligence的作者Jeff Hawkins抱怨我們在研究信息在大腦中的作用時工具的匱乏,但是在理解計算體系結構中的信息流方面取得了越來越多的進步。
今年夏天,以色列神經科學家納夫塔利?提什比(Naftali Tishby)關于信息瓶頸方法的兩次演講。他以閃閃發光的眼睛和熱情吸引著整個人群,他解釋了當深度神經網絡從輸入數據中提取相關特征時如何過濾信息。
該理論闡明了信息在深度神經網絡中的流動方式,并提供了一個很好的理由,說明深度網絡往往比淺層網絡工作得更好。
當我們從300x300像素的圖片中識別出人臉時,我們就有90000像素包含信息,但是如果你知道通常由什么構成的人臉,則人臉信息的特征就少得多(例如,相關特征,例如眼睛、嘴巴的寬度、鼻子的位置等)。
例如,在一些深層次的生成模型中使用了此概念,在該模型中,學習了數據的潛在低維表示形式,然后將其用于生成高維,輸出逼真的外觀。
神經網絡訓練方法,例如隨機梯度下降,使網絡可以通過有效地從輸入中拋出所有不相關的信息來過濾出相關的模式,例如Ian Goodfellow在他的著作《深層》中指出的那樣,在對照片中的物體進行分類時忽略了照片的背景。
Tishby將其與從瓶子底部流到頂部的水進行比較:瓶頸變得越來越緊密,信息流通的越來越少。但是,如果瓶頸設置得當,到達頂部的水最終將攜帶所有必要的信息。
之所以提出這一點,是因為我認為這種信息理論的觀點可以幫助我們理解由模式識別器組成的新皮層的概念。
模式識別器從數據中提取模式。這些模式僅構成輸入的一小部分,因此,實質上,大腦的模式識別器被設置為從我們的感知數據中提取與我們的生存相關的信息,并將此提取的數據分類為知識層次結構。然后,我們可以使用這些命令將秩序帶入混亂的世界,增加我們生存的機會。
這是大腦的工作。它的核心是不斷地從數據中學習有用模式的信息過濾和排序設備。
這很可能是我們所認為的智能的核心,因此在構建自己的智能系統時,我們不妨從中學到一些東西(就像我們已經學過的一樣)。
為什么智慧可能比我們想象的要簡單
在我們"解決"智能之前,有許多問題需要解決。正如Yann LeCun指出的那樣,推斷因果關系或一般常識知識結構是一個大問題,并且在算法中建立世界的預測模型在許多其他必要步驟中可能是必要的下一步。
在訓練機器人智能地執行任務時,在會遇到其他與更好的目標功能相關的懸而未決的問題。聰明意味著解決問題,而其中的一個主要方面是找出定義目標然后實現這些目標的最佳方法,在大腦中,這種作用被認為是基底神經節發揮的作用。
因此,僅堆疊模式識別器就不會突然帶來像人類一樣在推理周圍運轉的機器人。
我仍然認為,由新證據支持的遺傳密碼中所包含的信息稀疏性,證明了新皮層及其學習算法的簡單性和通用性,應該讓我們停下來,并抓住機會在不久的將來建造高度智能的機器,庫茲韋爾預測機器將在2029年通過圖靈測試,并在2045年通過人類水平的AI。
正如安德森(PW Anderson)在其有關科學層次的所說,如果我們找到正確的方法來擴大簡單事物的使用范圍,更多的事情就會有所不同,并且更多的可能來自于簡單事物的使用。在深度學習的最新成功中,其中一些已經很明顯,深度學習與擴大可用數據和計算能力緊密相關。
對我來說,理解和建立自己的智慧絕對是令人振奮的前景。
但是,正如許多人強調的那樣,人工智能的興起可能對整個人類產生重大影響,應將其視為一個問題。即使我們高估了這個問題,我們也應該比后悔更安全。
因為畢竟大自然通過進化的盲目產生了智力。看來我們可能很快也會提出類似人類的人工智能。
? ? ? ?責任編輯:zl
評論