人在地毯上溜冰、奶牛變得透明,連六歲小孩都知道荒謬的事情,電腦能做出正確判斷嗎?盡管處理數(shù)據(jù)速度極快,但計算機對外界的感知與人類的意識一樣嗎?如何判斷一臺機器是否具備了這種難以言傳的意識知覺?
在前不久的世界機器人大會上,各種能跑會跳、能說會道、能與人溝通互動的智能機器人紛紛亮相,它們的聰明勁兒讓媒體驚呼“機器人時代離我們有多遠”。
計算機技術正節(jié)節(jié)逼近擁有高級智慧的人類。幾年前,IBM的機器人沃森在美國智力競賽節(jié)目“危險邊緣”中力挫該節(jié)目史上最出色的兩位選手而奪冠便是明證。然而,絕大多數(shù)人至今仍懷疑電腦是否真的“看清”了攝像頭前形形色色的真實世界,或者通過麥克風“聽懂”了一個問題,盡管計算機處理數(shù)據(jù)的速度極快,但計算機對外界的感知與人類的意識一樣嗎?
那么,如何判斷一臺機器是否具備了這種難以言傳的意識知覺的稟性?弄清有意識的機器具備哪些特性,能讓我們了解自己的大腦是如何運作的。另外,它甚至還可能幫助我們回答哲學家已經糾結數(shù)百年的終極問題:什么是意識?
真人還是假人?
長期以來,哲學家一直在思考,人造模擬裝置有沒有感覺?
1950年,英國數(shù)學家阿蘭·圖靈發(fā)表了一篇論文,宣告人工智能正式登上歷史舞臺。該文建議用“能否打造出一類機器,當你和它用電傳打字機交流時,你無法區(qū)分它是不是人類”這個更為實際的問題,來代替“機器能否思考”這個籠統(tǒng)的問題。
如今的圖靈測試是讓測試者用“自然語言”(即我們平時交流所用的語言)通過電腦屏幕與某人或某款軟件互動,互動內容可涉及任何話題。一定時間后,如果測試者無法確定對方是不是人類,那么該對象就算通過了圖靈測試,它的智力水平至少可以說與人不相上下。這些年來,聊天機器人——即用來模擬智能閑聊的對話式程序——一開始偶爾也會騙過測試者,但要不了多久就會被識破。
神經生物學家對自愿者的大腦或神經障礙者的大腦進行了掃描,通過腦電圖記錄他們的腦電波,逐步鎖定了所謂的意識神經相關因子,即一種最基本的大腦功能結構。它們共同作用是足以引起任何特定的有意識感覺,例如欣賞絢麗的夕陽美景。然而目前這個研究領域仍然缺少一種普適性理論,要靠這種理論從原則上來評估大腦受損患者、胎兒、老鼠乃至芯片等能否體驗到有意識的感覺。
測測電腦芯片“整合度”
“意識的整合信息理論”提供了應對上述挑戰(zhàn)的途徑。該理論認為,意識信息是一個整體。當你意識到朋友的臉龐時,你不可能遺漏了她正在呼喊并且戴著眼鏡這兩個細節(jié)。無論是什么樣的場景,只要被意識到,它就始終是一個整體,不能被分解成若干可以單獨被感受到的互相獨立的成分。
日本軟銀集團類人機器人Pepper擔任一家銀行的迎賓員迎接顧客
意識的這種整體性源自于大腦各部分之間的多種互動關系。如果大腦各部分之間的聯(lián)系中斷(例如在麻醉和深度睡眠中),意識就會削弱,甚至消失。
因此,具備意識的,必須是一個單一的、經過整合的實體,有大量可區(qū)分的狀態(tài)——這正是信息的定義。一個系統(tǒng)的整體信息容量,也就是意識容量,可以用該系統(tǒng)的信息量與它各組成部分擁有的信息總量相比超出多少來衡量。
要想使一個系統(tǒng)具有較高的意識級別,它的各個組成部分就必須是專業(yè)化的,并且整合充分,即各部分協(xié)同工作比各自單獨運行效果更佳。對于大腦的某些部位,例如大腦皮層,它的神經元之間存在大量連接,這個數(shù)值則相當高。
這個衡量系統(tǒng)整合度的指標也可以用來評估電腦芯片。對電腦來說,只要各晶體管以及存儲單元之間的連接足夠復雜,那么它就同人腦一樣可以達到很高的整合信息水平。
用信息集成“考考”機器人
除了根據(jù)機器的連接狀況測量意識容量以外(這非常困難),我們怎么知道一臺機器是不是有意識呢?什么測量方法可行?
一種測試機器的信息集成度的方法是,讓機器來做一個6歲小孩也能完成的題目:“這幅畫里有什么地方不對勁兒?”要解決這個簡單的問題,就得擁有海量背景知識,比現(xiàn)今高檔電腦在執(zhí)行識別人臉、追查信用卡欺詐之類任務時所依靠的那點知識,不知多了多少倍。
計算機在分析圖像中的信息是否合理時,必須依靠強悍的處理能力,這種能力遠遠超過了對數(shù)據(jù)庫進行簡單語言查詢的級別。說起玩高級游戲,電腦可以讓人甘拜下風,但如果問電腦一張照片有些什么問題,它就無計可施了。雖然最新電腦中的硬盤容量遠遠超出了我們畢生所能記憶的東西,但硬盤上的信息依然是未整合的,系統(tǒng)中的每一單元同其他元素基本沒有關聯(lián)。
同樣的整合過程甚至能讓六歲小孩知道許多不協(xié)調的畫面是荒謬的,比如人在地毯上溜冰,奶牛變得透明等等。而確定一臺電腦是否有意識的關鍵也正在此處。這些明顯跟日常生活體驗背道而馳的現(xiàn)象,證明了人類擁有精深的知識,知道哪些事件和物體可以同時出現(xiàn),而其他絕大多數(shù)則不行。
我們依賴于這樣一種認識:只有具備意識的機器才能主觀描述普通照片里的場景是“對”還是“錯”。這種綜合判斷照片內容的能力是構成意識思維的一種基本屬性,比如看見大象蹲在埃菲爾鐵塔頂端,就能夠知道這不合情理。但現(xiàn)在機器尚不具備這種能力:即使是讓滿滿一房間的IBM超級電腦聯(lián)手上陣,也無法判斷畫面中哪些內容合乎情理。
如何測試電腦“讀圖”
測試電腦如何解讀圖像,并非必須采用向機器輸入測試問題這樣的傳統(tǒng)的圖靈測試法。其實你只須在網上隨便找?guī)追鶊D,沿垂直方向將每幅圖的中間涂黑,并用剪刀剪開,然后隨機將左、右兩部分拼合起來。這些合成圖像一般都左右不匹配,只有個別圖片的左右兩部分都來自同一張圖。電腦面臨的挑戰(zhàn),就是要把左右匹配的圖片找出來。
把圖像中央涂黑,是為了防止電腦使用如今那些低級的圖像分析技巧,比如說考察被拆散的各部分圖像之間的紋理或色彩是否相配。這種基于拆分圖像的測試方法要求電腦具備先進的圖像解讀技術,并能夠推斷圖像各部分的搭配是否和諧。
另外一種測試則是將若干物體放進幾幅圖像中,使得所有圖像看起來都還正常,只有一幅圖像有問題。接受測試的電腦必須找出這個異類。比如計算機前面放著鍵盤也理所當然,但如果是盆栽植物,那就不合適了。
許多計算機算法是通過收集顏色、邊緣或紋理之類圖像特征,并采用低層次統(tǒng)計數(shù)據(jù)進行匹配。這些方法或許還能應對單一測試,但在多種不同圖像測試面前,就無能為力了。這些測試方法離真正實用還有一段距離,但是,在應用這些方法后,我們發(fā)現(xiàn),人類的意識感知功能涉及海量的整合知識,而相比之下,機器視覺系統(tǒng)的知識實在是太過狹窄和專業(yè)化。
想擁有意識要“學學”大腦結構
了解這些后,我們近期可以期待些什么呢?如果某項任務可以獨立出來,不與其他任務有牽連,那么它可以由機器來承擔。高速算法能夠飛快的在龐大的數(shù)據(jù)庫中進行搜索,并在國際象棋比賽和“危險邊緣”節(jié)目中戰(zhàn)勝人類選手。復雜的機器學習算法經過訓練后,可以完成面部識別或者偵測行人等工作,效率比人類更高。
我們可以輕松地想出許多場合,讓機器人去完成日益專業(yè)化的任務。先進的計算機視覺系統(tǒng)日臻成熟,不出十年,一種可靠的、基本上自主的駕駛模式將成為可能。但我們估計,這類機器視覺系統(tǒng)還無法回答與汽車前方景象相關的簡單問題,仍然不會有意識地感受到出現(xiàn)在它前面的場景。
但我們也可以設想另一類機器,它可以把世上各種事物間無數(shù)錯綜復雜的關系,整理成知識并納入高度整合的單一系統(tǒng)中。如果問這類機器“這幅圖有什么地方不對勁兒?”,它會自動給出答案,因為圖中任何與現(xiàn)實不符的地方都不可能滿足系統(tǒng)中的內在約束條件。
這類機器或許可以從容應對那些不能輕而易舉分解為若干獨立任務的事情。由于具備整合信息的能力,它應該會有意識地感知某一場景。在我們看來,為了實現(xiàn)高度的信息整合,它們不妨借鑒哺乳動物的大腦結構。這類機器在接受上述各種測試時將輕易過關,從而能與我們共享意識這個大自然賜予人類的最神秘禮物。