心理學(xué)中經(jīng)典的幻覺輪廓圖像。曾毅研究團(tuán)隊(duì)供圖
中新網(wǎng)記者 孫自法
(相關(guān)資料圖)
近些年來,人工智能(AI)技術(shù)的迅猛發(fā)展和廣泛應(yīng)用,因其很多方面的優(yōu)越表現(xiàn)超過人類而備受關(guān)注。不過,中國科學(xué)院自動(dòng)化研究所(中科院自動(dòng)化所團(tuán)隊(duì)最新完成的一項(xiàng)研究發(fā)現(xiàn),基于人工智能的神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)模型對(duì)幻覺輪廓“視而不見”,人類與人工智能的“角逐”在幻覺認(rèn)知上“扳回一局”。
交錯(cuò)光柵扭曲方法生成的樣本。曾毅研究團(tuán)隊(duì)供圖
受人類和生物視覺系統(tǒng)中廣泛存在的幻覺輪廓現(xiàn)象啟發(fā),中科院自動(dòng)化所曾毅研究團(tuán)隊(duì)提出一種將機(jī)器學(xué)習(xí)視覺數(shù)據(jù)集轉(zhuǎn)換成幻覺輪廓樣本的方法,量化測(cè)量當(dāng)前的深度學(xué)習(xí)模型對(duì)幻覺輪廓識(shí)別能力,實(shí)驗(yàn)結(jié)果證明,從經(jīng)典的到最先進(jìn)的深度神經(jīng)網(wǎng)絡(luò)都難以像人一樣具有較好的幻覺輪廓識(shí)別能力,即使是當(dāng)前最先進(jìn)的深度學(xué)習(xí)算法在交錯(cuò)光柵效應(yīng)(幻覺識(shí)別能力之一)的識(shí)別上也與人類水平相距甚遠(yuǎn)。
這項(xiàng)人工智能與人類在幻覺輪廓方面尚有顯著認(rèn)知差距的重要研究成果論文,近日在細(xì)胞出版社旗下專業(yè)學(xué)術(shù)期刊《模式》(Patterns)上發(fā)表。該研究表明,目前,人類的視覺系統(tǒng)在幻覺認(rèn)知問題上具有高度魯棒性(也稱穩(wěn)健性,一般指在異常和危險(xiǎn)情況下系統(tǒng)自適應(yīng)能力強(qiáng)健穩(wěn)定),基于人工智能的深度學(xué)習(xí)系統(tǒng)與生物視覺系統(tǒng)相比仍然存在根本性缺陷。
預(yù)訓(xùn)練模型測(cè)試結(jié)果。曾毅研究團(tuán)隊(duì)供圖
為何研究?
論文通訊作者、中科院自動(dòng)化所類腦認(rèn)知智能研究組負(fù)責(zé)人曾毅研究員介紹說,幻覺輪廓是認(rèn)知心理學(xué)中經(jīng)典的幻覺現(xiàn)象,在沒有顏色對(duì)比度或亮度梯度的情況下,生物視覺系統(tǒng)能夠感知到一個(gè)清晰的邊界。這一現(xiàn)象已經(jīng)在人類和多種動(dòng)物物種中被廣泛發(fā)現(xiàn),包括哺乳動(dòng)物、鳥類和昆蟲等。
獨(dú)立進(jìn)化的視覺系統(tǒng)中普遍存在幻覺輪廓感知能力,表明它在生物視覺處理中具有基礎(chǔ)和關(guān)鍵的作用,因此,幻覺輪廓感知也應(yīng)該是人工智能視覺系統(tǒng)所必須具備的能力。
人類實(shí)驗(yàn)結(jié)果與深度學(xué)習(xí)測(cè)試結(jié)果對(duì)比。曾毅研究團(tuán)隊(duì)供圖
此前,深度學(xué)習(xí)模型的幻覺輪廓感知相關(guān)研究相對(duì)較少,研究深度學(xué)習(xí)模型對(duì)幻覺輪廓感知的魯棒性比圖像干擾魯棒性更加復(fù)雜,主要障礙是幻覺輪廓的樣本有限。大多數(shù)研究分析的幻覺輪廓都是在先前的心理學(xué)文獻(xiàn)中手動(dòng)設(shè)計(jì),而這些測(cè)試圖片無法直接與深度學(xué)習(xí)模型訓(xùn)練的任務(wù)相匹配,同時(shí)由于數(shù)量很少,無法形成一個(gè)有相對(duì)規(guī)模的測(cè)試集,很難以機(jī)器學(xué)習(xí)的方式去衡量深度學(xué)習(xí)模型的幻覺輪廓感知能力。
如何研究?
曾毅指出,這次主要研究了深度學(xué)習(xí)對(duì)交錯(cuò)光柵幻覺的識(shí)別能力,交錯(cuò)光柵幻覺是一個(gè)經(jīng)典的幻覺輪廓現(xiàn)象,位移的光柵會(huì)在沒有亮度對(duì)比的情況下誘發(fā)出虛假的邊緣和形狀。標(biāo)準(zhǔn)的交錯(cuò)光柵錯(cuò)覺能夠讓人類在實(shí)際上沒有物理邊界的情況下感知到中間的垂直線。交錯(cuò)光柵幻覺被廣泛應(yīng)用于生理學(xué)研究中,以探索幻覺輪廓的生物視覺處理。
中科院自動(dòng)化所類腦認(rèn)知智能研究組提出一種名為交錯(cuò)光柵扭曲的圖像干擾方法,作為量化神經(jīng)網(wǎng)絡(luò)模型幻覺輪廓感知能力的工具。該方法可直接應(yīng)用于具有外部輪廓而沒有紋理信息的剪影圖像,從而系統(tǒng)性地生成大量幻覺輪廓圖像。由于不同的參數(shù)設(shè)置能夠產(chǎn)生不同程度的幻覺效應(yīng),這項(xiàng)研究對(duì)人類被試者進(jìn)行測(cè)試,用于了解不同的干擾參數(shù)對(duì)人類被試的幻覺輪廓感知能力的影響。
類似端點(diǎn)激活神經(jīng)元的現(xiàn)象和理論預(yù)言的拓?fù)浣Y(jié)構(gòu)。曾毅研究團(tuán)隊(duì)供圖
對(duì)于深度學(xué)習(xí)模型,這項(xiàng)研究訓(xùn)練全連接網(wǎng)絡(luò)和卷積網(wǎng)絡(luò),收集了109種公開可用的預(yù)訓(xùn)練模型。同時(shí),這項(xiàng)研究也招募了24名人類受試者,從而評(píng)估不同的參數(shù)設(shè)置下,人類的幻覺輪廓感知能力以及其對(duì)數(shù)字和圖像識(shí)別的影響。
有何收獲?
論文第一作者、中科院自動(dòng)化所類腦認(rèn)知智能研究組工程師范津宇說,這項(xiàng)研究結(jié)合認(rèn)知科學(xué)和人工智能,提出將傳統(tǒng)機(jī)器視覺數(shù)據(jù)集轉(zhuǎn)換成認(rèn)知科學(xué)中的交錯(cuò)光柵幻覺圖像,首次對(duì)大量的公開預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的幻覺輪廓感知能力進(jìn)行量化測(cè)量,并從神經(jīng)元?jiǎng)恿W(xué)角度和行為學(xué)兩個(gè)角度,檢驗(yàn)深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)模型對(duì)幻覺輪廓的感知。
本次研究實(shí)驗(yàn)中的所有深度神經(jīng)網(wǎng)絡(luò)模型無論是否被訓(xùn)練、使用什么方式訓(xùn)練,都產(chǎn)生了神經(jīng)動(dòng)力學(xué)層面的沿著幻覺輪廓的激活。然而即使如此,這一神經(jīng)動(dòng)力學(xué)層面的激活并沒有能夠幫助到深度神經(jīng)網(wǎng)絡(luò)最終在行為學(xué)層面識(shí)別出幻覺輪廓。而唯一擁有相對(duì)好的幻覺輪廓感知能力的深度增強(qiáng)模型,則表現(xiàn)出端點(diǎn)激活效應(yīng),從而揭示未來突破這個(gè)問題重點(diǎn)在于端點(diǎn)激活和幻覺輪廓的關(guān)系。
曾毅總結(jié)稱,本項(xiàng)研究成果亮點(diǎn)可概括為四個(gè)方面:一是提出系統(tǒng)性生成幻覺輪廓樣本的方法;二是將視覺認(rèn)知和機(jī)器學(xué)習(xí)數(shù)據(jù)集結(jié)合,實(shí)現(xiàn)對(duì)神經(jīng)網(wǎng)絡(luò)幻覺輪廓感知能力的量化;三是測(cè)試大量公開的預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型;四是發(fā)現(xiàn)幻覺輪廓感知較好的模型展現(xiàn)出計(jì)算神經(jīng)科學(xué)理論預(yù)言的端點(diǎn)激活現(xiàn)象。
這項(xiàng)研究最大的特點(diǎn)是從認(rèn)知科學(xué)的角度檢驗(yàn)和部分重新審視了當(dāng)前看似成功的人工神經(jīng)網(wǎng)絡(luò)模型,并且證明人工神經(jīng)網(wǎng)絡(luò)模型與人腦視覺處理過程仍然存在著很大差距,這還只是人工智能與人類認(rèn)知顯著距離的“冰山一角”,大腦運(yùn)作的機(jī)理和智能的本質(zhì)將繼續(xù)啟發(fā)人工智能,特別是神經(jīng)網(wǎng)絡(luò)的研究。
“如果想從本質(zhì)上取得突破,人工智能需要借鑒并受自然演化、腦與心智的啟發(fā),建立智能的理論體系,這樣的人工智能才會(huì)有長遠(yuǎn)的未來。”曾毅說。
關(guān)鍵詞: 人工智能 研究發(fā)現(xiàn)