新算法讓機器像嬰兒一樣學(xué)習(xí)視覺世界
2016-12-19 15:18:00 來源:新華網(wǎng)

新華社洛杉磯12月18日電(記者郭爽)美國科學(xué)家日前報告說,他們從人類大腦的學(xué)習(xí)方式中獲得靈感,研發(fā)出一種新的“深度學(xué)習(xí)”算法,可以讓機器像人類嬰兒一樣自主學(xué)習(xí)視覺世界。

在深度學(xué)習(xí)領(lǐng)域,科學(xué)家喜歡用“這是1,這是2”的方法來訓(xùn)練機器。這種被稱為“監(jiān)督學(xué)習(xí)”的技術(shù),在訓(xùn)練時需要為機器提供成千上萬標(biāo)記好的樣本,此前被認(rèn)為是最有效的方法。

不過,人類并不是這樣學(xué)習(xí)。在大多數(shù)情況下,人類大腦的學(xué)習(xí)方式都是“無監(jiān)督學(xué)習(xí)”。在日前于西班牙巴塞羅那舉行的神經(jīng)信息處理系統(tǒng)(NIPS)大會上,研究人員發(fā)表報告說,美國賴斯大學(xué)和貝勒醫(yī)學(xué)院的神經(jīng)科學(xué)和人工智能專家研發(fā)出一種“半監(jiān)督學(xué)習(xí)”算法,這種機器學(xué)習(xí)方式與人類更為接近。

研究負(fù)責(zé)人安基特·帕特爾解釋說,嬰兒出生第一年,父母會告訴孩子這是水瓶、椅子、媽媽……,但事實上,嬰兒并不能理解這些詞語的意思。多數(shù)情況下,他們是通過與世界互動進行“無監(jiān)督學(xué)習(xí)”的。

據(jù)介紹,研究人員首先僅向新研發(fā)出的“深度渲染混合模型”提供從0到9這10個數(shù)字的10個手寫標(biāo)準(zhǔn)樣本,然后再讓模型去“自學(xué)”數(shù)千個樣本數(shù)據(jù),通過這種“半監(jiān)督學(xué)習(xí)”算法讓模型學(xué)習(xí)識別手寫體數(shù)字。最終測試結(jié)果顯示,在辨別手寫數(shù)字方面,這種模型比此前幾乎所有算法,即一開始就通過數(shù)千個正確樣本訓(xùn)練機器“學(xué)習(xí)”每個數(shù)字的方法更為準(zhǔn)確。

研究人員表示,這種“半監(jiān)督學(xué)習(xí)”算法屬于一種“卷積神經(jīng)網(wǎng)絡(luò)”。在這種從生物神經(jīng)元中得到啟發(fā)而設(shè)計出的多層人工神經(jīng)元網(wǎng)絡(luò)中,人工神經(jīng)元(或稱數(shù)據(jù)處理單元)分層排列。第一層掃描圖像,并執(zhí)行相對簡單的任務(wù),如搜索邊緣和顏色的變化等。第二層負(fù)責(zé)檢查從第一層輸出的內(nèi)容,并搜索更復(fù)雜的模式。從數(shù)學(xué)角度上說,這種在模式內(nèi)尋找模式的嵌套方法被稱為一種非線性過程。

研究人員指出,從本質(zhì)上說,卷積神經(jīng)網(wǎng)絡(luò)是一個“非常簡單的視覺皮層”。舉例來說,如果給這個網(wǎng)絡(luò)輸入一個圖像,那么它的每一層就會處理這個圖像的一部分特征,而隨著層級深入,對于圖像的理解也就不斷加深。到最后一層,這個網(wǎng)絡(luò)就會獲得關(guān)于這個圖像相當(dāng)深入且抽象的理解。事實上,現(xiàn)今幾乎所有自動駕駛系統(tǒng)都配備了這種網(wǎng)絡(luò),因為卷積神經(jīng)網(wǎng)絡(luò)是迄今最好的視覺處理方法。

研究人員認(rèn)為,他們研發(fā)出的這種人工神經(jīng)網(wǎng)絡(luò)還可以幫助神經(jīng)科學(xué)家更好地了解人類大腦處理信息的方式,因為人類大腦的“算法”遠(yuǎn)遠(yuǎn)優(yōu)于任何人類設(shè)計的神經(jīng)網(wǎng)絡(luò)。

  • 為你推薦
  • 公益播報
  • 公益匯
  • 進社區(qū)

熱點推薦

即時新聞

武漢