用衛(wèi)星圖像識別貧困 數(shù)據(jù)不全也能做得到
2016-08-22 08:22:00 來源:新華網

\

  電腦將分析衛(wèi)星圖像中的道路和屋頂,確定當?shù)氐慕洕鸂顩r。

\

  研究人員讓計算機學習分析白天、夜間的衛(wèi)星圖像以及實地調查數(shù)據(jù)。

  通過夜間燈光衛(wèi)星圖,我們很容易判斷某個國家或地區(qū)的財富。不過,夜間燈光衛(wèi)星圖無法告訴我們,哪些區(qū)域的居民處于極端貧困狀態(tài),而這卻是決策者在實施經濟發(fā)展計劃中最需要的信息。

為了解決這個難題,美國斯坦福大學最近開發(fā)出一種計算機學習算法,讓計算機學習分析白天、夜間的衛(wèi)星圖片以及實地調查數(shù)據(jù),精確地判斷出某個地區(qū)的家庭消費與資產財富。(靈犀)

據(jù)《科學》期刊報道,在一些數(shù)據(jù)難以收集或不公開的區(qū)域,國際組織將利用一個更高效的系統(tǒng)來判斷這些地區(qū)的貧窮程度。

這個復雜的系統(tǒng)由美國斯坦福大學開發(fā),研究人員創(chuàng)建了一個機器學習運算系統(tǒng),讓計算機學習偵查數(shù)百萬幅衛(wèi)星圖像中可識別的貧困跡象(如道路或房屋),從而準確識別出一些非洲國家的經濟狀況?!霸谶^去,我們通過家庭調查來收集貧困信息,如今我們可以用數(shù)據(jù)來指導我們的扶貧行動,”斯坦福大學研究員瑪莎·伯克說,“而且,在往常難以收集數(shù)據(jù)的地區(qū),這個系統(tǒng)將發(fā)揮大作用?!?/p>

以非洲為例,根據(jù)世界銀行的數(shù)據(jù),在21世紀第一個十年里,59個非洲國家中只有39個開展過貧困調查,而且均不多于兩次;還有14個國家從未開展過任何調查,這使得外界不可能了解非洲的貧困狀況?!斑@就要求我們發(fā)起‘數(shù)據(jù)革命’,變革收集數(shù)據(jù)的方式。”伯克指出。

計算機自主學習判斷

夜間衛(wèi)星圖片被認為是辨別某地區(qū)是否貧困最好的方法,燈火明亮的地方往往開發(fā)程度較高。世界銀行先前也用“夜間燈光”地圖來測量非洲各地區(qū)的貧富情況。不過,斯坦福大學電氣工程研究員奧尼爾·吉恩指出,夜間衛(wèi)星圖片可能存在欺騙性。“有可能貧窮人口聚集的地方反而燈火通明,而富人會選擇住在人口稀少的區(qū)域”。

因此,吉恩的團隊開發(fā)了一種比現(xiàn)有方法能更準確判斷貧窮與否的機器學習運算。首先,他們將谷歌的白天衛(wèi)星照片、從美國國家海洋和大氣管理局拿到的夜間衛(wèi)星數(shù)據(jù)以及從世界銀行拿到的實地調查數(shù)據(jù)輸入電腦。實地調查數(shù)據(jù)包括家庭消費支出與汽車、電視機等資產財富。

接著,吉恩用“移轉學習法”訓練計算機運算:先分析道路和屋頂?shù)刃畔⒏黠@的白天衛(wèi)星照片,計算機會自動繪制道路、城市、水道、農地分布,根據(jù)這些信息來初步判斷該地區(qū)的經濟情況;接著,計算機將結合夜間衛(wèi)星數(shù)據(jù),進一步判斷該地區(qū)的貧困程度;緊接著,計算機將消化實地調查數(shù)據(jù),和之前的調查結果對照核實,比如汽車較多的地方可能就是實地調查中家庭收入更高的地方;最后,計算機將綜合所有資料,配合地圖作出預測,補足數(shù)據(jù)漏洞。

“只要向計算機提供足夠多的數(shù)據(jù),計算機就會找出我們想要的東西,”吉恩說,“我們擁有海量的衛(wèi)星圖,需要做的就是讓計算機學習從這種非結構化的數(shù)據(jù)中提取有用的信息?!?/p>

有效節(jié)省經費和時間

此前也有科學家通過數(shù)據(jù)分析的方式來判斷某地區(qū)是否貧困。加州大學伯克利分校的數(shù)據(jù)科學家約書亞·布拉門斯托克就曾和世界銀行合作,通過分析盧旺達等國家居民的手機呼叫模式,判斷貧困社區(qū)中多少居民有工作??偛课挥诩~約的一家非營利機構也通過礦業(yè)衛(wèi)星圖像來決定誰更應該拿到捐款,他們在研究中發(fā)現(xiàn)住在茅草屋頂下的人比住在鐵皮屋頂下的人更窮。

不過,斯坦福團隊的算法更全面。第一,他們使用的都是公開的數(shù)據(jù),不需要再花費成本收集;第二,他們對一個地區(qū)是否處于貧困的判斷并非單單基于計算機算法從白天的衛(wèi)星照片中辨別出的一兩個貧困元素?!跋鄬τ诎ぜ野舻剡M行田野調查,這個系統(tǒng)將有效地節(jié)省調查時間和經費,”布拉門斯托克說,“而相對于完全依靠夜間衛(wèi)星圖片或手機數(shù)據(jù)的調查方式,吉恩的方法更有利于準確判定哪些地區(qū)處于貧困狀態(tài)?!?/p>

關于需求的準確信息將直接影響國際機構的援助方向,決定在哪些地區(qū)建設道路或醫(yī)院。從更深遠的層面上說,該計算機算法還能幫助國際機構在未來追蹤扶貧舉措是否達到效果。

判斷準確率超過50%

迄今為止,在評估某些地區(qū)的家庭消費與資產財富時,這種計算機算法的準確率已經超過50%。研究人員目前正在分析尼日利亞、坦桑尼亞、烏干達、盧旺達和馬拉維等5個國家的貧困程度,他們希望之后將評估范圍擴大到撒哈拉以南的非洲地區(qū),甚至所有的欠發(fā)達國家。

不過,這種計算機算法在被使用前還需要進一步提升。接下來,吉恩的團隊將試圖從不同分辨率的照片中提煉更多信息——從低分辨率的圖片中分析出大的結構,從高分辨率的圖片中找出屋頂和道路。

吉恩的團隊還將著眼于某些區(qū)域過去的衛(wèi)星圖像,讓計算機學習預測該區(qū)域未來經濟可能的發(fā)展情況?!叭绻幸惶煳覀兡苡糜嬎銠C算法為這個世界建立一個模型,那就太酷了?!奔髡f。

  • 為你推薦
  • 公益播報
  • 公益匯
  • 進社區(qū)

熱點推薦

即時新聞

武漢