隨著大數據和機器學習算法的普及,社會科學的量化研究也逐漸試圖采用以人工智能和數據挖掘為基礎的新興研究手段,來處理過去無法處理或者忽視了的研究議題。在此背景下,如何處理好人工智能技術與社會科學研究的關系就顯得尤為重要。人心可以計算和測量嗎?怎么用人工智能測算人的情感和態(tài)度?這一類問題越來越受到智庫工作者的關注。
人工智能如何測量人心,是個問題(圖片來自網絡)
今天,小智邀請到復旦大學社會發(fā)展與公共政策學院胡安寧教授,就人工智能在社會科學領域的應用和未來趨勢分享他的研究和體會。
目前人工智能在社會科學領域的應用
目前,在社會科學領域,人工智能主要運用于輔助數學模型,進行量化研究,分析某些變量對某個結果如何產生影響和產生多大的影響,進而進行行為的預測。一般來說,采用數據挖掘的研究者通常盡可能地納入各種與“結果”相關的因素,然后考察這些因素合并在一起,如何能夠在新的環(huán)境下盡可能準確地預測結果。
這方面比較典型的人工智能應用是客戶分析模型。商家可以將大量已有的用戶數據導入人工智能系統(tǒng),以此訓練出一個具有比較強預測力的模型工具。之后,當新的用戶出現時,他們的某些信息(如年齡、教育水平、收入水平)便能夠輸入模型,以此預測出用戶的某些屬性。例如,當人們在亞馬遜網站上買書時,一旦輸入社會學類書籍,網站會自動基于過往用戶的購買習慣,向這一新的用戶推薦一些其他書籍。誠然,如果這一新的用戶是社會學專業(yè)的大學生,而亞馬遜過往的演算是基于大量社會學專業(yè)大學生的購買習慣,這些新推薦的書籍很有可能正是新使用者所需要的,由此既給用戶以便利,又提升了網站的營業(yè)額。
可以看到,人工智能目前只是參與“以詮釋為導向的模型擬合”,比以前的進步主要是可以處理的數據量更大了,速度更快了,但人們很少見到社會科學家會基于自己的研究模型做出具體的預測(比如很少有政治社會學家運用人工智能預測何時會發(fā)生社會運動)。鑒于此,當越來越多的研究者將基于演算的、以預測為目的的人工智能技術引入社會科學研究的時候,人們似乎見到了社會科學新的發(fā)展方向,甚至是社會科學研究的范式革命。
人工智能發(fā)展的三個階段(圖片來自網絡)
“人心難測”:計算科學的視角
在計算科學中,人工智能是一個非常寬泛的領域,其中基于不同的應用方向有不同的分支學科。但究其根本,與社會科學密切相關的人工智能應用主要是機器學習。所謂機器學習,是通過提供給機器特定的數據,讓計算機利用算法,尋找出這些數據背后的模式。之后,當新的數據出現以后,人們便能夠用這些模式來套用數據,做出預測。
那么,如果用這套工具來試圖理解人類社會,做社會科學的研究,是否可能呢?答案是:介于肯定與否定之間。之所以有肯定的一面,是因為人類的某些社會性行為具有高度模式化的特點。例如,在給定特定資源的情況下,一個理性選擇的個人通常會做出利益最大化的決策(比如在給定資金的情況下進行投資決策)。此時,機器可以對這種模式化的行為進行分析,甚至在立足于大量已有投資“經驗”的基礎上,“創(chuàng)造性”地通過演算給投資者指出一種常人可能忽略了的最優(yōu)投資策略。
如果簡單地認為人們可以利用人工智能技術完全預測個體行為,并建立預測性的社會科學,那就不免有些過于樂觀了。正是因為這一點,上述問題的答案中又包含否定的一面。具體而言,利用人工智能技術進行社會性行為的分析會面臨三個困境。
困境一:機器學習的模式化
正所謂成也蕭何、敗也蕭何,人工智能雖然能夠對于模式化的行為進行基于算法的預測和分析(例如,“阿爾法狗”可以擊敗中國、韓國很多圍棋高手),但是,一旦人們面對的問題不是模式化問題時,人工智能就難以處理了。一個簡單的例子是:如果問機器“1+1等于幾”?機器會立刻回答“等于2”。但如果告訴機器,這里的“1”代表一堆沙子,那么,兩堆沙子放在一起是什么呢?人們會說,還是一堆沙子。而機器卻無法做出類似的回答。因為,兩堆沙子混成一堆不再是一個數學化的模式問題,而是一個生活經驗問題。
困境二:缺乏抽象思維的能力
目前文本學習非常流行,其中有一些算法能夠說明一段文字所表達的作者情感。但是,這種分析到目前為止還比較機械,其背后的機制在于特定詞匯的計算特征。因此,使用這種技術,人們所得到的信息也是非常初步的。換句話說,人們目前很難寄希望于人工智能能夠讀出字里行間的潛在意思。而對于社會科學而言,恰恰是一段文字的字里行間才能夠反映出作者的真實想法。如果僅僅根據詞頻或者其他表面上的文字使用模式,人們很難區(qū)分作者的真實意思和反諷之間的區(qū)別。
困境三:人工智能在處理問題時缺乏整體性、系統(tǒng)性的思考。
比如,將人工智能應用于體育領域時,通過算法和數據所提供的信息可以幫助某個足球隊選擇最出色的特定位置的球員(前鋒、后衛(wèi)或者門將),但是,這個最好的后衛(wèi)或前鋒能否與全隊有效配合,產生化學效應,人工智能卻難以判斷。如果出現“一山不容二虎”的局面,兩個最好的球員在一起所產生的效果可能反而不如兩個普通球員在一起合作的效果好。這些超越個體的整體性判斷,則需要教練員與不同位置的球員進行“人與人”之間的溝通才能做出。顯然,這些已經不是機器所能做到的了。對于社會科學而言,學者們感興趣的恰恰是人與人之間的聯(lián)系,以及這種聯(lián)系所產生出來的超越個體的“社會行為”。
《點球成金》里的老板通過人工智能選擇棒球隊員(圖片為《點球成金》劇照)
“人心難測”:社會科學的視角
人類的各種稟賦,尤其是那些構成人類社會本質特征的元素并不完全是理性化的行為。甚至可以說,人類社會之所以成為社會,恰恰是因為每個人不是像機器般“算計”,而是有著非理性的情感、思想和價值。人類社會之所以能夠存在,生活于其中的個體之所以能夠彼此團結起來而不至于一盤散沙,所依賴的并不是這種“精致的利己主義”。相反,人們需要的是一種超驗的,在人們看來不那么善變的、完美的存在。這種存在無法用理性來衡量,甚至只可意會不可言傳,而這恰恰正是社會科學最為關注的,最想解釋清楚的。
比如,婚姻的形成過程往往涉及很多理性化的考慮。尤其是在今天,夫妻雙方在最后走入婚姻殿堂之前可能在家庭義務、雙方家庭的物質支持等方面已經有一系列的討價還價。在這里,雙方都在努力地做到利益最大化,理性化的原則通常會占上風,甚至有人工智能軟件專門計算匹配度。但是,婚姻涉及的不僅僅是這些功利性的考慮,更重要的是雙方的愛情基礎。而愛情卻是一種神圣性的存在,人們通常認為它是永恒的、完美的,不容討價還價和妥協(xié)的??傊粋€基本的共識是,僅僅用理性計算來衡量婚姻是無法把握婚姻的本質的。
測試婚姻匹配度的軟件(圖片來自網絡)
我們的結論是,人們完全可以采用人工智能的算法來推理和預測個人的選擇和傾向,但這種預測僅僅局限于世俗領域而非神圣領域?!叭诵牡念A測”很多時候是神圣且?guī)в信既恍缘模苍S這個時候進行研究的最好方法是直接的訪談和體驗,人工智能時代依然“人心難測”。(人民日報中央廚房 智觀天下工作室出品,田衛(wèi)平整理)