ttb2016 |
2018-07-29 22:16 |
人工智能:正在學(xué)習(xí)讀懂你的情感,未來可幫助管理負(fù)面情緒
麻省理工學(xué)院媒體實(shí)驗(yàn)室的研究者們已經(jīng)開發(fā)了一種機(jī)器學(xué)習(xí)模型,這種模型讓電腦更加像人一樣解譯我們的情感。 <I\/n<* hHGoP0/o 在“情感計(jì)算”這個(gè)新興領(lǐng)域,人們開發(fā)可以分析面部表情的機(jī)器人和計(jì)算機(jī),讓它們解譯我們的情感并根據(jù)解譯結(jié)果做出回應(yīng)。其應(yīng)用包括管理個(gè)人健康、保證學(xué)生在課堂上的興趣、幫助診斷一些疾病以及開發(fā)有用的機(jī)器人伙伴。 VU(v3^1" /wEhVR`= 然而這項(xiàng)技術(shù)面臨的一大挑戰(zhàn)是,不同的人表達(dá)情感的方式非常不同,這一不同依賴于許多因素。一些普適的差異包括不同文化、性別、年齡組之間的差異。但是此外還存在一些更精細(xì)的差異:每天中的不同時(shí)刻、睡眠狀況、甚至對談話對象的熟悉程度等都會導(dǎo)致你情感表達(dá)的差異。 v5#jZ$<F D9=KXo^ 人們的大腦天生就可以處理這些偏差,但這對機(jī)器來說很難。深度學(xué)習(xí)技術(shù)在近些年來幫助機(jī)器捕捉這些偏差,但這還無法精確到或能夠適應(yīng)不同的人群需求。 wr/"yQA] HZC"nb}r4 麻省理工學(xué)院媒體實(shí)驗(yàn)室的研究人員們開發(fā)了一種新的機(jī)器學(xué)習(xí)模型,這個(gè)模型通過幾千個(gè)面部圖像學(xué)習(xí),獲得了比傳統(tǒng)模型更能捕捉到細(xì)微的面部表情變化的能力,可以更好衡量人們的情感。此外,通過使用一些額外的訓(xùn)練數(shù)據(jù),模型還可以適應(yīng)一個(gè)全新的人群,并達(dá)到同樣的效果。這項(xiàng)研究的目標(biāo)是提高現(xiàn)有的情感計(jì)算技術(shù)。 3*"WG O5 w!-gJmX> “這是一種隱蔽的管理情感方式,”麻省理工學(xué)院媒體實(shí)驗(yàn)室研究者及這篇文章的共作者 Oggi Rudovic 表示,“如果你想讓機(jī)器人擁有社交智能,你必須讓它們能夠聰明而自然地對我們的情感作出回應(yīng),更加像人類一樣!監(jiān)ggi Rudovic 在上周的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘大會上進(jìn)行了展示。 5oW!YJg s4y73-J^.v
[attachment=85519] N1}sHyVq7 個(gè)性化專家 DFB@O|JL iAEbu&XG 傳統(tǒng)情感計(jì)算模型通常想找到一個(gè)“通解”。他們通過對一系列描述不同面部表情的圖像訓(xùn)練來優(yōu)化特征——如當(dāng)笑的時(shí)候嘴唇是如何卷曲的——并將這些普適的優(yōu)化標(biāo)記在整個(gè)新圖像數(shù)據(jù)集中。 {9&;Q|D z x_N'TjS^{ 而本次研究的科學(xué)家將個(gè)性化模型技術(shù)與“多專家模型(MoE)”技術(shù)結(jié)合,幫助挖掘細(xì)粒度的個(gè)人面部表情數(shù)據(jù)。Rudovic 說,這是首次將這兩種技術(shù)結(jié)合并用于情感計(jì)算。 30#s aGV #uG%j 在多專家模型中,一系列神經(jīng)網(wǎng)絡(luò)模型被稱為“專家”,每一個(gè)“專家”用于專門訓(xùn)練一個(gè)分開的任務(wù)并生成一個(gè)輸出結(jié)果。研究人員結(jié)合了門控網(wǎng)絡(luò),這一網(wǎng)絡(luò)可以計(jì)算每個(gè)專家成功解譯未見過的新情緒的概率!盎旧,網(wǎng)絡(luò)可以區(qū)別個(gè)體的差異并指出‘在這張圖中這個(gè)專家的結(jié)果是正確的’!盕effer 說。 :841qCW J s@hLP` 對他們的模型來說,研究人員通過將每個(gè)專家與 RECOLA 數(shù)據(jù)集中 18 個(gè)個(gè)人視頻記錄進(jìn)行匹配。RECOLA 數(shù)據(jù)集是一個(gè)公開數(shù)據(jù)庫,供人們在為情感計(jì)算設(shè)計(jì)的應(yīng)用平臺上通過視頻聊天交流。他們采用了 9 個(gè)主題訓(xùn)練模型,而通過另外 9 個(gè)主題來評估訓(xùn)練結(jié)果。所有的視頻都被剪輯成獨(dú)立的小部分。 z,[Hli*0 f;o5=)Y 每一個(gè)專家和門控網(wǎng)絡(luò)都可以通過一種叫 ResNet 的分類神經(jīng)網(wǎng)絡(luò)幫助追溯到每個(gè)個(gè)體的面部表情。在這個(gè)過程中,模型基于數(shù)值的高低(如高興或不高興)和喚醒程度(如興奮)為每一個(gè)框架打分。通常使用矩陣為這些不同的情感狀態(tài)進(jìn)行編碼。同時(shí),6 個(gè)人類專家標(biāo)記每一個(gè)框架的數(shù)值和喚醒度,用來訓(xùn)練這些模型。 ~S"+S/z/k #4Rx]zW^% 研究人員進(jìn)一步對模型個(gè)性化,他們將一些剩下的視頻作為訓(xùn)練模型數(shù)據(jù),用另一些機(jī)器未見過的視頻對模型測試。結(jié)果顯示,在含有 5%-10% 新人群類型的數(shù)據(jù)中,該模型比傳統(tǒng)模型表現(xiàn)有很大改觀,這意味著模型的數(shù)值和喚醒度數(shù)據(jù)更接近人類專家的評分。 kzQ+j8.,U ~F|+o}a`
這一結(jié)果展示了模型可以通過有限數(shù)據(jù)集學(xué)習(xí)適應(yīng)不同人群的潛力。Rudovic 說,“這很關(guān)鍵。當(dāng)你遇到一個(gè)新的人群時(shí),你必須找到一些調(diào)整微小面部變化差異的方法。想象一個(gè)分析某一種習(xí)俗人們的面部表情模型需要適應(yīng)另外習(xí)俗人們的表情,如果模型不考慮這一變化,其表現(xiàn)將會變差。但是如果你從另外習(xí)俗人群中找一些樣品數(shù)據(jù)來讓模型適應(yīng),這些模型可以做得更好,尤其是在個(gè)人水平上。這就是我們這一個(gè)性化模型的重要性! A@!qv#' b.JuI 目前對這種情感計(jì)算研究的可用數(shù)據(jù)還沒有對不同膚色開放,因此研究者的訓(xùn)練數(shù)據(jù)是有限的。但是當(dāng)這些數(shù)據(jù)可用后,模型可以被訓(xùn)練來對更多類型人群使用。下一步,F(xiàn)effer 說,是“用更多元化的更大數(shù)據(jù)集”訓(xùn)練這些模型。 <e=#F-DE C\Wmq
[ 更好的人機(jī)交互 *k(
| |