iCub機(jī)器人通過(guò)算法逐漸學(xué)會(huì)做“面部表情”
發(fā)布時(shí)間 : 2020-04-22
隨著機(jī)器人進(jìn)入各種環(huán)境融入我們的生活,開(kāi)始與人類進(jìn)行定期互動(dòng),它們需要盡可能有效地與用戶進(jìn)行交流。因此,在過(guò)去十年左右的時(shí)間里,全世界的研究人員一直在開(kāi)發(fā)基于機(jī)器學(xué)習(xí)的模型和其他可增強(qiáng)人機(jī)交互的技術(shù)。
改機(jī)器人與人類用戶交流方式的一種方法是訓(xùn)練他們表達(dá)基本的情緒,例如悲傷、幸福、恐懼和憤怒。表達(dá)情緒的能力最終將使機(jī)器人能夠以與給定情況相符的方式更有效地傳達(dá)信息。
德國(guó)漢堡大學(xué)的研究人員最近開(kāi)發(fā)了一種基于機(jī)器學(xué)習(xí)的方法,可以教機(jī)器人如何傳達(dá)以前被定義為七種普遍情感的東西,即憤怒、厭惡、恐懼、幸福、悲傷、驚奇和中立狀態(tài)。在預(yù)先發(fā)表在arXiv上的論文中,他們?cè)诿麨閕Cub的人形機(jī)器人上應(yīng)用并測(cè)試了其技術(shù)。
研究人員提出的新方法從以前開(kāi)發(fā)的TAMER框架中汲取了靈感。TAMER是一種可用于訓(xùn)練多層感知器MLP(一種人工神經(jīng)網(wǎng)絡(luò)ANN)的算法。
在最近的研究中,TAMER框架適用于訓(xùn)練基于機(jī)器學(xué)習(xí)的模型,以通過(guò)在iCub機(jī)器人中產(chǎn)生不同的面部表情來(lái)傳達(dá)不同的人類情感。iCub是由意大利理工學(xué)院(IIT)的研究團(tuán)隊(duì)開(kāi)發(fā)的開(kāi)放源代碼機(jī)器人平臺(tái),是歐盟項(xiàng)目RobotCub的一部分,該項(xiàng)目經(jīng)常用于機(jī)器人研究中以評(píng)估機(jī)器學(xué)習(xí)算法。
研究人員在論文中寫道:“該機(jī)器人結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)(CNN)和自組織圖(SOM)來(lái)識(shí)別情感,然后學(xué)會(huì)使用MLP來(lái)表達(dá)情感?!?“我們的目標(biāo)是教一個(gè)機(jī)器人對(duì)用戶的情緒感知做出適當(dāng)反應(yīng),并學(xué)習(xí)如何表達(dá)不同的情緒。”
研究人員使用的CNN分析了iCub機(jī)器人捕獲的人類用戶面部表情的圖像。然后,將通過(guò)此分析產(chǎn)生的面部特征表示輸入到SOM,SOM揭示用戶如何表達(dá)特定情感的特定模式。
隨后,對(duì)這些模式進(jìn)行建模并用于訓(xùn)練MLP,以預(yù)測(cè)如何調(diào)整iCub的面部特征以最佳地模仿用戶的面部表情。然后,人類用戶根據(jù)機(jī)器人表達(dá)情感的準(zhǔn)確性來(lái)獎(jiǎng)勵(lì)機(jī)器人。
研究人員在論文中解釋說(shuō):“一旦iCub執(zhí)行并采取行動(dòng),用戶就會(huì)得到獎(jiǎng)勵(lì),從而為它提供目標(biāo)價(jià)值?!?“這是通過(guò)要求用戶模仿機(jī)器人,并向其提供有關(guān)所執(zhí)行動(dòng)作與預(yù)期動(dòng)作有多少不同的信息來(lái)完成的?!?/p>
隨著時(shí)間的流逝,基于從人類用戶那里獲得的回報(bào),研究人員設(shè)計(jì)的框架應(yīng)該學(xué)會(huì)表達(dá)七種普遍情感中的每一種。到目前為止,已使用iCub機(jī)器人平臺(tái)在一系列初步實(shí)驗(yàn)中對(duì)該技術(shù)進(jìn)行了評(píng)估,取得了相當(dāng)可觀的結(jié)果。
研究人員說(shuō):“盡管結(jié)果令人鼓舞,并且大大減少了培訓(xùn)所需的時(shí)間,但我們的方法仍然需要每個(gè)用戶進(jìn)行100多次交互才能學(xué)習(xí)有意義的表情。” “隨著培訓(xùn)方法的改進(jìn)和收集更多的培訓(xùn)數(shù)據(jù),這一數(shù)字有望減少?!?/p>