RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌眼鏡通過增強現(xiàn)實療法幫助自閉癥兒童理解面部表情

IEEE電氣電子工程師 ? 來源:IEEE電氣電子工程師學會 ? 2020-08-17 11:22 ? 次閱讀

谷歌眼鏡通過增強現(xiàn)實療法幫助自閉癥兒童理解面部表情。

想象一下這個場景:快到晚飯時間了,小吉米呆在廚房里。他媽媽正忙著把晚飯端上飯桌,并且她把所有餐具都堆放在了廚房的操作臺上。患有自閉癥的吉米則希望把餐具擺放得更加整齊,當他媽媽在爐子旁時,他便小心翼翼地開始把每一把餐叉、餐刀和湯勺放回餐具抽屜的槽里。突然,吉米聽到一聲喊叫。他媽媽聲音很大,她的臉色看起來不一樣了。但他還在繼續(xù)收拾著餐具。 現(xiàn)在想象一下,吉米戴著一種特殊的谷歌眼鏡,這是谷歌在2013年推出的一款增強現(xiàn)實頭戴設備。當他抬頭看著他媽媽時,頭戴顯示器亮起一個綠框,提示吉米他“發(fā)現(xiàn)了一張臉”。當他盯著他媽媽的臉看時,一個表情符號跳出來,告訴吉米:“你發(fā)現(xiàn)了一張生氣的臉。”于是,他會思考為什么他媽媽會生氣。也許他應該停下收拾餐具,去問問她。 我們的團隊已經(jīng)花了6年的時間來研究這項針對自閉癥兒童的輔助技術,孩子們把這項技術稱為“超級眼鏡”。我們的系統(tǒng)為孩子在家中提供行為療法,這是最初學習社交技能的地方。該系統(tǒng)使用眼鏡外置攝像頭記錄孩子與家人之間的互動;然后我們的軟件會檢測到這些視頻中的人臉,并解讀他們表達的情緒。通過一個應用程序,看護人可以查看自動剪輯的社交互動視頻。 多年來,我們已經(jīng)對原型進行了改進,并通過臨床試驗證明它的療效:我們發(fā)現(xiàn),使用這款眼鏡可以增加孩子們的眼神交流和社交參與感,還可以提高他們對情緒的識別能力。我們在斯坦福大學的團隊與本文作者之一丹尼斯?沃爾(Dennis Wall)的分拆公司Cognoa合作,為“超級眼鏡”贏得了“突破性療法”的稱號,該項技術迅速獲得了美國食品藥品管理局(FDA)的批準。我們的目標是進入健康保險計劃,以此來支付該項技術作為增強現(xiàn)實治療療法的費用。 當谷歌眼鏡第一次作為消費類設備出現(xiàn)時,許多人認為不需要使用它。面對慘淡的評價和銷量,谷歌2015年停止了消費版產(chǎn)品的生產(chǎn)。但當該公司于2017年攜帶該設備的二代產(chǎn)品——“企業(yè)版眼鏡”重返市場時,許多行業(yè)開始看到了它的潛力。在這里,我們將講述我們?nèi)绾卫眠@項技術為自閉癥兒童提供一種看世界的新方式。

當吉米戴上眼鏡時,他很快就習慣了視野邊緣的頭戴顯示器(棱鏡)。當吉米開始與家人進行互動時,這個眼鏡就會將視頻數(shù)據(jù)發(fā)送到看護人的智能手機上。我們的應用程序配有最新人工智能AI)技術,可以檢測人臉和情緒,并將信息發(fā)送回眼鏡。當檢測到人臉時,頭戴顯示器的邊框就會亮起綠色,然后顯示器通過表情圖形、表情符號或書面文字來識別面部表情。用戶還可以選擇從眼鏡內(nèi)的骨傳導揚聲器獲取音頻暗示(一種識別情緒的聲音),該揚聲器通過頭骨向內(nèi)耳發(fā)送聲波。該系統(tǒng)可以識別7種面部表情,包括快樂、憤怒、驚訝、悲傷、恐懼、厭惡,還有蔑視——我們標記為“失望”,這樣對孩子更友好一些。它還能識別中性的表情。

為了鼓勵孩子們佩戴“超級眼鏡”,這款應用程序目前提供了兩款游戲:“捕捉微笑”——孩子試圖從他人身上引發(fā)出快樂或另一種情緒;“猜猜表情”——人們表現(xiàn)各種情緒,然后讓孩子們猜出是哪種情緒。這款應用程序還會記錄會話中的所有活動,并標記社交活動的瞬間。這讓吉米和他媽媽能夠一起觀看他們在廚房里出現(xiàn)矛盾的視頻,這會促使他們討論究竟發(fā)生了什么事情,以及下次他們?nèi)绾伪苊膺@樣的情況發(fā)生。

“超級眼鏡”系統(tǒng)的三大要素——人臉檢測、情感識別和App回顧,可以幫助自閉癥兒童邊戴邊學。鼓勵孩子們?nèi)ふ疑缃换?,使得他們了解人臉是有趣的,意識到可以從面部表情中收集有價值的信息。但是眼鏡并不需要永久佩戴。孩子們每周在自己家里做幾次20分鐘的治療,目前整個干預療程為6周。孩子們能很快學會如何察覺他們社交伙伴的情緒,然后,在他們獲得社交自信心后,就不再使用眼鏡了。

我們的系統(tǒng)旨在改善一個嚴重的問題:孩子們只能接受有限的強化行為治療。盡管有證據(jù)表明這種療法可以減少甚至消除自閉癥的核心癥狀,但孩子們必須在8歲之前就開始接受這種療法,才能真正見效。目前診斷的平均年齡是4至5歲,等待治療可能會超過18個月。其部分原因是,自1990年以來,美國自閉癥兒童的診斷人數(shù)猛增了600%,現(xiàn)在大約每40個孩子中就有一個患有自閉癥;而在亞洲和歐洲的一些地區(qū),增長卻沒有如此劇烈。

由于需要治療的兒童人數(shù)與能夠提供治療的專家人數(shù)之間的不平衡越來越嚴重,因此我們認為,臨床醫(yī)生必須尋求以分散方式擴大規(guī)模的解決方案。我們認為,不能一切都依賴專家,幫助所有這些兒童所需的工具,如數(shù)據(jù)采集、監(jiān)控和治療工具,必須交到患者及其父母的手中。

為自閉癥兒童提供原位輔助學習的努力可以追溯到20世紀90年代,當時麻省理工學院的教授羅莎琳德?皮卡德(Rosalind Picard)設計了一個帶有耳機和顯示情緒提示的微型計算機系統(tǒng)。然而,當時的可穿戴技術既笨重又突兀,情緒識別軟件也很原始。而如今的可穿戴設備(例如谷歌眼鏡)都很低調(diào),而且我們擁有了強大的人工智能工具,它們利用了大量關于面部表情和社交互動的公開數(shù)據(jù)。━━━━谷歌眼鏡的設計是一項驚人的壯舉,工程師基本上把智能手機裝進了一個類似眼鏡的輕型框架中。這種形狀因子給開發(fā)者帶來了一個有趣的挑戰(zhàn):我們必須在電池壽命、視頻流性能和熱量之間做出權(quán)衡。例如,在設備上處理數(shù)據(jù)產(chǎn)生熱量過多,會自動觸發(fā)操作回調(diào)。當我們嘗試在設備上運行計算機視覺算法時,該系統(tǒng)會自動降低捕捉視頻的幀速率,嚴重影響快速識別情緒和提供反饋的能力。 我們的解決方案是通過Wi-Fi將谷歌眼鏡與智能手機配對。眼鏡可以捕捉視頻,將視頻流傳輸?shù)绞謾C,并向佩戴者傳遞反饋信息。手機可以進行人臉檢測與跟蹤、特征提取、面部表情識別等繁重的計算機視覺工作,并存儲視頻數(shù)據(jù)。

但是,“眼鏡到手機”的視頻流也有自己的問題:雖然眼鏡能以正常的分辨率捕捉視頻,但我們只能以低分辨率進行傳輸。因此,我們編寫了一個協(xié)議,將眼鏡新檢測到人臉的圖像放大,這樣視頻流信息就足夠詳細,可用于我們的視覺算法。

我們的計算機視覺系統(tǒng)最初是使用現(xiàn)成的工具。軟件流水線由人臉檢測器、人臉跟蹤器和人臉特征提取器組成;一個經(jīng)過標準數(shù)據(jù)集和我們自己數(shù)據(jù)集訓練的情緒分類器接收數(shù)據(jù)。在我們剛開始開發(fā)流水線時,在移動設備上運行能夠處理實時分類任務的深度學習算法還不可行。但在過去的幾年里,我們?nèi)〉昧孙@著的進步,現(xiàn)在我們正在研發(fā)一款升級版的“超級眼鏡”,它配有深度學習工具,可同時進行人臉跟蹤和情緒分類。

這次升級不是一項簡單的任務。情緒識別軟件主要用于廣告行業(yè),用于衡量消費者對廣告的情緒反應。我們的軟件在幾個關鍵點都有所不同。首先,它不是用于計算機,而是用于可穿戴和移動設備,因此我們必須將它的內(nèi)存和處理要求降到最低??纱┐餍螤钜蜃右惨馕吨?,不是通過穩(wěn)定的網(wǎng)絡攝像頭捕捉視頻,而是通過孩子們佩戴的移動攝像頭捕捉視頻。我們已經(jīng)添加了圖像穩(wěn)定器來處理視頻的抖動,人臉檢測器要頻繁地初始化,找到在場景中突然改變位置的人臉。

失效判定也是一個嚴重的問題。例如,一個商業(yè)情緒識別系統(tǒng)可能聲稱有98%的準確率;這樣的統(tǒng)計數(shù)據(jù)通常意味著該系統(tǒng)對絕大多數(shù)人效果都很好,但始終無法識別小部分人的表情。這種情況對于研究人們觀看廣告的總體情緒可能是合適的,但對于“超級眼鏡”,這個軟件必須經(jīng)常解讀孩子與同一個人的互動情況。如果這個系統(tǒng)持續(xù)識別失敗的兩個人碰巧是孩子父母,這個孩子就太不走運了。 我們已經(jīng)開發(fā)了一些自定義的方法來解決這些問題。在我們的“中性減法”方法中,系統(tǒng)首先記錄某個人中性表情的臉。然后,軟件根據(jù)檢測到的該人當前顯示的臉和記錄的中性估值之間的差異,對該人的表情進行分類。比如,系統(tǒng)可能學會,爺爺僅僅眉頭緊鎖,并不意味著他總是生氣。我們還在進一步研究機器學習技術,該技術可快速為每個用戶軟件實現(xiàn)個性化。制造一個穩(wěn)健的人機交互系統(tǒng),讓用戶沒有太多挫敗感,是一個相當大的挑戰(zhàn)。我們正在試驗幾種游戲化校準過程的方法,我們認為“超級眼鏡”系統(tǒng)必須具有適應能力,才能取得商業(yè)成功。 我們從一開始就意識到這個系統(tǒng)是不完善的,于是設計了反饋來反映這一現(xiàn)實。綠框人臉檢測功能最初是為了緩解挫敗感:如果系統(tǒng)沒有跟蹤到朋友的臉,至少用戶知道這一點,并且不會等待永遠不會出現(xiàn)的反饋。然而,隨著時間的推移,我們開始認識到綠框自身就是一種干預治療,只要佩戴者看到一張臉,綠框都會提供反饋,對于患有自閉癥系列障礙的兒童,這種行為會有明顯不同。━━━━為了評估“超級眼鏡”,我們在過去6年里進行了3次研究。第一次研究是在我們的實驗室里,有一個非常初級的原型,用來測試患有自閉癥的兒童戴上谷歌眼鏡后會有什么樣的反應,以及他們會接收到什么樣的情緒提示。接下來,我們制作了一個完整的原型,并開展了一次設計試驗,在這個試驗中,自閉癥孩子的家庭把這些設備帶回家?guī)讉€星期。我們定期與這些家庭進行互動,并根據(jù)他們的反饋對原型進行修改。 用手中這臺精心修改的原型樣機,我們開始對設備的功效進行嚴格的測試。我們進行了一項隨機對照試驗,其中一組兒童接受典型的居家行為療法,而另一組兒童則接受這種療法外加使用“超級眼鏡”。我們使用了4組常用自閉癥研究測試,尋找情緒識別和更廣泛的社交技能的改善。正如我們在2019年《美國醫(yī)學會小兒科期刊》(JAMA Pediatrics)上發(fā)表的論文中所述,在一組測試中,干預組表現(xiàn)明顯優(yōu)于對照組。

我們還請家長告訴我們他們注意到了什么。他們點評技術功能、用戶挫折感以及他們希望看到的新功能,他們的觀察幫助我們改進了原型的設計。我們居家設計試驗開始時的一封電子郵件就很引人注目。這位家長報告說自己的小孩立即有了顯著的改善:“在通過谷歌眼鏡互動過程中,他實際上正在看著我們……就好像他身上的開關被打開了一樣……謝謝你們?。?!我兒子正看著我的臉?!?/p>

這封郵件非常鼓舞人心,但聽起來好得令人難以置信。然而,在我們的研究中,關于增加眼神交流的評論一直存在,我們在一份設計研究的出版物中記錄了這個有趣的反饋。時至今日,我們?nèi)阅軓摹罢彰鏖_關”參與者小組那里聽到類似的故事。 我們相信“超級眼鏡”系統(tǒng)是有效的,但說實話,我們真的不知道為什么有效。我們還無法確定導致增加眼神交流、社交參與度和情緒識別的主要行為機制是什么。這一未知為我們目前的研究提供新的信息。情緒識別反饋對孩子的幫助最大嗎?還是我們的設備的主要功效是通過綠框吸引人們對臉的注意力?或者我們只是提供了一個平臺來增加家庭內(nèi)部的社交互動?這個系統(tǒng)是以同樣的方式幫助所有的孩子,還是以不同的方式滿足不同人群的需求?如果我們能夠回答這些問題,那我們干預治療的設計就能更有針對性和個性化。 由丹尼斯?沃爾創(chuàng)立的初創(chuàng)公司Cognoa,目前正致力于將我們的“超級眼鏡”原型轉(zhuǎn)變?yōu)榭蛇M入醫(yī)生處方的臨床療法。在2019年2月美國食品藥品管理局認定該項技術為“突破性療法”,這將加快獲得健康保險公司監(jiān)管批準和接納的進程。Cognoa公司的增強現(xiàn)實療法將適用于大多數(shù)類型的智能手機,它不僅與谷歌眼鏡兼容,還將與即將上市的新品牌智能眼鏡兼容。在另一個項目中,該公司正在開發(fā)一種數(shù)字工具,醫(yī)生可以用它來診斷只有18個月大的兒童,這可使這些兒童在大腦發(fā)育的關鍵時期準備接受治療。 最終,我們認為我們的治療方法還可以用于自閉癥以外的問題兒童。例如,針對語言障礙兒童,或者被診斷患有注意力缺陷多動障礙的孩子,我們可以為他們設計游戲和反饋。我們正在設想用各種普遍存在的人工智能設備為用戶提供治療,并反之推動技術改進的良性循環(huán);這些設備在輔助學習的同時,還可以捕捉數(shù)據(jù),幫助我們了解如何更好地進行個性化治療。在這個過程中,甚至還可以對各種失調(diào)癥獲得新的科學見解。最重要的是,這些設備將能夠幫助家庭掌握自己的治療和家庭動態(tài)。通過“超級眼鏡”和其他可穿戴設備,他們將看到未來的方向。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 增強現(xiàn)實

    關注

    1

    文章

    712

    瀏覽量

    44945
  • 谷歌眼鏡
    +關注

    關注

    0

    文章

    119

    瀏覽量

    25959

原文標題:讓情緒更加透明

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    千丘智能:虛擬現(xiàn)實技術賦能孤獨數(shù)字療法發(fā)展

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)在第三屆南渡江智慧醫(yī)療與康復產(chǎn)業(yè)高峰論壇上,上海千丘智能科技有限公司(以下簡稱:千丘智能)創(chuàng)始人、總經(jīng)理侍淳博分享的主題是《孤獨領域中數(shù)字療法應用》。 千丘智能創(chuàng)始人
    發(fā)表于 11-22 11:37 ?169次閱讀
    千丘智能:虛擬<b class='flag-5'>現(xiàn)實</b>技術賦能孤獨<b class='flag-5'>癥</b>數(shù)字<b class='flag-5'>療法</b>發(fā)展

    增強現(xiàn)實抬頭顯示是啥意思

     增強現(xiàn)實抬頭顯示(AR-HUD, Augmented Reality Head-Up Display)是AR增強現(xiàn)實技術和HUD抬頭顯示功能的結(jié)合體。這種技術
    的頭像 發(fā)表于 09-15 14:37 ?796次閱讀

    高通與三星谷歌合作開發(fā)混合現(xiàn)實眼鏡

    高通公司首席執(zhí)行官克里斯蒂亞諾·阿蒙近日宣布了一項重要合作動態(tài):高通正攜手三星與谷歌,共同研發(fā)一款創(chuàng)新的混合現(xiàn)實眼鏡。這款眼鏡設計獨特,旨在與智能手機無縫連接
    的頭像 發(fā)表于 09-06 16:37 ?424次閱讀

    微軟正全力研發(fā)Windows增強現(xiàn)實(AR)眼鏡

    近日,微軟在AR技術領域的雄心壯志再次顯現(xiàn),其最新曝光的專利揭示了公司正全力研發(fā)配備尖端攝像頭的Windows增強現(xiàn)實(AR)眼鏡。這一動向由國際知名科技媒體Windows Latest率先披露,展示了微軟在AR
    的頭像 發(fā)表于 07-29 16:19 ?955次閱讀

    增強現(xiàn)實和虛擬現(xiàn)實的聯(lián)系和區(qū)別

    增強現(xiàn)實(AR)和虛擬現(xiàn)實(VR)是兩種不同的技術,它們在許多方面都有聯(lián)系和區(qū)別。 一、增強現(xiàn)實(AR)和虛擬
    的頭像 發(fā)表于 07-08 11:00 ?2253次閱讀

    增強現(xiàn)實是虛實結(jié)合嗎為什么

    增強現(xiàn)實(Augmented Reality,簡稱AR)是一種將虛擬信息與現(xiàn)實世界相結(jié)合的技術,它通過計算機生成的圖像、聲音、觸覺等感官信息,增強
    的頭像 發(fā)表于 07-08 10:58 ?482次閱讀

    增強現(xiàn)實技術的特點有哪些

    增強現(xiàn)實技術(Augmented Reality,簡稱AR技術)是一種將計算機生成的虛擬信息疊加到現(xiàn)實世界中的技術。它通過實時地計算攝像機影像的位置及角度,將相應的圖像、視頻、3D模型
    的頭像 發(fā)表于 07-08 10:56 ?935次閱讀

    增強現(xiàn)實ar和全息投影的區(qū)別

    。通過使用智能手機、平板電腦、智能眼鏡等設備,用戶可以在現(xiàn)實世界中看到虛擬的圖像、文字、聲音等信息。AR技術可以應用于游戲、教育、醫(yī)療、旅游等多個領域。 全息投影 全息投影(Holographic Projection)是一種利
    的頭像 發(fā)表于 07-08 10:44 ?1317次閱讀

    Magic Leap與谷歌攜手打造增強現(xiàn)實新篇章

    近日,增強現(xiàn)實(AR)領域的佼佼者Magic Leap與全球科技巨頭谷歌宣布建立戰(zhàn)略技術合作伙伴關系。這一消息得到了谷歌發(fā)言人的確認,標志著雙方在
    的頭像 發(fā)表于 06-03 09:23 ?552次閱讀

    谷歌GameFace項目讓用戶通過面部表情控制PC游戲角色

    開發(fā)者可將“Game Face”無障礙功能融入應用程序,使用戶能夠通過面部手勢或頭部運動來控制光標。例如,張口可實現(xiàn)光標的移動,抬眉則表示進行拖拽操作。
    的頭像 發(fā)表于 05-15 10:07 ?402次閱讀

    增強現(xiàn)實ar是什么

    ,將計算機生成的文字、圖像、音頻等信息與現(xiàn)實世界相結(jié)合,為用戶提供一個更加豐富、直觀的交互體驗。 增強現(xiàn)實技術的核心是將虛擬信息與現(xiàn)實環(huán)境相融合。為了實現(xiàn)這一目標,首先需要對
    的頭像 發(fā)表于 05-02 15:18 ?804次閱讀

    微軟、谷歌聯(lián)手多家科技巨頭保護兒童安全

     4 月 24 日消息,隨著生成式 AI 的快速發(fā)展,如何保障兒童安全成為了焦點。微軟、谷歌日前與 Thorn、All Tech Is Human 等專業(yè)機構(gòu)聯(lián)手,以期在生成 AI 技術中實施更嚴格的兒童安全措施。
    的頭像 發(fā)表于 04-24 10:50 ?425次閱讀

    蘋果Vision Pro頭顯瞄準谷歌眼鏡遺留市場,涉足航空航天領域

    谷歌眼鏡最初定位公眾使用的增強現(xiàn)實眼鏡,但隨后轉(zhuǎn)為主要服務于企業(yè)客戶??上髽I(yè)版也僅存續(xù)8年時間,最終在去年停止銷售智能
    的頭像 發(fā)表于 04-11 14:18 ?345次閱讀

    什么是AR?ar增強現(xiàn)實的技術支撐是什么

    標定技術:這是增強現(xiàn)實AR眼鏡的關鍵技術之一,用于確定人眼與跟蹤系統(tǒng)之間的相對位置關系,以及人眼的內(nèi)參數(shù),幫助用戶準確地看到虛擬與真實世界的融合。
    的頭像 發(fā)表于 03-07 18:18 ?3426次閱讀
    什么是AR?ar<b class='flag-5'>增強</b><b class='flag-5'>現(xiàn)實</b>的技術支撐是什么

    虛擬現(xiàn)實增強現(xiàn)實含義是什么

    增強現(xiàn)實的含義進行詳細介紹。 虛擬現(xiàn)實是一種通過計算機技術模擬產(chǎn)生的能夠讓用戶沉浸其中的三維環(huán)境。用戶可以通過頭戴式顯示器、手套等設備與虛
    的頭像 發(fā)表于 12-30 10:37 ?8985次閱讀
    RM新时代网站-首页