RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

上海交大團隊發(fā)表MEMS視觸覺融合多模態(tài)人機交互新進展

傳感器專家網(wǎng) ? 2024-11-28 10:50 ? 次閱讀

近日,上海交通大學(xué)電子信息電氣工程學(xué)院微米納米加工技術(shù)全國重點實驗室劉景全團隊和上海交通大學(xué)人工智能學(xué)院盧策吾團隊在人機交互領(lǐng)域取得重要進展,相關(guān)成果以“Capturing forceful interaction with deformable objects using a deep learning-powered stretchable tactile array”(使用深度學(xué)習(xí)驅(qū)動的可拉伸觸覺陣列捕捉可形變物體的力學(xué)交互)為題,在國際著名期刊《Nature Communications》上發(fā)表。

wKgZO2dHUnSAJPYbAALIZ5pGFIQ849.png

研究背景

觸覺感知是獲取環(huán)境信息的重要渠道之一,在人機交互、虛擬現(xiàn)實、遠程醫(yī)療和人形機器人等領(lǐng)域有重要研究價值。對于人形機器人而言,捕捉復(fù)雜操作任務(wù)中手與可形變物體之間的觸覺數(shù)據(jù)并進一步估計手-物狀態(tài)是一個巨大挑戰(zhàn)。為解決上述問題,首先需要借助人機交互界面捕捉人類操作過程,再將經(jīng)驗遷移給機器人。傳統(tǒng)的人機交互識別通常只能生成語義結(jié)果,如識別手勢代表的字母,識別物體的種類和位置。因此,研究一種具有更高維度的精準(zhǔn)、分布式人機交互界面,將有助于動態(tài)捕捉人類操作可形變物體的過程,這對推動人類通用操作能力向機器智能操作的遷移具有重要的研究價值和應(yīng)用潛力。

亮點內(nèi)容

該研究提出了一種全新的視覺-觸覺聯(lián)合記錄和追蹤系統(tǒng)ViTaM(Visual-Tactile recording and tracking system for Manipulation)。該系統(tǒng)配備了具有1152個力感知通道的柔性MEMS觸覺手套,基于正/負拉阻效應(yīng)克服了感知可形變物體時的應(yīng)變干擾問題,實現(xiàn)了精準(zhǔn)、分布式的觸覺感知;同時,該研究通過視覺與觸覺的聯(lián)合深度學(xué)習(xí),重建了動態(tài)的手-物操作狀態(tài),一定程度上促進了智能體在人機交互中的理解能力進步,尤其是在涉及力學(xué)交互的方面,向人類多模態(tài)感知的水平邁近了一步。

wKgZO2dHUnSAChgyAAHKa2i8fxw239.png

圖1 深度學(xué)習(xí)驅(qū)動的觸覺手套可捕捉與可形變物體的力學(xué)交互

該團隊研制的基于正/負拉阻效應(yīng)的復(fù)合式薄膜,通過工藝調(diào)控,可以使得兩種薄膜對所受應(yīng)變表現(xiàn)出方向相反、幅值近似的電學(xué)特性,從而對雙電極的對稱響應(yīng)實時檢測,區(qū)分出傳感器所受的壓力與應(yīng)變,并通過自適應(yīng)校準(zhǔn)輸出電壓與受力的關(guān)系曲線,最終達到對應(yīng)變干擾的主動抑制效果。經(jīng)測試,力測量精度達到97.6%,相較于未校準(zhǔn)時提升了45.3%,這對精準(zhǔn)感知可形變物體的受力具有較強的幫助。

wKgZO2dHUnWAPULIAAGVkiNApuc510.png

圖2 具有應(yīng)變干擾抑制能力的觸覺手套設(shè)計、制造和測試方法

研究團隊還提出了一種視覺-觸覺聯(lián)合深度學(xué)習(xí)框架,旨在處理多模態(tài)數(shù)據(jù)序列、動態(tài)重建手-物狀態(tài),以及恢復(fù)可形變物體的幾何細節(jié)。該工作在包含剛性體和可形變物體的6類共24種物體上進行了訓(xùn)練和實驗,所有序列的平均重建誤差僅為1.8厘米,表明了該系統(tǒng)在操作不同形變程度的物體時,具有較強的普適性,能夠有效復(fù)現(xiàn)人類操作的經(jīng)驗。

wKgZO2dHUnWAAZQhAAFutSdC8Jg079.png

圖3 視覺-觸覺聯(lián)合學(xué)習(xí)框架的流程

wKgZO2dHUnWAMUyZAAGyO6v9358558.png

圖4 基于ViTaM系統(tǒng)的手-物重建結(jié)果

圖4展示了基于ViTaM系統(tǒng)進行手-物重建的結(jié)果,分別從有無應(yīng)變干擾抑制方面、連續(xù)形變方面以及純視覺與視觸融合多模態(tài)方面進行了分析,顯示出視覺-觸覺聯(lián)合深度學(xué)習(xí)具有明顯的優(yōu)勢。最后展示了在真實世界中收集的視覺-觸覺數(shù)據(jù)重建的序列結(jié)果,證明了該方法在處理多幀數(shù)據(jù)時的時空一致性。

未來,ViTaM系統(tǒng)將被集成到人形機器人的電子皮膚中,實現(xiàn)與周圍環(huán)境的無縫互動,提升機器人靈巧操作能力,推動機器人從操作特定物體到通用操作場景的技術(shù)進步。

研究團隊

上海交通大學(xué)電院劉景全教授和人工智能學(xué)院盧策吾教授為該論文的共同通訊作者,博士后姜春蓬和博士后徐文強為共同第一作者。該工作得到了國家重點研發(fā)計劃和國家自然科學(xué)基金等項目資助。

劉景全教授團隊長期致力于可穿戴/可植入柔性電子器件與微系統(tǒng)的研制,旨在充分運用多學(xué)科交叉優(yōu)勢,解決醫(yī)療健康和極端環(huán)境中的重大需求,發(fā)表論文有Sci. Adv. 2021、Adv. Mater. 2021、Adv. Funct. Mater. 2023、ACS Nano 2023、Small 2019、和Biosens. Bioelectron. 2024等。課題組網(wǎng)頁:https://mems.sjtu.edu.cn/cn/

盧策吾教授團隊長期致力于具身智能、計算機視覺和智能機器人相關(guān)領(lǐng)域的研究和系統(tǒng)研發(fā),擁有國際先進水平的開源人工智能框架和數(shù)據(jù)集,相關(guān)研究工作發(fā)表在計算機領(lǐng)域頂級期刊和會議:Nature、Nature Machine Intelligence、TPAMI和CVPR等,獲得科學(xué)探索獎(獲獎理由:具身智能貢獻)。

論文鏈接:https://www.nature.com/articles/s41467-024-53654-y


原文標(biāo)題:上海交大團隊發(fā)表MEMS視觸覺融合多模態(tài)人機交互新進展

文章出處:【微信公眾號:傳感器專家網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機交互
    +關(guān)注

    關(guān)注

    12

    文章

    1206

    瀏覽量

    55380
  • mems
    +關(guān)注

    關(guān)注

    129

    文章

    3924

    瀏覽量

    190578
收藏 人收藏

    評論

    相關(guān)推薦

    奧拓電子吳涵渠董事長受邀出席上海交大活動

    近日,上海交通大學(xué)昆山未來產(chǎn)業(yè)創(chuàng)新院成立儀式在昆山隆重舉行,眾多領(lǐng)導(dǎo)、優(yōu)秀校友、嘉賓及業(yè)界精英齊聚一堂,共同見證這一歷史性的時刻。奧拓電子與上海交大在人才培養(yǎng)、科技創(chuàng)新、成果轉(zhuǎn)化等領(lǐng)域保持密切
    的頭像 發(fā)表于 12-10 16:10 ?160次閱讀

    具身智能對人機交互的影響

    在人工智能的發(fā)展歷程中,人機交互一直是研究的核心領(lǐng)域之一。隨著技術(shù)的進步,人機交互的方式也在不斷演變。從最初的命令行界面,到圖形用戶界面,再到現(xiàn)在的自然語言處理和語音識別,每一次技術(shù)的突破都極大
    的頭像 發(fā)表于 10-27 09:58 ?316次閱讀

    AI大模型的最新研究進展

    。例如,在醫(yī)療領(lǐng)域,生成式AI可以幫助醫(yī)生生成診斷報告、治療方案等;在教育領(lǐng)域,AI大模型可以生成個性化的學(xué)習(xí)資源和建議。 模態(tài)融合交互 : AI大模型正在向
    的頭像 發(fā)表于 10-23 15:19 ?408次閱讀

    橋田動態(tài) 橋田智能與上海交大達成產(chǎn)學(xué)研合作項目

    橋田智能與上海交大達成產(chǎn)學(xué)研合作,聚焦汽車智能制造及機器人智能化。雙方將深化科研、人才培養(yǎng)、成果轉(zhuǎn)化等合作,共同推動智能制造領(lǐng)域發(fā)展,加速裝備智能化、柔性化進程。
    的頭像 發(fā)表于 10-15 17:06 ?239次閱讀

    基于傳感器的人機交互技術(shù)

    基于傳感器的人機交互技術(shù)是現(xiàn)代科技發(fā)展的重要領(lǐng)域之一,它極大地推動了人機交互的便捷性、自然性和智能性。本文將詳細探討基于傳感器的人機交互技術(shù),包括其基本原理、關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域以及未來發(fā)展趨勢。
    的頭像 發(fā)表于 07-17 16:52 ?775次閱讀

    慕尼黑電子展回顧:啟明智顯模態(tài)硬件智能體引領(lǐng)科技潮流

    人流如織,熱鬧非凡。模態(tài)硬件智能體:未來科技的集大成者展會現(xiàn)場,啟明智顯隆重推出了其自主研發(fā)的模態(tài)硬件智能體。這一創(chuàng)新產(chǎn)品融合了HMI(
    的頭像 發(fā)表于 07-10 16:17 ?363次閱讀
    慕尼黑電子展回顧:啟明智顯<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>硬件智能體引領(lǐng)科技潮流

    人機交互界面是什么_人機交互界面的功能

    人機交互界面(Human-Computer Interaction Interface,簡稱HCI或HMI),也被稱為人機界面(MMI)、操作員界面終端(OIT)、本地操作員界面(LOI)或操作員
    的頭像 發(fā)表于 06-22 11:03 ?2456次閱讀

    人機交互與人機界面的區(qū)別與聯(lián)系

    隨著信息技術(shù)的飛速發(fā)展,人機交互(Human-Computer Interaction,HCI)已成為現(xiàn)代社會不可或缺的一部分。人機交互技術(shù),作為實現(xiàn)人與計算機之間有效通信的橋梁,不僅改變了我們
    的頭像 發(fā)表于 06-07 15:29 ?972次閱讀

    中國科學(xué)技術(shù)大學(xué)科研團隊取得量子計算研究新進展

    中國科學(xué)技術(shù)大學(xué)科研團隊取得量子計算研究新進展 據(jù)央視新聞報道,中國科學(xué)技術(shù)大學(xué)科研團隊利用自主研發(fā)的關(guān)鍵設(shè)備,利用“自底而上”的量子模擬方法,在國際上首次實現(xiàn)光子的反常分數(shù)量子霍爾態(tài)。 據(jù)中國科大
    的頭像 發(fā)表于 05-08 16:40 ?705次閱讀

    上海交大與云天勵飛簽署戰(zhàn)略合作協(xié)議,尋找AI時代的Killer App

    4月20日,上海交通大學(xué)人工智能未來科技對話會暨人工智能學(xué)院成立揭牌儀式在徐匯校區(qū)舉行。云天勵飛董事占兼CEO陳寧博士作為上海交大校友、人工智能產(chǎn)業(yè)代表人物受邀參加活動。
    的頭像 發(fā)表于 04-22 10:21 ?562次閱讀
    <b class='flag-5'>上海交大</b>與云天勵飛簽署戰(zhàn)略合作協(xié)議,尋找AI時代的Killer App

    人機交互的三個階段 人機交互的常用方式

    交互經(jīng)歷的三個階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?3027次閱讀

    清華大學(xué)在電子鼻傳感器仿生嗅聞方向取得新進展

    近日,清華大學(xué)機械系在電子鼻仿生嗅聞研究中取得新進展,相關(guān)研究成果以“Sniffing Like a Wine Taster: Multiple Overlapping Sniffs (MOSS
    的頭像 發(fā)表于 02-20 10:57 ?992次閱讀
    清華大學(xué)在電子鼻傳感器仿生嗅聞方向取得<b class='flag-5'>新進展</b>

    人機交互技術(shù)有哪幾種 人機交互技術(shù)的發(fā)展趨勢

    人機交互技術(shù)是指人與計算機之間通過各種交互方式進行信息傳遞、操作和控制的技術(shù)。隨著科技的進步,人機交互技術(shù)也在不斷發(fā)展創(chuàng)新。以下將介紹人機交互技術(shù)的幾種常見形式以及當(dāng)前的發(fā)展趨勢。 一
    的頭像 發(fā)表于 01-22 17:47 ?3583次閱讀

    兩家企業(yè)有關(guān)LED項目的最新進展

    近日,乾富半導(dǎo)體與英創(chuàng)力兩家企業(yè)有關(guān)LED項目傳來最新進展
    的頭像 發(fā)表于 01-15 13:37 ?677次閱讀

    語音識別技術(shù)最新進展:視聽融合模態(tài)交互成為主要演進方向

    多種模態(tài)(聲學(xué)、語言模型、視覺特征等)進行聯(lián)合建模,基于深度學(xué)習(xí)的模態(tài)語音識別取得了新進展。 ?
    的頭像 發(fā)表于 12-28 09:06 ?3837次閱讀
    語音識別技術(shù)最<b class='flag-5'>新進展</b>:視聽<b class='flag-5'>融合</b>的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>交互</b>成為主要演進方向
    RM新时代网站-首页