RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探析人機(jī)自然交互研究的最新進(jìn)展

mK5P_AItists ? 來(lái)源:cc ? 2019-02-25 14:15 ? 次閱讀

隨著信息技術(shù)的發(fā)展,在傳統(tǒng)物理鍵盤之外,觸屏、虛擬現(xiàn)實(shí)等新型交互接口不斷出現(xiàn),在提高了交互自然性的同時(shí),卻顯著降低了交互的性能。如何兼顧交互的自然性和高效性,成為人機(jī)交互研究中的難題。

在信息技術(shù)領(lǐng)域,“胖手指”這一術(shù)語(yǔ)專指由于手指本身的柔軟,以及點(diǎn)擊時(shí)對(duì)于屏幕顯示內(nèi)容的遮擋,在觸屏上點(diǎn)擊時(shí)往往難以精確控制落點(diǎn)位置的問題。隨著信息技術(shù)的飛速發(fā)展、新型交互方式的不斷涌現(xiàn),在人機(jī)交互研究領(lǐng)域,這類問題日益成為研究的熱點(diǎn)。

近日獲得中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)優(yōu)秀博士學(xué)位論文獎(jiǎng)的研究成果中,清華大學(xué)博士易鑫試圖以深化的貝葉斯方法解決人機(jī)自然交互行為噪聲帶來(lái)的意圖推理難題,為解決“胖手指”問題帶來(lái)了新的思路。

易鑫的導(dǎo)師——清華大學(xué)計(jì)算機(jī)系教授、全球創(chuàng)新學(xué)院院長(zhǎng)史元春告訴《中國(guó)科學(xué)報(bào)》:“這算是我們向讓機(jī)器理解人類行為邁出的一小步?!?/p>

兼顧交互的自然性和高效性

貝葉斯方法也稱為貝葉斯定理,它所呈現(xiàn)的公式可以讓人們通過已知的條件概率(通常是因果方向的)計(jì)算未知的概率,因而成為很多進(jìn)行概率推理的現(xiàn)代人工智能系統(tǒng)的基礎(chǔ)。

而對(duì)于易鑫來(lái)說(shuō),在他以人機(jī)交互研究為主題的博士學(xué)位論文中,與貝葉斯方法相關(guān)的關(guān)鍵詞是“文本輸入”。易鑫告訴《中國(guó)科學(xué)報(bào)》:“文本輸入是人機(jī)交互中最基本的任務(wù)之一,是人向計(jì)算機(jī)表達(dá)交互意圖的重要途徑?!倍谶M(jìn)行文本輸入意圖推理時(shí),目前最常用的方法——經(jīng)典統(tǒng)計(jì)解碼方法,其本質(zhì)也是貝葉斯方法。

隨著信息技術(shù)的發(fā)展,在傳統(tǒng)物理鍵盤之外,觸屏、虛擬現(xiàn)實(shí)等新型交互接口不斷出現(xiàn),在提高了交互自然性的同時(shí),卻顯著降低了交互的性能。“如何兼顧交互的自然性和高效性,成為人機(jī)交互研究中的難題?!币做握f(shuō)。

人機(jī)交互研究的一大特點(diǎn)是與實(shí)際需求或應(yīng)用場(chǎng)景聯(lián)系非常緊密。在數(shù)十年以前,人機(jī)界面就經(jīng)歷了從命令行界面到圖形用戶界面的演變。

易鑫介紹說(shuō),命令行界面的優(yōu)點(diǎn)是由于物理鍵盤輸入相對(duì)較高的準(zhǔn)確率,以及幾乎不需要冗余的操作,所以熟練的用戶可以達(dá)到非常高的交互效率。但是,其缺點(diǎn)在于交互非常不直觀,用戶需要記憶大量的指令,有時(shí)甚至需要具備計(jì)算機(jī)領(lǐng)域的專業(yè)知識(shí)和技能,才能達(dá)到較高的使用效率。

為了改進(jìn)這一問題,研究者提出了圖形用戶界面。圖形用戶界面的一大優(yōu)勢(shì)是擺脫了抽象的命令,顯著降低了用戶的學(xué)習(xí)和認(rèn)知成本。然而,由于圖形用戶界面的基本操作是指點(diǎn),即用戶需要使用鼠標(biāo)操作屏幕指針來(lái)選擇交互目標(biāo),因而其往往對(duì)用戶指點(diǎn)操作的精度有較高的要求。

易鑫告訴記者,多年來(lái)人機(jī)界面的發(fā)展趨勢(shì)是越來(lái)越強(qiáng)調(diào)交互的自然性,即用戶的交互行為與其生理和認(rèn)知的習(xí)慣相吻合,并隨之出現(xiàn)了觸摸交互界面,以及近年來(lái)的體感交互、虛擬現(xiàn)實(shí)等三維交互界面。三維交互界面的優(yōu)勢(shì)是進(jìn)一步提升了人機(jī)界面的自然性,但其挑戰(zhàn)則在于完全缺乏觸覺反饋,導(dǎo)致用戶動(dòng)作行為中的噪聲相對(duì)較大,難以進(jìn)行交互意圖的準(zhǔn)確推理,從而限制了交互輸入的準(zhǔn)確度。

“此前,也有研究者嘗試采用貝葉斯方法解決文本輸入中兼顧交互的自然性和高效性這一難題,但往往僅考慮了落點(diǎn)位置信息,作用有限?!币做胃嬖V記者,為此,他在自己的研究中面向多種輸入接口,從點(diǎn)擊模型精度優(yōu)化(提升計(jì)算精度)、面向不確定性輸入映射的計(jì)算方法擴(kuò)展(擴(kuò)展計(jì)算方法)和文本輸入手部動(dòng)作建模(擴(kuò)充先驗(yàn)知識(shí))等方面優(yōu)化了文本輸入的基本貝葉斯方法,相應(yīng)的技術(shù)也大幅提高了自然文本輸入的交互性能。

觸屏設(shè)備上的模型優(yōu)化

易鑫在其研究中,針對(duì)觸屏軟鍵盤這一文本輸入接口上的胖手指難題,提出了觸屏軟鍵盤上精度優(yōu)化的點(diǎn)擊模型。

他告訴《中國(guó)科學(xué)報(bào)》,在日常生活中,雖然智能手機(jī)智能手表等觸屏設(shè)備正變得越來(lái)越普遍,但由于觸摸操作的不準(zhǔn)確性,在觸屏上點(diǎn)擊小尺寸目標(biāo)仍然十分困難。而其不準(zhǔn)確性主要來(lái)自兩方面原因:一是用戶點(diǎn)擊行為中的噪聲,也常常被稱為“胖手指”問題,二是點(diǎn)擊位置識(shí)別算法的誤差。

為了測(cè)量用戶在智能手機(jī)上觸摸時(shí)的落點(diǎn)偏差,易鑫和他的同伴從校園招募了多名被試人員。在實(shí)驗(yàn)中,他們主要關(guān)注兩個(gè)問題:一是落點(diǎn)偏差是否隨著目標(biāo)位置的不同而不同,二是拇指和食指兩種點(diǎn)擊姿勢(shì)下的偏差模式是否一致。最終,他們發(fā)現(xiàn),在使用食指和拇指點(diǎn)擊時(shí),點(diǎn)擊偏差都會(huì)受到目標(biāo)位置的影響,其中后者受到的影響更為顯著。

基于觸摸落點(diǎn)位置的高精度識(shí)別方法,易鑫在論文中進(jìn)一步建立了接口尺寸與輸入速度、準(zhǔn)確率和落點(diǎn)分布的作用關(guān)系,提升了軟鍵盤輸入貝葉斯方法中點(diǎn)擊模型與輸入行為的吻合程度,定量描述了當(dāng)用戶在寬度為2.0到4.0厘米的超小尺寸全鍵盤上進(jìn)行文本輸入時(shí)的行為特征。

用戶實(shí)驗(yàn)結(jié)果證明,基于該精度優(yōu)化的點(diǎn)擊模型的貝葉斯方法能支持用戶在寬度僅為3.5厘米的智能手表全鍵盤上達(dá)到與智能手機(jī)軟鍵盤相當(dāng)?shù)摹⒚糠昼?5個(gè)英文單詞的輸入速度和近100%的準(zhǔn)確率。此外,點(diǎn)擊模型的精度優(yōu)化也能將手機(jī)軟鍵盤的文本輸入錯(cuò)誤率降低23%。

另外,易鑫還在研究中定量分析了點(diǎn)擊模型和語(yǔ)言模型的能力分別對(duì)文本輸入的貝葉斯方法識(shí)別效果的影響,為點(diǎn)擊模型的精度優(yōu)化提供了依據(jù)和理論指導(dǎo)。

在行為中發(fā)現(xiàn)知識(shí)

“如果單純就文本輸入問題而言,特別是涉及自然的人機(jī)交互方式,易鑫所做的工作在國(guó)際上是領(lǐng)先的?!痹趯?duì)易鑫的研究進(jìn)行評(píng)價(jià)時(shí),史元春用詞十分嚴(yán)謹(jǐn)。

可以作為佐證的成果之一是,易鑫對(duì)于空中文本輸入的研究??罩形谋据斎雽?duì)于后桌面時(shí)代交互(如虛擬現(xiàn)實(shí)、移動(dòng)手機(jī))是一個(gè)有潛力和被期待的交互需求。在這方面,雖然十指盲打是人們?cè)谌粘I钪凶罡咝Ш妥盍?xí)慣的輸入方式,但針對(duì)基于該能力的空中裸手十指盲打技術(shù)的研究,此前尚沒有人取得很好的效果。

而易鑫在研究中提出了一種使得空中裸手十指盲打成為可能的新型技術(shù)ATK。結(jié)果證明,ATK在輸入速度和準(zhǔn)確率方面都超過了已有的空中文本輸入技術(shù),第一次較好地實(shí)現(xiàn)了這一已經(jīng)提出數(shù)十年的交互概念。

對(duì)于下一步的研究,易鑫的設(shè)想之一是,研究貝葉斯方法與大數(shù)據(jù)機(jī)器學(xué)習(xí)類方法的融合。他表示,雖然貝葉斯方法在目前的研究中取得了不錯(cuò)的效果,但是其模型的參數(shù)還是基于少量(數(shù)十人)的樣本訓(xùn)練而來(lái)。隨著原型的迭代和可用數(shù)據(jù)的增多,大數(shù)據(jù)機(jī)器學(xué)習(xí)類方法將有機(jī)會(huì)在意圖推理中發(fā)揮重要的作用。然而,為了保持模型的可解釋性與可推廣性,需要探索貝葉斯方法與大數(shù)據(jù)機(jī)器學(xué)習(xí)類方法的有機(jī)融合方法,將“黑盒子”與“白盒子”結(jié)合起來(lái),以達(dá)到精度和推廣性的同步優(yōu)化。

史元春告訴記者,與人機(jī)交互領(lǐng)域貝葉斯方法的應(yīng)用相比,機(jī)器學(xué)習(xí)領(lǐng)域的貝葉斯方法主要是在數(shù)據(jù)中發(fā)現(xiàn)知識(shí),而人機(jī)交互則是在行為中發(fā)現(xiàn)知識(shí)。她正主持進(jìn)行的一項(xiàng)“十三五”國(guó)家重點(diǎn)研發(fā)計(jì)劃中的前沿基礎(chǔ)類研究項(xiàng)目,就是開展人機(jī)交互自然性的計(jì)算原理的研究,致力于探索使機(jī)器可以理解人類表達(dá)方式的能力。“易鑫的研究也是我們這項(xiàng)研究中的一部分?!笔吩赫f(shuō)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:向機(jī)器理解人類行為邁出一小步

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    上海交大團(tuán)隊(duì)發(fā)表MEMS視觸覺融合多模態(tài)人機(jī)交互新進(jìn)展

    ? 近日,上海交通大學(xué)電子信息與電氣工程學(xué)院微米納米加工技術(shù)全國(guó)重點(diǎn)實(shí)驗(yàn)室劉景全團(tuán)隊(duì)和上海交通大學(xué)人工智能學(xué)院盧策吾團(tuán)隊(duì)在人機(jī)交互領(lǐng)域取得重要進(jìn)展,相關(guān)成果以“Capturing forceful
    的頭像 發(fā)表于 11-28 10:50 ?653次閱讀
    上海交大團(tuán)隊(duì)發(fā)表MEMS視觸覺融合多模態(tài)<b class='flag-5'>人機(jī)交互</b><b class='flag-5'>新進(jìn)展</b>

    揭秘超以太網(wǎng)聯(lián)盟(UEC)1.0 規(guī)范最新進(jìn)展(2024Q4)

    近期,由博通、思科、Arista、微軟、Meta等國(guó)際頂級(jí)半導(dǎo)體、設(shè)備和云廠商牽頭成立的超以太網(wǎng)聯(lián)盟(UEC)在OCP Global Summit上對(duì)外公布其最新進(jìn)展——UEC規(guī)范1.0的預(yù)覽版本。讓我們一睹為快吧!
    的頭像 發(fā)表于 11-18 16:53 ?358次閱讀
    揭秘超以太網(wǎng)聯(lián)盟(UEC)1.0 規(guī)范<b class='flag-5'>最新進(jìn)展</b>(2024Q4)

    Qorvo在射頻和電源管理領(lǐng)域的最新進(jìn)展

    了半導(dǎo)體行業(yè)的重大變革,還成功引領(lǐng)Qorvo成為射頻技術(shù)的領(lǐng)導(dǎo)者。在本次專訪中,Philip將為大家分享Qorvo在射頻和電源管理領(lǐng)域的最新進(jìn)展,并探討HPA事業(yè)部如何通過技術(shù)創(chuàng)新應(yīng)對(duì)全球電氣化和互聯(lián)化的挑戰(zhàn)。
    的頭像 發(fā)表于 11-17 10:57 ?461次閱讀

    芯片和封裝級(jí)互連技術(shù)的最新進(jìn)展

    近年來(lái),計(jì)算領(lǐng)域發(fā)生了巨大變化,通信已成為系統(tǒng)性能的主要瓶頸,而非計(jì)算本身。這一轉(zhuǎn)變使互連技術(shù) - 即實(shí)現(xiàn)計(jì)算系統(tǒng)各組件之間數(shù)據(jù)交換的通道 - 成為計(jì)算機(jī)架構(gòu)創(chuàng)新的焦點(diǎn)。本文探討了通用、專用和量子計(jì)算系統(tǒng)中芯片和封裝級(jí)互連的最新進(jìn)展,并強(qiáng)調(diào)了這一快速發(fā)展領(lǐng)域的關(guān)鍵技術(shù)、挑戰(zhàn)和機(jī)遇。
    的頭像 發(fā)表于 10-28 09:50 ?391次閱讀

    AI大模型的最新研究進(jìn)展

    AI大模型的最新研究進(jìn)展體現(xiàn)在多個(gè)方面,以下是對(duì)其最新進(jìn)展的介紹: 一、技術(shù)創(chuàng)新與突破 生成式AI技術(shù)的爆發(fā) : 生成式AI技術(shù)正在迅速發(fā)展,其強(qiáng)大的生成能力使得AI大模型在多個(gè)領(lǐng)域得到廣泛應(yīng)用
    的頭像 發(fā)表于 10-23 15:19 ?409次閱讀

    5G新通話技術(shù)取得新進(jìn)展

    在探討5G新通話這一話題時(shí),我們需首先明確其背景與重要性。自2022年4月國(guó)內(nèi)運(yùn)營(yíng)商正式推出以來(lái),5G新通話作為傳統(tǒng)語(yǔ)音通話的升級(jí)版,迅速吸引了公眾的目光,并引起了社會(huì)的廣泛關(guān)注。它基于5G網(wǎng)絡(luò),代表了通信技術(shù)的新進(jìn)展
    的頭像 發(fā)表于 10-12 16:02 ?592次閱讀

    中國(guó)科學(xué)院西安光機(jī)所智能光學(xué)顯微成像研究取得新進(jìn)展

    近日,瞬態(tài)光學(xué)與光子技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室在智能光學(xué)顯微成像研究方面取得新進(jìn)展,研究成果在線發(fā)表于國(guó)際高水平學(xué)術(shù)期刊《光電進(jìn)展》(Opto-Electronic Advances,IF:
    的頭像 發(fā)表于 09-29 06:20 ?364次閱讀
    中國(guó)科學(xué)院西安光機(jī)所智能光學(xué)顯微成像<b class='flag-5'>研究</b>取得<b class='flag-5'>新進(jìn)展</b>

    中國(guó)科學(xué)技術(shù)大學(xué)科研團(tuán)隊(duì)取得量子計(jì)算研究新進(jìn)展

    中國(guó)科學(xué)技術(shù)大學(xué)科研團(tuán)隊(duì)取得量子計(jì)算研究新進(jìn)展 據(jù)央視新聞報(bào)道,中國(guó)科學(xué)技術(shù)大學(xué)科研團(tuán)隊(duì)利用自主研發(fā)的關(guān)鍵設(shè)備,利用“自底而上”的量子模擬方法,在國(guó)際上首次實(shí)現(xiàn)光子的反常分?jǐn)?shù)量子霍爾態(tài)。 據(jù)中國(guó)科大
    的頭像 發(fā)表于 05-08 16:40 ?705次閱讀

    廣東的5G-A、信號(hào)升格和低空經(jīng)濟(jì),又有新進(jìn)展!

    了兩地的5G/5G-A、智算等數(shù)字基礎(chǔ)設(shè)施建設(shè),深入了解了他們?cè)谛盘?hào)升格和低空經(jīng)濟(jì)方面的最新進(jìn)展?;顒?dòng)一共持續(xù)了三天,前后跑了8個(gè)項(xiàng)目,雖然很累,但收獲滿滿。接下
    的頭像 發(fā)表于 04-19 08:05 ?821次閱讀
    廣東的5G-A、信號(hào)升格和低空經(jīng)濟(jì),又有<b class='flag-5'>新進(jìn)展</b>!

    百度首席技術(shù)官王海峰解讀文心大模型的關(guān)鍵技術(shù)和最新進(jìn)展

    4月16日,以“創(chuàng)造未來(lái)”為主題的Create 2024百度AI開發(fā)者大會(huì)在深圳國(guó)際會(huì)展中心成功舉辦。百度首席技術(shù)官王海峰以“技術(shù)筑基,星河璀璨”為題,發(fā)表演講,解讀了智能體、代碼、多模型等多項(xiàng)文心大模型的關(guān)鍵技術(shù)和最新進(jìn)展。
    的頭像 發(fā)表于 04-18 09:20 ?691次閱讀
    百度首席技術(shù)官王海峰解讀文心大模型的關(guān)鍵技術(shù)和<b class='flag-5'>最新進(jìn)展</b>

    從原子到超級(jí)計(jì)算機(jī):NVIDIA與合作伙伴擴(kuò)展量子計(jì)算應(yīng)用

    量子計(jì)算領(lǐng)域的最新進(jìn)展包括分子研究、部署巨型超級(jí)計(jì)算機(jī),以及通過一項(xiàng)新的學(xué)術(shù)計(jì)劃培養(yǎng)量子從業(yè)人員。
    的頭像 發(fā)表于 03-22 10:05 ?419次閱讀

    四個(gè)50億+,多個(gè)半導(dǎo)體項(xiàng)目最新進(jìn)展

    來(lái)源:全球半導(dǎo)體觀察,謝謝 編輯:感知芯視界 Link 近日,半導(dǎo)體行業(yè)多個(gè)項(xiàng)目迎來(lái)最新進(jìn)展,其中浙江麗水特色工藝晶圓制造項(xiàng)目、浙江中寧硅業(yè)硅碳負(fù)極材料及高純硅烷系列產(chǎn)品項(xiàng)目、晶隆半導(dǎo)體材料及器件
    的頭像 發(fā)表于 02-27 09:35 ?1009次閱讀

    清華大學(xué)在電子鼻傳感器仿生嗅聞方向取得新進(jìn)展

    近日,清華大學(xué)機(jī)械系在電子鼻仿生嗅聞研究中取得新進(jìn)展,相關(guān)研究成果以“Sniffing Like a Wine Taster: Multiple Overlapping Sniffs (MOSS
    的頭像 發(fā)表于 02-20 10:57 ?993次閱讀
    清華大學(xué)在電子鼻傳感器仿生嗅聞方向取得<b class='flag-5'>新進(jìn)展</b>

    兩家企業(yè)有關(guān)LED項(xiàng)目的最新進(jìn)展

    近日,乾富半導(dǎo)體與英創(chuàng)力兩家企業(yè)有關(guān)LED項(xiàng)目傳來(lái)最新進(jìn)展。
    的頭像 發(fā)表于 01-15 13:37 ?678次閱讀

    語(yǔ)音識(shí)別技術(shù)最新進(jìn)展:視聽融合的多模態(tài)交互成為主要演進(jìn)方向

    多種模態(tài)(聲學(xué)、語(yǔ)言模型、視覺特征等)進(jìn)行聯(lián)合建模,基于深度學(xué)習(xí)的多模態(tài)語(yǔ)音識(shí)別取得了新進(jìn)展。 ? 多模態(tài)交互的原理及優(yōu)勢(shì) ? 多模態(tài)交互技術(shù)融合了多種輸入方式,包括語(yǔ)音、手勢(shì)、觸摸和眼動(dòng)等,使用戶可以根據(jù)自己的喜好和習(xí)慣
    的頭像 發(fā)表于 12-28 09:06 ?3837次閱讀
    語(yǔ)音識(shí)別技術(shù)<b class='flag-5'>最新進(jìn)展</b>:視聽融合的多模態(tài)<b class='flag-5'>交互</b>成為主要演進(jìn)方向
    RM新时代网站-首页