來源:電子工程專輯
編輯:感知芯視界 萬仞
幾十年來,真正身臨其境的虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR)的前景似乎都已非常接近,然而,隨著每一項(xiàng)新技術(shù)的引入,似乎又都變得遙不可及了。如今的好消息是,它們距離人們的確越來越近了。然而,要想讓AR和VR真正身臨其境,人們所有的感官都必須確信這種體驗(yàn)是真實(shí)的。
創(chuàng)造可信的VR和AR體驗(yàn),取決于工程師如何準(zhǔn)確、一致地再現(xiàn)所有構(gòu)成人們感知現(xiàn)實(shí)的元素,需要從理解人類生理學(xué)和神經(jīng)科學(xué)開始。對于感知現(xiàn)實(shí)世界中的3D結(jié)構(gòu)來說,至關(guān)重要的是人們必須首先了解多感官信號,然后再是利用耳機(jī)技術(shù)來進(jìn)行模擬。
實(shí)現(xiàn)基于技術(shù)的現(xiàn)實(shí)
VR設(shè)備遮擋了用戶的視覺,呈現(xiàn)了一個(gè)模擬環(huán)境——在該環(huán)境中,感官刺激提供了存在感和與虛擬對象的交互。AR設(shè)備將虛擬對象覆蓋在物理環(huán)境上,感官提示提供了物理元素和增強(qiáng)元素之間的一致性。3D AR系統(tǒng)也被稱為混合現(xiàn)實(shí)設(shè)備,它在虛擬環(huán)境中融合了真實(shí)世界的元素。
每種配置都有獨(dú)特的要求,但推動(dòng)這些系統(tǒng)向前進(jìn)步的常見技術(shù),包括實(shí)時(shí)3D傳感和跟蹤、強(qiáng)大算力且節(jié)能的計(jì)算處理、高保真圖形渲染和顯示、沉浸式音頻、機(jī)器學(xué)習(xí)和人工智能算法、直觀的人機(jī)界面和新穎的應(yīng)用。
身臨其境的視覺體驗(yàn)
通過創(chuàng)新的圖形和顯示技術(shù),人們可以渲染逼真度更高的數(shù)字對象,并在更小的區(qū)域封裝更多像素,且比以往任何時(shí)候都更清晰、更明亮。然而實(shí)際上,對于上述這些,還有更多的事情要做。其中不光是渲染逼真的圖像,以及利用所需視覺提示的近眼顯示。
如今的高分辨率智能手機(jī)顯示器,每英寸顯示500多個(gè)像素(PPI)。但對于身臨其境的耳機(jī)視覺效果來說,利用PPI來度量已顯不足,一個(gè)相關(guān)度更好的度量是,顯示器顯示視場的每度的像素(PPD)。
在中心視覺點(diǎn)上,典型的人眼具有大約1/60度的角分辨率。每只眼睛的水平視野約為160°,垂直視野約為175°。兩只眼睛協(xié)同工作,在約120°寬和約135°高的FOV范圍內(nèi)實(shí)現(xiàn)立體深度感知。所有這些都意味著人們需要為每只眼睛提供大約100兆像素(MP),為立體視覺提供大約60MP,以提供60PPD的視覺。然而,當(dāng)今最先進(jìn)的主流VR頭戴式耳機(jī)顯示器大約才達(dá)到3.5MP。
由于目前的制造技術(shù),還不支持這種像素密度,設(shè)計(jì)師必須在理解人類視覺系統(tǒng)如何工作的基礎(chǔ)上,在高分辨率渲染視覺場景的凸顯部分做出權(quán)衡。
眼睛跟蹤和注視點(diǎn)渲染
人類高視力敏度僅限于非常小的視場,該視覺場為以中央凹為中心、圍繞眼睛光軸約±1°的范圍。這意味著視覺中心最清晰,邊緣趨模糊。使用實(shí)時(shí)傳感器來跟蹤用戶的注視區(qū)域,人們可以在中心注視區(qū)域渲染更多數(shù)量的多邊形,將計(jì)算能力集中在那里,并在其他地方以指數(shù)級降低圖形保真度(多邊形密度)。這種強(qiáng)化中央渲染的處理方式,可以顯著減少圖形工作負(fù)荷和相關(guān)的功耗。
圖1:人眼的中央凹上有高密度的視錐感光體,從而導(dǎo)致中央視覺的視力敏度高,而周邊的光受體密度顯著下降,導(dǎo)致視力下降。(資料來源:E.Bruce Goldstein《感覺與感知》)
世界各地的研究人員正在對此進(jìn)行研究,設(shè)計(jì)師正在探索多顯示器配置,其中高分辨率顯示器覆蓋中央凹視覺,像素?cái)?shù)相對較低的顯示器覆蓋周邊視覺。未來的顯示架構(gòu),將能夠在注視方向上及其周圍,動(dòng)態(tài)地實(shí)時(shí)投影更高分辨率的視覺內(nèi)容。
調(diào)節(jié)和會(huì)聚失配
另一個(gè)關(guān)鍵問題是確保動(dòng)眼神經(jīng)線索的一致性,以糾正眼睛調(diào)節(jié)和會(huì)聚錯(cuò)配。人類用兩只眼睛聚焦在一個(gè)物體上,立體地看待世界。通過調(diào)節(jié),每只眼睛的晶狀體都會(huì)改變形狀,以聚焦來自不同深度的光線。兩只眼睛會(huì)聚的距離與每只眼睛所適應(yīng)的距離相同。
如今的商用VR和AR耳機(jī)中,匯聚距離和調(diào)和距離之間存在不匹配?,F(xiàn)實(shí)世界中的光,是通過來自各種不同距離光源的反射和折射來調(diào)適的。而在頭戴式耳機(jī)中,所有的光都是通過同一距離的光源產(chǎn)生的。此時(shí),當(dāng)眼睛會(huì)聚以觀看虛擬物體時(shí),其透鏡形狀必須不斷調(diào)整,以聚焦從顯示器發(fā)出的固定距離光,從而導(dǎo)致不同程度的距離失配,這通常會(huì)導(dǎo)致眼睛疲勞或定向問題。
圖2:3D顯示器的會(huì)聚調(diào)節(jié)失配。(來源:Martin Banks)
為解決這一問題,人們正在探索各種方法,例如動(dòng)態(tài)可移動(dòng)光學(xué)器件和焦點(diǎn)可調(diào)液晶透鏡,其焦距可以隨著電壓的調(diào)整而改變。
3D空間音頻
對于真正的沉浸感,AR/VR音頻體驗(yàn)必須與視覺體驗(yàn)相對應(yīng)并協(xié)調(diào),以便所感覺的聲音位置與用戶所看到的目標(biāo)完全一致。在現(xiàn)實(shí)世界中,大多數(shù)人即使閉上眼睛,都能感知到聲音的大致位置。這是因?yàn)榇竽X能夠?qū)β曇舻摹暗竭_(dá)時(shí)間”和強(qiáng)度進(jìn)行感知和分析。這在現(xiàn)實(shí)世界中是自動(dòng)即時(shí)發(fā)生的,然而在VR耳機(jī)中,必須對3D空間音頻進(jìn)行編程和處理。
挑戰(zhàn)在于,每個(gè)人對聲音信號的體驗(yàn)是不同的,信號頻譜會(huì)根據(jù)頭部和耳朵的大小、形狀以及受眾等因素而變化。這個(gè)被稱為與頭部相關(guān)的傳遞函數(shù),如今的許多技術(shù),都在致力于對其實(shí)現(xiàn)盡可能逼近的近似。另外,正在進(jìn)行的個(gè)性化功能研究,也將使耳機(jī)用戶能夠以正確的空間線索來感知虛擬物體發(fā)出的聲音。
低延遲由內(nèi)而外跟蹤
在VR/AR中,實(shí)時(shí)跟蹤用戶的頭部運(yùn)動(dòng)顯然是必要的。無論何時(shí),在3D空間內(nèi),系統(tǒng)都必須能夠確定頭戴式耳機(jī)相對于其他物體的位置,并同時(shí)確保高精度和低延遲,以便根據(jù)用戶的頭部位置及方向來渲染和呈現(xiàn)相應(yīng)的視覺和聽覺信息,另外,在用戶移動(dòng)時(shí)還要快速更新。
直到不久前,VR耳機(jī)還通過“內(nèi)外”跟蹤方法,利用用戶放置在環(huán)境周圍的外部傳感器來跟蹤人類頭部運(yùn)動(dòng)。而如今,基于計(jì)算機(jī)視覺和微調(diào)運(yùn)動(dòng)傳感器的有機(jī)結(jié)合,“由內(nèi)而外”的跟蹤提供了模擬定位、映射技術(shù)、以及視覺慣性測距,從而實(shí)現(xiàn)了頭戴式耳機(jī)內(nèi)的運(yùn)動(dòng)跟蹤。
然而,一個(gè)持續(xù)的挑戰(zhàn)是,如何實(shí)現(xiàn)更低的動(dòng)作到光子延遲,即從目標(biāo)動(dòng)作開始到從顯示器中相應(yīng)圖像幀的最后一個(gè)像素發(fā)射光子之間的延遲。換句話說,它是傳感器數(shù)據(jù)采集、處理、接口傳輸、圖形計(jì)算、圖像渲染和顯示更新所花費(fèi)的總時(shí)間。
通常在現(xiàn)實(shí)世界中,根據(jù)視覺確定的視野變化以及前庭感覺系統(tǒng)檢測到的運(yùn)動(dòng)信息,來跟蹤人們的頭部運(yùn)動(dòng)。如果VR耳機(jī)的延遲時(shí)間過長,會(huì)導(dǎo)致視覺前庭不匹配,從而導(dǎo)致定向問題和頭暈。目前系統(tǒng)實(shí)現(xiàn)的動(dòng)作到光子延遲通常為20~40ms,但感知無縫體驗(yàn)要求該延遲小于10ms。
人類導(dǎo)入和交互
身臨其境的體驗(yàn)還要求用戶能夠與虛擬對象進(jìn)行逼真的交互。人們必須能夠伸手抓住物體,并且物體必須按照物理定律實(shí)時(shí)做出反應(yīng)。
如今最先進(jìn)的耳機(jī),讓用戶可以用基本的手勢選擇物體,隨著計(jì)算機(jī)視覺技術(shù)的不斷進(jìn)步,還有人工智能的快速進(jìn)步,未來的耳機(jī)將包括更豐富的手勢控制功能。
下一代設(shè)備還將提供多模式交互及眼動(dòng)追蹤技術(shù),將允許用戶通過將視線集中在虛擬物體上來進(jìn)行選擇,然后用手勢進(jìn)行激活或操控。很快,隨著人工智能技術(shù)的不斷發(fā)展,本地低延遲處理將成為現(xiàn)實(shí),耳機(jī)也將具有實(shí)時(shí)語音識別功能。
展望未來
如今,人們可以體驗(yàn)一些主流的VR和有前景的工業(yè)AR,但它們并非完全沉浸式的。雖然這條路并不直接,但隨著數(shù)十億美元的相關(guān)技術(shù)投資,其潛力幾乎是無限的。例如,麥肯錫估計(jì),到2030年,元宇宙可能產(chǎn)生4萬億至5萬億美元的收入。
通過不斷突破技術(shù)障礙,人們將能夠再現(xiàn)逼真的體驗(yàn),最終能夠從根本上縮小人們在真實(shí)世界和虛擬世界體驗(yàn)之間的差異。
審核編輯 黃宇
-
Ar
+關(guān)注
關(guān)注
24文章
5095瀏覽量
169468 -
vr
+關(guān)注
關(guān)注
34文章
9638瀏覽量
150207
發(fā)布評論請先 登錄
相關(guān)推薦
評論