RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA AI模型QUEEN實現(xiàn)高效內容直播

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-12-19 16:42 ? 次閱讀

這個被稱為 QUEEN 的模型支持低帶寬、高質量的場景生成,可用于工業(yè)機器人操作、3D 視頻會議和直播等流媒體應用。

NVIDIA Research 與馬里蘭大學合作開發(fā)的 AI 模型 QUEEN 將內容直播帶入全新的維度。有了 QUEEN,直播自由視角視頻有望成為現(xiàn)實,也就是說,觀眾可以從任意視角體驗 3D 場景。

QUEEN 可用于構建沉浸式直播應用,例如教授烹飪等技能、讓球迷就像身處球場一樣從任意視角觀看比賽,或者在工作場所舉行更加身臨其境的視頻會議。QUEEN 也能用于工業(yè)環(huán)境,幫助操作員遠程操控倉庫或工廠中的機器人。

該模型在本月于溫哥華舉行的年度 AI 盛會 NeurIPS 上進行了展示。

NVIDIA 研究總監(jiān)、杰出研究科學家 Shalini De Mello 表示:“要想近乎實時地直播自由視角視頻,就必須同時重建和壓縮 3D 場景。QUEEN 巧妙地平衡了壓縮率、視覺質量、編碼時間和渲染時間等各種因素,從而創(chuàng)建了一個優(yōu)化的流程,為視覺質量和可直播性樹立了新的標桿?!?/p>

通過減少渲染量,重復利用

和循環(huán)利用等方式實現(xiàn)高效直播

自由視角視頻通常使用來自各種攝像角度拍攝的視頻素材制作而成,例如多機位拍攝、倉庫里的一組安防攝像頭或是辦公室中的視頻會議攝像頭系統(tǒng)。

以往用于生成自由視角視頻的 AI 方法要么占用過多的內存用于直播,要么為了縮小文件大小而犧牲視覺質量,而 QUEEN 在兩者之間取得了平衡。即便是存在火花、火焰或毛茸動物的動態(tài)場景,也能輕松地把高質量的視頻內容從主機服務器傳輸?shù)娇蛻舳嗽O備。而且,與之前的方法相比,它還能夠更快地渲染視頻內容以進行直播。

在大多數(shù)真實環(huán)境中,場景中的許多元素都是靜止不動的。在視頻中,這意味著某個幀中的大部分像素與其它幀中的像素相同。為了節(jié)省計算時間,QUEEN 跟蹤并重復使用這些靜態(tài)區(qū)域的渲染,從而騰出資源來專注于重建那些隨時間變化的內容。

研究人員使用了一塊 NVIDIA Tensor Core GPU,在多個基準測試中評估 QUEEN 的性能,他們發(fā)現(xiàn)該模型的表現(xiàn)在一系列指標上都優(yōu)于目前最先進的在線自由視角視頻制作方法。對于從不同角度拍攝同一場景的 2D 視頻,通常只需不到五秒的訓練時間,就能以每秒約 350 幀的速度渲染自由視角視頻。

同時實現(xiàn)高速度和高視覺質量,這意味著音樂會和體育賽事轉播能夠提供身臨其境般的虛擬現(xiàn)實體驗或比賽集錦的即時回放。

在倉庫場景中,機器人操作員可以利用 QUEEN,在操縱物體時更精準地測量深度。在視頻會議中,例如 SIGGRAPH 和 NVIDIA GTC 大會上的 3D 視頻會議 demo,它可以幫助主持人演示烹飪或折紙等場景,同時讓觀眾可以選擇最適合自己學習的視角。

NVIDIA 為 NeurIPS 制作和撰寫了 50 多篇學術海報和論文,QUEEN 是其中之一。這些學術海報和論文介紹了在模擬、機器人和醫(yī)療等領域具有巨大應用前景的開創(chuàng)性 AI 研究成果。

首次介紹了 GAN 模型的論文《生成式對抗網(wǎng)絡》在 NeurIPS 2024 大會上榮獲“時間檢驗獎”。該論文被引用超過 8.5 萬次,其中一個作者是 NVIDIA 的杰出工程師 Bing Xu。

NVIDIA Research 在全球擁有數(shù)百名科學家和工程師,專注于 AI、計算機圖形學、計算機視覺、自動駕駛汽車和機器人等領域的研究,歡迎點擊“閱讀原文”查看他們的最新研究成果 。

大型語言模型、模擬和建模、邊緣 AI 等領域的學術科研人員可以申請 NVIDIA 學術資助計劃。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4978

    瀏覽量

    102984
  • AI
    AI
    +關注

    關注

    87

    文章

    30728

    瀏覽量

    268880
  • 模型
    +關注

    關注

    1

    文章

    3226

    瀏覽量

    48806

原文標題:NVIDIA Research 開發(fā)的模型實現(xiàn)了快速、高效的動態(tài)場景重建

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA推出全新生成式AI模型Fugatto

    NVIDIA 開發(fā)了一個全新的生成式 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發(fā)表于 11-27 11:29 ?326次閱讀

    使用NVIDIA AI平臺確保醫(yī)療數(shù)據(jù)安全

    三井物產(chǎn)株式會社子公司借助 NVIDIA AI 平臺實現(xiàn)數(shù)據(jù)集的安全共享并使用在這些數(shù)據(jù)集上建立的強大模型加速藥物研發(fā)。
    的頭像 發(fā)表于 11-20 09:37 ?171次閱讀

    NVIDIA AI助力實現(xiàn)更好的癌癥檢測

    由美國頂級醫(yī)療中心和研究機構的專家組成了一個專家委員會,該委員會正在使用 NVIDIA 支持的聯(lián)邦學習來評估聯(lián)邦學習和 AI 輔助注釋對訓練 AI 腫瘤分割模型的影響。
    的頭像 發(fā)表于 11-19 15:54 ?171次閱讀

    NVIDIA NIM助力企業(yè)高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調用來大規(guī)模地部署大語言模型。
    的頭像 發(fā)表于 10-10 09:49 ?382次閱讀

    直播預告】AI系統(tǒng)的多相電源原理與應用

    系統(tǒng)對電源性能要求更加嚴格。不僅需要靈活且精確的控制,同時還需要滿足高效率和高功率密度。本次直播主要分享AI系統(tǒng)的多相電源的原理與應用,結合雙通道多相電流模式控制器
    的頭像 發(fā)表于 09-19 08:05 ?216次閱讀
    【<b class='flag-5'>直播</b>預告】<b class='flag-5'>AI</b>系統(tǒng)的多相電源原理與應用

    NVIDIA CorrDiff生成式AI模型能夠精準預測臺風

    NVIDIA GPU 上運行的一個擴散模型向天氣預報工作者展示了加速計算如何實現(xiàn)新的用途并提升能效。
    的頭像 發(fā)表于 09-13 17:13 ?694次閱讀

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態(tài)的優(yōu)勢,為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務器
    的頭像 發(fā)表于 09-09 09:19 ?459次閱讀

    借助NVIDIA NIM加速AI應用部署

    大語言模型(LLM)在企業(yè)組織中的應用日益廣泛,許多企業(yè)都將其整合到 AI 應用中。雖然從基礎模型著手十分高效,但需要花費一定的精力才能將它們整合到生產(chǎn)就緒型環(huán)境中。
    的頭像 發(fā)表于 08-23 16:38 ?384次閱讀
    借助<b class='flag-5'>NVIDIA</b> NIM加速<b class='flag-5'>AI</b>應用部署

    NVIDIA Broadcast助力實現(xiàn)高質量直播和遠程工作

    AI 為計算領域帶來了深遠的改變。雖然最近的焦點是生成式 AI,但多年來,由 NVIDIA RTX 提供支持的 AI 加速工具也在改善游戲、內容
    的頭像 發(fā)表于 08-23 15:35 ?560次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1 系列開源
    的頭像 發(fā)表于 07-25 09:48 ?698次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企業(yè)和各國現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對,來構建“超級
    發(fā)表于 07-24 09:39 ?706次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    直播預告】基于ISO 26262實現(xiàn)高質量的MBD過程

    直播時間:2024年6月12號20:00直播平臺:視頻號、CSDN、B站、抖音下方一鍵預約直播大綱?基于模型的軟件開發(fā)(MBD)基本原則和優(yōu)勢模型
    的頭像 發(fā)表于 06-06 08:25 ?373次閱讀
    【<b class='flag-5'>直播</b>預告】基于ISO 26262<b class='flag-5'>實現(xiàn)</b>高質量的MBD過程

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,為全球的2800萬英偉達開發(fā)者
    的頭像 發(fā)表于 06-04 09:15 ?674次閱讀

    NVIDIA在加速識因智能AI模型落地應用方面的重要作用介紹

    本案例介紹了 NVIDIA 在加速識因智能 AI模型落地應用方面的重要作用。生成式大模型已廣泛應用于各領域,通過學習人類思維方式,能快速挖掘海量
    的頭像 發(fā)表于 03-29 15:28 ?617次閱讀

    NVIDIA生成式AI研究實現(xiàn)在1秒內生成3D形狀

    NVIDIA 研究人員使 LATTE3D (一款最新文本轉 3D 生成式 AI 模型實現(xiàn)雙倍加速。
    的頭像 發(fā)表于 03-27 10:28 ?492次閱讀
    <b class='flag-5'>NVIDIA</b>生成式<b class='flag-5'>AI</b>研究<b class='flag-5'>實現(xiàn)</b>在1秒內生成3D形狀
    RM新时代网站-首页