從《阿凡達》到《流浪地球》,從好萊塢科幻 3D 電影之最到中國科幻 3D 電影之最,從 2009 年到 2019 年,近十年的歲月,見證了中國 3D 影視制作的快速成長和繁盛,也刺激著趙天奇探索人工智能與影視制作結(jié)合應(yīng)用的信心。
影視制作中,科幻電影的火爆讓全球影迷感受到了 3D 特效的魅力,這與近年來人工智能技術(shù)的突破性進展密不可分。
“比如《流浪地球》的每一個鏡頭都需要手工制作,這個過程十分復(fù)雜,耗費的人力成本也非常之高。人工智能影視制作就是用 AI 替代影視行業(yè)中大量的比較枯燥、高成本、低創(chuàng)造性的工作。”聚力維度創(chuàng)始人、CTO、Qualcomm AI 榮譽技術(shù)大使 趙天奇如是說。
多年來,趙天奇一直專注人工智能與影視行業(yè)的結(jié)合創(chuàng)新。北郵讀博期間,他創(chuàng)立了一家名為十二維度的公司,定位于數(shù)字圖像及 AI 在 3D 影視方面的應(yīng)用,當時,VR 市場的火爆讓 3D 找到了最佳落地方向,但他并不滿足,在趙天奇的帶領(lǐng)下,2016 年,科幻成真實驗室首個人工智能 2D 轉(zhuǎn) 3D 平臺 “崢嶸” 上線,而他現(xiàn)在還是清華大學人工智能影視方向的博士后。
自動實現(xiàn) 2D 轉(zhuǎn) 3D 有何難?
2011 年開始,隨著谷歌、微軟研究團隊先后將深度學習應(yīng)用到語音識別領(lǐng)域,2019 圖靈獎獲得者 Geoffrey Hinton 團隊在 ImageNet 大賽中利用深度學習將圖片識別的錯誤率大幅降低,由深度學習技術(shù)推動的人工智能開始得到更多科研機構(gòu)、工業(yè)界的高度關(guān)注。
盡管那時人工智能的概念還沒有如今這么火爆,但趙天奇敏銳地察覺到深度學習背景下語音識別、計算機視覺在影視行業(yè)所變革的潛力。
傳統(tǒng)的 3D 內(nèi)容制作技術(shù)主要有兩種:一種是 3D 雙機實拍,一種就是 2D 后期轉(zhuǎn) 3D,但仍需要耗費巨大的資金、人力和時間成本。而技術(shù)的瓶頸直接導(dǎo)致 3D 內(nèi)容的匱乏,目前國產(chǎn) 3D 電影呈扎堆之勢,但成熟者卻不多。那么,將 2D 視頻渲染成 3D 有哪些技術(shù)難點?
趙天奇強調(diào),一是影視內(nèi)容的類別十分復(fù)雜,例如人物場景、自然場景、歷史場景、想象場景等,每增加一個維度就上升一個級別;二是對觀影效果的要求非常高,將絲毫的抖動誤差排除到最小。為此,他們針對性地設(shè)計了多級神經(jīng)網(wǎng)絡(luò)、時空復(fù)用信息、對抗神經(jīng)網(wǎng)絡(luò)等技術(shù),最終達到了院線級的水平。
很多算法是 “玩具級”的,只能用來娛樂
目前,聚力維度在 3D 領(lǐng)域的產(chǎn)業(yè)化已經(jīng)非常成熟了,包括院線電影、電視劇、視頻直播等 ToB 領(lǐng)域,以及涉及個人短視頻、2D 轉(zhuǎn) 3D 的 ToC 領(lǐng)域。
談及此前爭議頗多的 “AI 換臉” 技術(shù),在趙天奇看來,“有很多算法都是‘玩具級’的,娛樂可以,但沒有人用它來生產(chǎn)內(nèi)容?!?/p>
他認為,如果將人工智能的應(yīng)用分為識別、決策、生成、理解幾種任務(wù)的話,聚力維度是一家專注于影視產(chǎn)品生成的公司。怎么理解呢?“就是給人去看、去聽,而不是幫人決策?!?/p>
聚力維度還聯(lián)合 Qualcomm 共同為終端用戶提供語音技術(shù)服務(wù)。趙天奇認為,Qualcomm 本身在移動端的基因非常深厚,也是非常符合場景需求的,對于 AI 技術(shù)快速落地到移動端,也是最有發(fā)言權(quán)的。
當然,這只是一個起點,未來在 ToC 領(lǐng)域像變臉、面部捕捉、動作捕捉、3D 轉(zhuǎn)換等(技術(shù))雙方都可以進行更全方位的合作。而且,趙天奇團隊也在積極探索真人級的面部捕捉、動作捕捉技術(shù),計劃與電視臺等合作落地“虛擬主播” 項目。
不久前,趙天奇被評為 Qualcomm AI 榮譽技術(shù)大使,這無疑是對其團隊的一種肯定。趙天奇強調(diào):“我們做這個方向在 AI 領(lǐng)域確實也是一個比較獨特的方向,相對于大熱的安防人臉識別、自動駕駛決策等領(lǐng)域,影視生成并不是所有人都能理解的。但我們也發(fā)現(xiàn):不管是影視傳媒還是互聯(lián)網(wǎng)領(lǐng)域的合作伙伴,都可以與之合作加速 AI 影視制作的落地?!?/p>
“人人都可以做影視作品”,是趙天奇對當下 AI 在影視行業(yè)產(chǎn)生變革的愿景。例如,定制化電影、時效性電影、多結(jié)局交互游戲式電影都是他們正嘗試突破的方向。未來,趙天奇還希望利用 AI 技術(shù)將面部捕捉、聲音捕捉、動作捕捉、動作生成全流程覆蓋,真正實現(xiàn)“視頻作家”,并將全流程服務(wù)在產(chǎn)業(yè)中快速落地。
專用人工智能是沒有泡沫的
據(jù)英國風投基金 MMCVentures 發(fā)布的最新研究報告顯示,歐洲 2830 家標榜為 AI 的公司中,有 1580 家符合 AI 公司的定義,也就是說,近四成的公司其實和 AI 沒有任何關(guān)系。當時,這一數(shù)字的公布,引起了圈內(nèi)不小的震動。
“從現(xiàn)階段來講,如果大家對通用人工智能 / 強人工智能有所期待的話,這件事情應(yīng)該是有泡沫的;相反,專用人工智能,從本質(zhì)上是沒有泡沫的。”趙天奇認為。
他還建議:專注于高校里的研究人員,更適合研究通用人工智能,因為企業(yè)擁有數(shù)據(jù),在盈利壓力之下,可能會在某個專項問題上比高校內(nèi)的研究人員取得更為突出的成果;但同樣企業(yè)需要盈利,就無法專門去研究通用人工智能,所以新的技術(shù)就可能出現(xiàn)在純研究人員的高校群體中,“盡量往需要小數(shù)據(jù),不需要數(shù)據(jù),通用人工智能這條路上去研究;如果是創(chuàng)業(yè)者,一定要針對他自己熟悉的領(lǐng)域以及對應(yīng)的專用人工智能結(jié)合,徹底地分析這件事情的可行性、局限性?!?/p>
當然,AI 算法只是意味著開了個好頭,真正考驗的是創(chuàng)新企業(yè)如何結(jié)合自身業(yè)務(wù)將算法進行商業(yè)落地。要知道,AI 的實際技術(shù)門檻很高,在發(fā)展過程中,真正的 AI 公司也可能遇到數(shù)據(jù)和技術(shù)的挑戰(zhàn)。在這一點上,對于持續(xù)高漲的中國 AI 企業(yè)來講更是挑戰(zhàn)巨大。
“對技術(shù)與行業(yè)時刻保持深刻理解,一定要兩者結(jié)合才能形成真正落地的項目?!睂τ谮w天奇而言,從最初 2012 年創(chuàng)立團隊,經(jīng)歷了 2016 年顛覆創(chuàng)新,現(xiàn)在已經(jīng)能準確把握人工智能與影視行業(yè)結(jié)合的痛點,讓人人都能做電影,科幻般的人工智能影視制作方式成為現(xiàn)實。
-
AI
+關(guān)注
關(guān)注
87瀏覽量
268886 -
Qualcomm
+關(guān)注
關(guān)注
8文章
673瀏覽量
52097 -
深度學習
+關(guān)注
關(guān)注
73文章
5500瀏覽量
121111
原文標題:普通人也能用AI拍出3D大片?這位清華博士后這么做
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論