科幻小說《詩云》里面描述了這樣一個故事: 擁有至高科技的神級文明降臨地球,認(rèn)為在落后的人類面前他們的技術(shù)無所不能。在人類被逼到絕境之時,神發(fā)現(xiàn)人類文明中存在“李白的詩”,認(rèn)為技術(shù)能超越藝術(shù)的極限,并嘗試通過超級算力去窮舉完所有的詩詞以創(chuàng)造出超越詩仙巔峰的作品,然而最終挑戰(zhàn)失敗在人類本質(zhì)的創(chuàng)造力面前,無比強(qiáng)大的神級科技也低下了頭。
科技和藝術(shù)的關(guān)系是什么樣的?
在 Surreal 詩云科技創(chuàng)始團(tuán)隊看來,藝術(shù)的本質(zhì)是人類的創(chuàng)造力,無法被機(jī)器替代。但創(chuàng)作的過程和效率卻可以被機(jī)器極大優(yōu)化,讓人類更專注創(chuàng)意本身。
相機(jī)與降低成本
在 1819 年攝影術(shù)被尼埃普斯發(fā)明前,人們的視覺故事表達(dá)(visual storytelling)僅能通過繪畫來實(shí)現(xiàn)。
從 1839 年達(dá)蓋爾攝影法被無償貢獻(xiàn)給全人類,到輕便的膠卷替代了濕版,再到數(shù)碼相機(jī)的誕生,最后到今天我們利用輕便的手機(jī)攝像頭捕捉生活,人類對于視覺內(nèi)容的創(chuàng)作方式一直由科技推動而變得更加普世化。
今天大部分的視覺內(nèi)容創(chuàng)作,無論是圖片還是視頻,都是通過相機(jī)(Camera)來捕捉。
圖片來源:Vin Ganapathy. The Spruce, 2018
200 年多來,相機(jī)的定位和職能看似不斷地被延伸甚至顛覆,但是它的定位不外乎是兩點(diǎn):
●Capture Experience(記錄)
●Storytelling(故事表達(dá))
我們認(rèn)為,“記錄” 這個定位本身,會長期存在,而且會繼續(xù)朝著更方便輕巧的方向發(fā)展。
而 Storytelling 并非一定要通過相機(jī)實(shí)現(xiàn),因?yàn)槲覀兘裉炜梢酝ㄟ^ AI 來生成逼真的高質(zhì)量的視覺內(nèi)容,甚至將現(xiàn)實(shí)中不可能存在的場景變成可能。
我們相信,這看似魔法般的方式,未來會成為視覺內(nèi)容創(chuàng)作的主流,成為如同相機(jī)發(fā)明般的視覺內(nèi)容創(chuàng)作史轉(zhuǎn)折點(diǎn)。
我在 Snapchat 工作了六年多的時間,公司在 17 年 IPO 的時候?qū)ψ约旱亩x并非是基于社交網(wǎng)絡(luò)的公司,我們招股書的第一句話是:Snap is a camera company。
從成立到現(xiàn)在,我們都希望打造最一流的相機(jī)體驗(yàn),降低用戶表達(dá)分享的成本,從而更自由地創(chuàng)作內(nèi)容。背后的社交網(wǎng)絡(luò)其實(shí)是構(gòu)建在這個基礎(chǔ)之上的。
雖然我們看到很多新的內(nèi)容形式與相機(jī)特效的出現(xiàn),但是拍攝本身就是一個成本極高的行為,我們希望通過 AI 內(nèi)容生成來代替拍攝。
新的內(nèi)容基礎(chǔ)設(shè)施
詩云正在做的事情,從本質(zhì)上來說,是在構(gòu)建一個新的內(nèi)容基礎(chǔ)設(shè)施。
我們可以看到近些年在各大社交平臺上,人們在網(wǎng)絡(luò)上的表達(dá)更多由純文字變?yōu)楦庇^豐富的視覺內(nèi)容表達(dá)。
今天大部分的視覺內(nèi)容創(chuàng)作,其實(shí)要經(jīng)過繁瑣的拍攝設(shè)備與場景的搭建、演員的演繹、很多角色和攝影上的配合,以及后期的剪輯與加工。但是在我們構(gòu)建的這個新的生態(tài)系統(tǒng)里面,以AI生成技術(shù)取代復(fù)雜且高成本的拍攝過程,使用戶輸入的精妙創(chuàng)意可以極高效地被生動地表達(dá)出來。
未來一個趨勢將逐漸清晰——未來網(wǎng)絡(luò)上視覺內(nèi)容的數(shù)量增長將疾如雷電,且大部分內(nèi)容由AI進(jìn)行生成。
這種基于 AI 生成的技術(shù)會極大地提升內(nèi)容創(chuàng)作的生產(chǎn)力,甚至?xí)淖兾磥淼膬?nèi)容生產(chǎn)關(guān)系——從現(xiàn)在的創(chuàng)作者和內(nèi)容消費(fèi)者呈現(xiàn)一種割裂的狀態(tài),轉(zhuǎn)變成每個人都不僅是視覺內(nèi)容的消費(fèi)者,同時也可以是視覺內(nèi)容的創(chuàng)作者。
因?yàn)槲覀儠寗?chuàng)作內(nèi)容的創(chuàng)作以及內(nèi)容二次創(chuàng)作都會變得極其的簡單。信息的傳遞也不會像現(xiàn)在單向線性地傳播,而是觸達(dá)每個個體時會有二次發(fā)散的潛能,創(chuàng)造力會在個體間不斷碰撞融合,激發(fā)出更高能量。
圖片來源:Surreal 詩云科技
AI 內(nèi)容創(chuàng)作捷徑
我們將內(nèi)容基礎(chǔ)設(shè)施的建設(shè)大致分為三個階段 -基于人臉的生成、基于人體的生成、以及基于環(huán)境的生成,每一個階段都將圍繞「內(nèi)容生成」與「內(nèi)容再生產(chǎn)」兩個緯度展開。
其背后的思路是:從生成一個具有表達(dá)力的形象開始,到拓展這個角色的全貌,再將其放置于一個合適的上下文中以豐滿內(nèi)容表達(dá)層次,最終形成一個全面的內(nèi)容基礎(chǔ)設(shè)施。
圖片來源:Surreal 詩云科技
三個階段對于故事的表達(dá)能力依次遞增,每一個階段不同的技術(shù)和豐富的應(yīng)用場景都能創(chuàng)造巨大價值。
我們已經(jīng)把第一階段的角色形象生成相關(guān)技術(shù)發(fā)展成熟且產(chǎn)品化落地,現(xiàn)在可以按需高效生成不同人種模特圖,幫助品牌建立自己的模特 IP,并且快捷將批量圖片視頻視覺內(nèi)容進(jìn)行國際化文化適配,降低成本的同時顯著提高業(yè)務(wù)數(shù)據(jù)。
圖片來源:Surreal 詩云科技
我們第一階段的詩云馬良產(chǎn)品,不僅可以使用語音或者文字去驅(qū)動已生成的虛擬角色進(jìn)行精準(zhǔn)嘴形適配的視頻表達(dá),同時也可以控制虛擬角色的表情。
在內(nèi)容生產(chǎn)端,我們也可以給很多品牌方提供 AI 換臉的技術(shù),通過把我們創(chuàng)作的虛擬角色替換到他們現(xiàn)有的視覺內(nèi)容角色上,以更低成本去擁有海量不同模特展示的素材去表現(xiàn)他們的商品,增強(qiáng)品牌的表現(xiàn)力。
“我們活在最好的時代。” 內(nèi)容生成時代的來臨讓我們十分激動,詩云科技是世界上為數(shù)不多的投身到內(nèi)容生成領(lǐng)域的創(chuàng)業(yè)公司。
我們內(nèi)部有一個公式是:visual storytelling = creativity + making。我們要做的是把 「making 」的成本降低到趨近于零,構(gòu)建一套內(nèi)容生成系統(tǒng),讓每個用戶盡情去釋放自己的創(chuàng)造力——人類獨(dú)有的智慧結(jié)晶。這也是《詩云》給我們的啟示。
責(zé)任編輯:lq
-
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268882 -
視覺
+關(guān)注
關(guān)注
1文章
147瀏覽量
23934 -
生成技術(shù)
+關(guān)注
關(guān)注
0文章
6瀏覽量
5641
原文標(biāo)題:AI助力內(nèi)容生成進(jìn)入新紀(jì)元,創(chuàng)作門檻無限趨零
文章出處:【微信號:zhenfund,微信公眾號:真格基金】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論