1872年,斯坦福找到了一位科學(xué)家進(jìn)行連續(xù)攝影并由此創(chuàng)造了人類歷史上第一個“視頻”。1877年,愛迪生在其“圓筒留聲機(jī)”上錄制了《瑪麗有只小羊羔》的幾秒鐘歌詞,標(biāo)志著人類歷史上的第一條音頻記錄。由此,人類正式進(jìn)入了音視頻時代。
在人類漫長的歷史長河中,文字、圖畫是記錄和傳遞信息的主要方式,直到音視頻出現(xiàn),才將人類記錄信息的方式升級到了一個更高維度。從黑白電視再到8K杜比全景聲超清音視頻,音視頻產(chǎn)業(yè)經(jīng)過一百多年的發(fā)展,已然成長為萬億級產(chǎn)業(yè)。
01
風(fēng)口之上的多重挑戰(zhàn)
在數(shù)字化浪潮的推動下,AI、大模型與音視頻的結(jié)合正成為產(chǎn)業(yè)焦點,引領(lǐng)著一場全新的內(nèi)容革命。從 AI 作曲到智能配音,從視頻生成到虛擬形象,AI 在音頻、視頻創(chuàng)作領(lǐng)域的應(yīng)用正在全面開花。
不久前的2024中國新媒體大會上,一系列獲獎的AI融媒精品案例彰顯了文化與科技的“雙向奔赴”,其中包括5G密集視音頻傳輸系統(tǒng)、視頻內(nèi)容生產(chǎn)與傳播一體化完整技術(shù)方案等,AI已重新定義音視頻生產(chǎn)力的“新范式”,人工智能和音視頻領(lǐng)域融合趨勢日漸顯著,同時音視頻服務(wù)已廣泛應(yīng)用于互娛、廣電傳媒、教育、金融等各種行業(yè),對場景的滲透愈發(fā)深入,“人工智能+音視頻”技術(shù)正加速賦能千行百業(yè)。
與此同時,這一核心變革的背后,也對AI算力提出了更高要求。
視頻生成模型的數(shù)據(jù)處理挑戰(zhàn)
視頻生成模型需要處理包括圖像、音頻和視頻在內(nèi)的大量數(shù)據(jù),樣本數(shù)據(jù)模態(tài)多樣化、數(shù)據(jù)質(zhì)量參差不齊,導(dǎo)致數(shù)據(jù)處理鏈路環(huán)節(jié)多、工程復(fù)雜。另外大量的多模態(tài)數(shù)據(jù)處理也對數(shù)據(jù)存儲以及異構(gòu)算力資源調(diào)度提出了極高的需求。
算力需求及成本挑戰(zhàn)
音視頻AI技術(shù)快速發(fā)展伴隨著算力需求激增,隨之是高昂的算力成本。細(xì)膩的畫面質(zhì)感、流暢的幀率,還有精準(zhǔn)的特效處理,這一切都需要強(qiáng)大的算力支持,以某影片為例,該影片有1600個視覺特效鏡頭,用單機(jī)渲染,需要1700多年,即便用1000臺主機(jī),也要耗時約1.7年,算力需求及算力成本都將是天文數(shù)字。
02
軟硬協(xié)同,錨定性能升級
作為中國領(lǐng)先的國產(chǎn)軟硬一體產(chǎn)品及服務(wù)提供商,拓維信息持續(xù)深耕人工智能等前沿技術(shù)領(lǐng)域,長期堅持AI算力研發(fā)投入,自主研發(fā)的兆瀚CTS5301-L AI服務(wù)器作為一款專為 “AI+” 時代而生的算力新星,是音視頻行業(yè) “減負(fù)”與實現(xiàn)創(chuàng)意的最佳拍檔。
1
智能算力,多維賦能
兆瀚CTS5301-L AI服務(wù)器擁有卓越的AI性能和強(qiáng)大的異構(gòu)計算能力,全面支持昇騰Atlas 300I Duo等多款行業(yè)主流高性能加速卡,最大算力可達(dá)1.98PFlops@FP16,全面適用于大模型微調(diào)/推理、大模型訓(xùn)練、CV模型推理等多重場景,為支持多模態(tài)大模型、計算機(jī)視覺(CV)大模型推理等領(lǐng)域處理復(fù)雜音視頻制作任務(wù)提供強(qiáng)大的基礎(chǔ)設(shè)施支撐。
2
高效渲染,極致視效
兆瀚CTS5301-L AI服務(wù)器具備卓越的AI計算能力以及靈活的配置選項,無論是文本生成圖像,數(shù)據(jù)傳輸還是復(fù)雜的圖形渲染、視頻解碼等需求,兆瀚CTS5301-L AI服務(wù)器皆能提供多樣化算力支撐,大幅縮短渲染時間、降低渲染成本,打造極致的視覺體驗。此外兆瀚CTS5301-L AI服務(wù)器的整機(jī)功耗降低了30%,整機(jī)TCO提升了20%,大幅降低 AI 算力使用成本。
3
AIGC,創(chuàng)意無界
除了高質(zhì)量渲染與超強(qiáng)算力支撐,提升內(nèi)容制作的效率,兆瀚CTS5301-L AI服務(wù)器還支持多種行業(yè)主流的高性能加速卡,能夠適配多種AI模型和框架,包括但不限于盤古、GLM、GPT-3、STABLE Diffusion等,廣泛的兼容性能夠滿足不同的內(nèi)容生成類場景對更強(qiáng)大計算資源的需求。
AI技術(shù)的進(jìn)步不斷拓展創(chuàng)意的疆界,無論是創(chuàng)造高品質(zhì)的視覺作品,還是實現(xiàn)精確的語音合成,兆瀚CTS5301-L AI服務(wù)器都是音視頻行業(yè)創(chuàng)意道路上的「硬」核后盾。
未來,拓維信息將攜旗下“兆瀚”持續(xù)為醫(yī)療、金融、教育、娛樂等諸多領(lǐng)域的音視頻解決方案提供智能算力底座,助力各行業(yè)在數(shù)字化轉(zhuǎn)型的道路上實現(xiàn)更高效、更智能的音視頻內(nèi)容創(chuàng)作與傳播,攜手邁向一個創(chuàng)意無限、精彩紛呈的數(shù)字新紀(jì)元。
-
音視頻
+關(guān)注
關(guān)注
4文章
471瀏覽量
29872 -
算力
+關(guān)注
關(guān)注
1文章
964瀏覽量
14793 -
AIGC
+關(guān)注
關(guān)注
1文章
361瀏覽量
1539
發(fā)布評論請先 登錄
相關(guān)推薦
評論