RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算力攻堅,誰是音視頻AIGC時代背后的「硬」核玩家?

拓維信息系統(tǒng)股份有限公司 ? 2024-10-29 08:03 ? 次閱讀

1872年,斯坦福找到了一位科學(xué)家進(jìn)行連續(xù)攝影并由此創(chuàng)造了人類歷史上第一個“視頻”。1877年,愛迪生在其“圓筒留聲機(jī)”上錄制了《瑪麗有只小羊羔》的幾秒鐘歌詞,標(biāo)志著人類歷史上的第一條音頻記錄。由此,人類正式進(jìn)入了音視頻時代。

在人類漫長的歷史長河中,文字、圖畫是記錄和傳遞信息的主要方式,直到音視頻出現(xiàn),才將人類記錄信息的方式升級到了一個更高維度。從黑白電視再到8K杜比全景聲超清音視頻,音視頻產(chǎn)業(yè)經(jīng)過一百多年的發(fā)展,已然成長為萬億級產(chǎn)業(yè)。


01

風(fēng)口之上的多重挑戰(zhàn)

在數(shù)字化浪潮的推動下,AI、大模型與音視頻的結(jié)合正成為產(chǎn)業(yè)焦點,引領(lǐng)著一場全新的內(nèi)容革命。從 AI 作曲到智能配音,從視頻生成到虛擬形象,AI 在音頻、視頻創(chuàng)作領(lǐng)域的應(yīng)用正在全面開花。

不久前的2024中國新媒體大會上,一系列獲獎的AI融媒精品案例彰顯了文化與科技的“雙向奔赴”,其中包括5G密集視音頻傳輸系統(tǒng)、視頻內(nèi)容生產(chǎn)與傳播一體化完整技術(shù)方案等,AI已重新定義音視頻生產(chǎn)力的“新范式”,人工智能和音視頻領(lǐng)域融合趨勢日漸顯著,同時音視頻服務(wù)已廣泛應(yīng)用于互娛、廣電傳媒、教育、金融等各種行業(yè),對場景的滲透愈發(fā)深入,“人工智能+音視頻”技術(shù)正加速賦能千行百業(yè)。

與此同時,這一核心變革的背后,也對AI算力提出了更高要求。


視頻生成模型的數(shù)據(jù)處理挑戰(zhàn)

視頻生成模型需要處理包括圖像、音頻和視頻在內(nèi)的大量數(shù)據(jù),樣本數(shù)據(jù)模態(tài)多樣化、數(shù)據(jù)質(zhì)量參差不齊,導(dǎo)致數(shù)據(jù)處理鏈路環(huán)節(jié)多、工程復(fù)雜。另外大量的多模態(tài)數(shù)據(jù)處理也對數(shù)據(jù)存儲以及異構(gòu)算力資源調(diào)度提出了極高的需求。


算力需求及成本挑戰(zhàn)

音視頻AI技術(shù)快速發(fā)展伴隨著算力需求激增,隨之是高昂的算力成本。細(xì)膩的畫面質(zhì)感、流暢的幀率,還有精準(zhǔn)的特效處理,這一切都需要強(qiáng)大的算力支持,以某影片為例,該影片有1600個視覺特效鏡頭,用單機(jī)渲染,需要1700多年,即便用1000臺主機(jī),也要耗時約1.7年,算力需求及算力成本都將是天文數(shù)字。

02

軟硬協(xié)同,錨定性能升級

作為中國領(lǐng)先的國產(chǎn)軟硬一體產(chǎn)品及服務(wù)提供商,拓維信息持續(xù)深耕人工智能等前沿技術(shù)領(lǐng)域,長期堅持AI算力研發(fā)投入,自主研發(fā)的兆瀚CTS5301-L AI服務(wù)器作為一款專為 “AI+” 時代而生的算力新星,是音視頻行業(yè) “減負(fù)”與實現(xiàn)創(chuàng)意的最佳拍檔。


1

智能算力,多維賦能

兆瀚CTS5301-L AI服務(wù)器擁有卓越的AI性能和強(qiáng)大的異構(gòu)計算能力,全面支持昇騰Atlas 300I Duo等多款行業(yè)主流高性能加速卡,最大算力可達(dá)1.98PFlops@FP16,全面適用于大模型微調(diào)/推理、大模型訓(xùn)練、CV模型推理等多重場景,為支持多模態(tài)大模型、計算機(jī)視覺(CV)大模型推理等領(lǐng)域處理復(fù)雜音視頻制作任務(wù)提供強(qiáng)大的基礎(chǔ)設(shè)施支撐。

2

高效渲染,極致視效

兆瀚CTS5301-L AI服務(wù)器具備卓越的AI計算能力以及靈活的配置選項,無論是文本生成圖像,數(shù)據(jù)傳輸還是復(fù)雜的圖形渲染、視頻解碼等需求,兆瀚CTS5301-L AI服務(wù)器皆能提供多樣化算力支撐,大幅縮短渲染時間、降低渲染成本,打造極致的視覺體驗。此外兆瀚CTS5301-L AI服務(wù)器的整機(jī)功耗降低了30%,整機(jī)TCO提升了20%,大幅降低 AI 算力使用成本。

3

AIGC,創(chuàng)意無界

除了高質(zhì)量渲染與超強(qiáng)算力支撐,提升內(nèi)容制作的效率,兆瀚CTS5301-L AI服務(wù)器還支持多種行業(yè)主流的高性能加速卡,能夠適配多種AI模型和框架,包括但不限于盤古、GLM、GPT-3、STABLE Diffusion等,廣泛的兼容性能夠滿足不同的內(nèi)容生成類場景對更強(qiáng)大計算資源的需求。

2959e406-9589-11ef-8084-92fbcf53809c.png296adb94-9589-11ef-8084-92fbcf53809c.png

2977a4b4-9589-11ef-8084-92fbcf53809c.png

AI技術(shù)的進(jìn)步不斷拓展創(chuàng)意的疆界,無論是創(chuàng)造高品質(zhì)的視覺作品,還是實現(xiàn)精確的語音合成,兆瀚CTS5301-L AI服務(wù)器都是音視頻行業(yè)創(chuàng)意道路上的「硬」核后盾。

未來,拓維信息將攜旗下“兆瀚”持續(xù)為醫(yī)療、金融、教育、娛樂等諸多領(lǐng)域的音視頻解決方案提供智能算力底座,助力各行業(yè)在數(shù)字化轉(zhuǎn)型的道路上實現(xiàn)更高效、更智能的音視頻內(nèi)容創(chuàng)作與傳播,攜手邁向一個創(chuàng)意無限、精彩紛呈的數(shù)字新紀(jì)元。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音視頻
    +關(guān)注

    關(guān)注

    4

    文章

    471

    瀏覽量

    29872
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    964

    瀏覽量

    14793
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    361

    瀏覽量

    1539
收藏 人收藏

    評論

    相關(guān)推薦

    AMS-HE200:HDMI音視頻網(wǎng)絡(luò)延長器,開啟傳輸新時代

    在數(shù)字化時代,高清音視頻傳輸已經(jīng)成為各行各業(yè)不可或缺的重要技術(shù)。無論是安防監(jiān)控、視頻會議,還是戶外廣告、家庭影院,高清音視頻信號的無縫傳輸都扮演著至關(guān)重要的角色。深圳市程達(dá)科技有限公司
    的頭像 發(fā)表于 11-27 10:04 ?127次閱讀
    AMS-HE200:HDMI<b class='flag-5'>音視頻</b>網(wǎng)絡(luò)延長器,開啟傳輸新<b class='flag-5'>時代</b>

    盤點那些常見音視頻接口

    我們熟知的一些常見音視頻接口,發(fā)展至今在日常使用中已經(jīng)漸漸少了。但是在工業(yè)領(lǐng)域的音視頻連接,依然能看到其身影。這些看似消失的接口,它們現(xiàn)在發(fā)展成什么樣子了?本期我們將做一個大盤點。
    的頭像 發(fā)表于 09-09 14:34 ?524次閱讀

    常見音視頻接口的靜電浪涌防護(hù)和濾波方案

    音視頻接口在現(xiàn)代多媒體設(shè)備中扮演著至關(guān)重要的角色,它們確保了音視頻信號在不同設(shè)備間的順暢傳輸,各種類型的音視頻接口滿足了多樣化的應(yīng)用場景需求。 在音視頻接口的設(shè)計領(lǐng)域,靜電浪涌防護(hù)與濾
    的頭像 發(fā)表于 06-25 11:28 ?653次閱讀

    BK7258博通Wi-Fi6音視頻soc芯片英文規(guī)格書

    BK7258是上海博通推出的高度集成的WiFi6+BLE combo音視頻芯片,該芯片集成音視頻外設(shè)及接口,三480M主頻,720P,H.264,低功耗?;?,內(nèi)置8M flash,16M psram,驅(qū)屏,回聲消除及降噪等,廣
    發(fā)表于 06-15 16:57 ?9次下載

    音視頻IP化浪潮全面來襲,分布式系統(tǒng)開創(chuàng)音視頻行業(yè)新時代!

    在傳統(tǒng)音視頻頻系統(tǒng)中,廠商們各自采用不同的通訊方式和控制協(xié)議,這使得不同的產(chǎn)品之間就像一座座的信息孤島,要連接起來就需要復(fù)雜的轉(zhuǎn)換設(shè)備和系統(tǒng)再開發(fā)。隨著音視頻項目的規(guī)模不斷擴(kuò)大,各類音頻設(shè)備產(chǎn)品
    的頭像 發(fā)表于 05-30 16:55 ?671次閱讀

    音視頻產(chǎn)品EMC整改案例解析

    音視頻產(chǎn)品EMCRE整改案例解析
    的頭像 發(fā)表于 05-20 16:49 ?413次閱讀
    <b class='flag-5'>音視頻</b>產(chǎn)品EMC整改案例解析

    高清HDMI轉(zhuǎn)USB 3.0音視頻多功能音采集卡-測評

    LCC380的設(shè)計理念在于全面考慮到各種用戶場景下的需求。為了實現(xiàn)高品質(zhì)的音視頻采集效果,卡體搭載了業(yè)界領(lǐng)先的音頻處理器解決方案。無論您是熱衷于游戲直播、視頻會議還是其他音視頻應(yīng)用,都能通過LCC380獲得出色的音頻輸入輸出體驗
    的頭像 發(fā)表于 05-14 17:45 ?865次閱讀
    高清HDMI轉(zhuǎn)USB 3.0<b class='flag-5'>音視頻</b>多功能音采集卡-測評

    【RTC程序設(shè)計:實時音視頻權(quán)威指南】音視頻的編解碼壓縮技術(shù)

    音視頻所載有的信息在通過傳輸?shù)臅r候就需要壓縮編碼。 其中,文本壓縮是指通過使用各種算法和技術(shù),將文本數(shù)據(jù)表示為更緊湊的形式,以減少存儲空間。 霍夫曼編碼是一種無損壓縮算法,它可以根據(jù)字符出現(xiàn)
    發(fā)表于 04-28 21:04

    音視頻SoC與AI技術(shù)融合,帶來更智能的音視頻處理解決方案

    ,如WiFi路由器和物聯(lián)網(wǎng)設(shè)備。在安防、智能音頻等領(lǐng)域,對SoC芯片的力要求相比智能手機(jī)、服務(wù)器等略低。 ? 人工智能技術(shù)與音視頻SoC 的融合??????????????????????????????????????? ? 隨著人工智能技術(shù)的快速發(fā)展,
    的頭像 發(fā)表于 04-26 01:20 ?4376次閱讀

    【RTC程序設(shè)計:實時音視頻權(quán)威指南】新書一瞥

    本人從事音視頻領(lǐng)域的開發(fā),經(jīng)常接觸實時音視頻處理相關(guān)的技術(shù),看到這本書非常有興趣閱讀,這本書全面介紹實時音視頻(RTC)技術(shù)的權(quán)威著作,該書詳細(xì)講解了RTC的基本概念、技術(shù)原理、系統(tǒng)設(shè)計以及實際
    發(fā)表于 04-22 09:09

    音視頻解碼生成:打造你的專屬高清影院體驗

    在數(shù)字化時代,人們對觀影體驗的要求越來越高。音視頻解碼生成技術(shù),作為現(xiàn)代多媒體播放的核心,正是為了滿足這種需求而不斷發(fā)展和完善的。通過這項技術(shù),我們可以輕松打造屬于自己的高清影院體驗。 一、高清畫質(zhì)
    的頭像 發(fā)表于 02-25 14:47 ?401次閱讀

    音視頻解碼生成:打造極致觀影體驗的關(guān)鍵技術(shù)

    在現(xiàn)代多媒體時代,音視頻解碼生成技術(shù)已成為提供極致觀影體驗的核心要素。它不僅能夠確保音視頻數(shù)據(jù)的高效傳輸,還能保證播放的流暢性和畫質(zhì)清晰度,為用戶帶來身臨其境的觀影享受。 1. 解碼生成的重要性
    的頭像 發(fā)表于 02-25 14:43 ?467次閱讀

    音視頻解碼器優(yōu)化技巧:提升播放體驗的關(guān)鍵步驟

    隨著數(shù)字多媒體內(nèi)容的爆炸式增長,音視頻解碼器在現(xiàn)代技術(shù)生活中扮演著至關(guān)重要的角色。從流暢的在線視頻流播放到高質(zhì)量的本地文件解碼,解碼器的性能直接影響了我們的觀看體驗。那么,如何優(yōu)化音視頻解碼器以提升
    的頭像 發(fā)表于 02-21 14:45 ?802次閱讀

    音視頻解碼生成在多媒體制作中的應(yīng)用

    音視頻解碼生成是多媒體制作中不可或缺的一部分,它扮演著將編碼的音視頻數(shù)據(jù)轉(zhuǎn)化為可播放、可編輯的內(nèi)容的關(guān)鍵角色。在多媒體制作的全過程中,音視頻解碼生成技術(shù)都有廣泛的應(yīng)用。 1. 視頻編輯
    的頭像 發(fā)表于 02-21 14:39 ?373次閱讀

    音視頻解碼生成與流媒體傳輸?shù)慕Y(jié)合

    音視頻解碼生成與流媒體傳輸是現(xiàn)代數(shù)字媒體技術(shù)中兩個不可或缺的部分,它們的結(jié)合為用戶提供了高質(zhì)量、實時性的多媒體體驗。 1. 解碼生成與流媒體傳輸?shù)年P(guān)系 解碼生成是流媒體傳輸?shù)那疤?。在流媒體服務(wù)中
    的頭像 發(fā)表于 02-21 14:36 ?392次閱讀
    RM新时代网站-首页