RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

多模態(tài):智能座艙的新突破口

要長高 ? 2024-10-12 15:24 ? 次閱讀

智能汽車產(chǎn)業(yè)蓬勃發(fā)展的當(dāng)下,智能座艙作為車輛的重要組成部分,正經(jīng)歷著前所未有的變革。清華大學(xué)智能綠色車輛與交通全國重點實驗室的曹東璞教授在全球智能汽車產(chǎn)業(yè)大會(GIV 2024)上指出,國內(nèi)智能座艙的發(fā)展速度驚人,已經(jīng)從過去的落后狀態(tài)轉(zhuǎn)變?yōu)轭I(lǐng)先國際。這一轉(zhuǎn)變的背后,AI大模型起到了關(guān)鍵的推動作用。

然而,隨著智能座艙市場的快速發(fā)展,頭部座艙企業(yè)已經(jīng)遇到了瓶頸。為了突破這一困境,多模態(tài)成為了智能座艙發(fā)展的新熱點。多模態(tài)是指通過不同的信息來源或形式(如文本、語音、圖像、視頻等)來傳遞和接收信息。相較于單一模態(tài),多模態(tài)能夠更全面、完整地反映真實世界的復(fù)雜性和多樣性,同時實現(xiàn)不同模態(tài)之間的交互和融合。

隨著技術(shù)的持續(xù)迭代和發(fā)展,AI大模型正在從單一模態(tài)向多模態(tài)演進(jìn)。咨詢公司Gartner預(yù)測,建立在多模態(tài)大模型上的生成式AI應(yīng)用將在未來幾年內(nèi)實現(xiàn)快速增長。智能汽車作為原生多模態(tài)大模型的絕佳落地場景,正引領(lǐng)著這一變革。

商湯絕影和GPT-4V等多模態(tài)大模型的發(fā)布,標(biāo)志著AI公司開始在技術(shù)框架層將語言模型、視覺模型、聲音模型等進(jìn)行融合。這些模型通過跨模態(tài)數(shù)據(jù)的訓(xùn)練,實現(xiàn)了多模態(tài)的對齊和連接,從而能夠在更廣泛的場景中應(yīng)用。

商湯絕影將多模態(tài)大模型業(yè)務(wù)分為模型層、引擎層和業(yè)務(wù)層三層。模型層包括車端側(cè)和云端的模型,用于進(jìn)行多模態(tài)大模型的推理。引擎層則包括座艙大腦和全時駕駛輔助兩個產(chǎn)品,分別用于感知座艙內(nèi)的情況和車外場景。業(yè)務(wù)層則包括語音助手、ADAS系統(tǒng)、手機運用以及娛樂功能等,與下面的模型層和引擎層進(jìn)行融合。

然而,多模態(tài)大模型在智能座艙中的應(yīng)用也面臨著諸多挑戰(zhàn)。首先,車端應(yīng)用大模型需要強大的算力支持,而如何更優(yōu)、更好地使用算力是一個亟待解決的問題。其次,集中化跨模態(tài)的全鏈路數(shù)據(jù)打通和服務(wù)接口的標(biāo)準(zhǔn)化等方面也需要進(jìn)一步努力。此外,多模態(tài)大模型在實際應(yīng)用中的取舍也是一個重要問題。一些新功能雖然看似炫酷,但可能并不符合用戶的實際需求,導(dǎo)致資源浪費。

因此,智能座艙的發(fā)展需要回歸原點,改變車內(nèi)場景的交互效率。百度智艙業(yè)務(wù)部總經(jīng)理李濤指出,如果一個功能頻繁被用戶使用,可能說明整體車輛設(shè)計的智能化程度較低,無法理解用戶當(dāng)前所需。因此,智能座艙的發(fā)展應(yīng)該更加注重用戶體驗和實際需求,通過多模態(tài)大模型等技術(shù)手段提高交互效率,為用戶帶來更加便捷、智能的出行體驗。

綜上所述,多模態(tài)作為智能座艙的新突破口,正引領(lǐng)著智能汽車產(chǎn)業(yè)的發(fā)展。然而,要實現(xiàn)多模態(tài)大模型在智能座艙中的廣泛應(yīng)用,還需要克服諸多技術(shù)和市場挑戰(zhàn)。未來,隨著技術(shù)的不斷進(jìn)步和市場的日益成熟,智能座艙將迎來更加廣闊的發(fā)展前景。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268886
  • 智能汽車
    +關(guān)注

    關(guān)注

    30

    文章

    2843

    瀏覽量

    107245
  • 智能座艙
    +關(guān)注

    關(guān)注

    4

    文章

    948

    瀏覽量

    16333
收藏 人收藏

    評論

    相關(guān)推薦

    商湯日日新模態(tài)大模型權(quán)威評測第一

    剛剛,商湯科技日日新SenseNova模態(tài)大模型,在權(quán)威綜合評測權(quán)威平臺OpenCompass的模態(tài)評測中取得榜單第一。
    的頭像 發(fā)表于 12-20 10:39 ?129次閱讀

    電動汽車有序充電突破口

    引言 今年,電動汽車行業(yè)抓住了疫情影響洼地,迅速找到了發(fā)展突破口,從電動汽車發(fā)行政策到鋰電池開發(fā)技術(shù)均出臺了多層面利好消息,未來一段時間內(nèi)會出現(xiàn)電動汽車乘用車數(shù)量井噴現(xiàn)象,如何滿足如此批量的電動汽車
    的頭像 發(fā)表于 10-31 09:44 ?217次閱讀
    電動汽車有序充電<b class='flag-5'>突破口</b>

    利用OpenVINO部署Qwen2模態(tài)模型

    模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)(如文本、圖像、音頻和視頻等)進(jìn)行融合,通過學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián),實現(xiàn)更加智能化的信息處理。簡單來說,
    的頭像 發(fā)表于 10-18 09:39 ?412次閱讀

    Meta發(fā)布模態(tài)LLAMA 3.2人工智能模型

    Meta Platforms近日宣布了一項重要技術(shù)突破,成功推出了模態(tài)LLAMA 3.2人工智能模型。這一創(chuàng)新模型不僅能夠深度解析文本信息,還實現(xiàn)了對圖像內(nèi)容的精準(zhǔn)理解,標(biāo)志著Met
    的頭像 發(fā)表于 09-27 11:44 ?398次閱讀

    云知聲推出山海模態(tài)大模型

    在人工智能技術(shù)的浩瀚星海中,模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創(chuàng)新之姿,推出了其匠心獨運的山海
    的頭像 發(fā)表于 08-27 15:20 ?386次閱讀

    慕尼黑電子展回顧:啟明智顯模態(tài)硬件智能體引領(lǐng)科技潮流

    在剛剛落幕的慕尼黑電子展上,啟明云端攜啟明智顯與觸覺智能兩家子公司,共同為全球觀眾呈現(xiàn)了一場科技盛宴。本次展會,啟明智顯憑借其創(chuàng)新的模態(tài)硬件智能體及一系列前沿產(chǎn)品,贏得了廣泛關(guān)注與好
    的頭像 發(fā)表于 07-10 16:17 ?363次閱讀
    慕尼黑電子展回顧:啟明智顯<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>硬件<b class='flag-5'>智能</b>體引領(lǐng)科技潮流

    智譜AI發(fā)布全新模態(tài)開源模型GLM-4-9B

    近日,智譜AI在人工智能領(lǐng)域取得重大突破,成功推出全新開源模型GLM-4-9B。這款模型以其卓越的模態(tài)能力,再次刷新了業(yè)界對于大型語言模型的認(rèn)識。
    的頭像 發(fā)表于 06-07 09:17 ?725次閱讀

    “芯”馳神往,智能座艙里的“輕”科技

    隨著汽車從燃油時代邁向智能紀(jì)元,智能座艙亦在變革中煥發(fā)新生,朝著更智能、更大屏屏、更娛樂化的方向邁進(jìn),
    的頭像 發(fā)表于 06-06 08:24 ?778次閱讀
    “芯”馳神往,<b class='flag-5'>智能</b><b class='flag-5'>座艙</b>里的“輕”科技

    人大系初創(chuàng)公司智子引擎發(fā)布全新模態(tài)大模型Awaker 1.0

    人大系初創(chuàng)公司智子引擎近日震撼發(fā)布了新一代模態(tài)大模型Awaker 1.0,這一里程碑式的成果標(biāo)志著公司在通用人工智能(AGI)領(lǐng)域取得了重要突破。與前代ChatImg序列模型相比,A
    的頭像 發(fā)表于 05-06 09:59 ?597次閱讀

    蘋果發(fā)布300億參數(shù)MM1模態(tài)大模型

    近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的模態(tài)大模型研究成果——MM1。這款具有高達(dá)300億參數(shù)的模態(tài)模型系列,由密集模型和混合專家(MoE)變體組
    的頭像 發(fā)表于 03-19 11:19 ?891次閱讀

    2024年全球與中國7nm智能座艙芯片行業(yè)總體規(guī)模、主要企業(yè)國內(nèi)外市場占有率及排名

    7nm智能座艙芯片市場報告主要研究: 7nm智能座艙芯片市場規(guī)模: 產(chǎn)能、產(chǎn)量、銷售、產(chǎn)值、價格、成本、利潤等 7nm智能
    發(fā)表于 03-16 14:52

    智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)的區(qū)域布局動因與趨勢分析

    我國汽車產(chǎn)銷總量已連續(xù)14年居全球第一,推動量變轉(zhuǎn)向質(zhì)變成為要務(wù),智能網(wǎng)聯(lián)汽車正是突破口之一。
    的頭像 發(fā)表于 02-20 11:35 ?709次閱讀

    什么是模態(tài)模態(tài)的難題是什么?

    模態(tài)大模型,通常大于100M~1B參數(shù)。具有較強的通用性,比如對圖片中任意物體進(jìn)行分割,或者生成任意內(nèi)容的圖片或聲音。極大降低了場景的定制成本。
    的頭像 發(fā)表于 01-17 10:03 ?4588次閱讀
    什么是<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>?<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>的難題是什么?

    智能座艙測試包含哪些 智能座艙包含哪些功能

    智能座艙測試的意義在于確保智能座艙在功能、性能、安全等方面達(dá)到一定的標(biāo)準(zhǔn),以滿足用戶需求和保證用戶體驗。
    發(fā)表于 01-09 17:22 ?1790次閱讀

    語音識別技術(shù)最新進(jìn)展:視聽融合的模態(tài)交互成為主要演進(jìn)方向

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)所謂“模態(tài)”,英文是modality,用通俗的話說,就是“感官”,模態(tài)即將多種感官融合。模態(tài)交互技術(shù)是近年
    的頭像 發(fā)表于 12-28 09:06 ?3837次閱讀
    語音識別技術(shù)最新進(jìn)展:視聽融合的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>交互成為主要演進(jìn)方向
    RM新时代网站-首页