征程6介紹
與以往征程系列前幾代產(chǎn)品不同的是,征程6(我們業(yè)內(nèi)稱(chēng)為J6,“鉤6”)并不是一款芯片,而是根據(jù)算力大小,分成了J6B/J6L/J6E/J6M/J6H/J6P 6款!
1 J6P芯片參數(shù)
- CPU:18核心的ARM Cortex-A78AE,算力是410K DMIPS
- BPU:如上文介紹,采用了納什架構(gòu)第四代BPU,560TOPS算力(注意上圖左下角的一行小字:560TOPS算力是等效1/2稀疏網(wǎng)絡(luò)下的算力,必須嚴(yán)謹(jǐn)?。?/li>
- 算法支持:對(duì)Transformer算法的支持效率在業(yè)內(nèi)領(lǐng)先,同時(shí)支持大規(guī)模交互式博弈等前沿算法,表明其在處理復(fù)雜AI任務(wù)上的優(yōu)越性能。
- 功能安全:通過(guò)ISO 26262 ASIL-D功能安全流程認(rèn)證,主動(dòng)安全AEB ASIL-B產(chǎn)品級(jí)功能安全認(rèn)證。
2 四芯合一的芯片架構(gòu)
J6芯片所實(shí)現(xiàn)的“四芯合一”是指將以下四種關(guān)鍵處理單元集成在同一顆系統(tǒng)級(jí)芯片SoC上:
- CPU(Central Processing Unit):負(fù)責(zé)通用計(jì)算任務(wù),處理非特定的計(jì)算工作負(fù)載,是芯片的控制中心,執(zhí)行操作系統(tǒng)的指令和應(yīng)用程序的邏輯控制。
- BPU(Brain Processing Unit):地平線自主研發(fā)的神經(jīng)網(wǎng)絡(luò)處理單元,專(zhuān)門(mén)針對(duì)人工智能算法和深度學(xué)習(xí)任務(wù)進(jìn)行了優(yōu)化,如圖像識(shí)別、自然語(yǔ)言處理等,是實(shí)現(xiàn)智能駕駛核心算法的關(guān)鍵。
- GPU(Graphics Processing Unit):圖形處理器,除了傳統(tǒng)意義上的圖形渲染,現(xiàn)代GPU也廣泛用于并行計(jì)算,特別是在機(jī)器視覺(jué)、環(huán)境感知等需要大量并行處理的場(chǎng)景中。
- MCU(Microcontroller Unit):微控制器單元,常用于實(shí)現(xiàn)嵌入式控制功能,具有功能全、體積小、集成度高等特點(diǎn)。在J6中,MCU被集成用以處理功能安全相關(guān)的任務(wù),確保系統(tǒng)的可靠性。
這種高集成度的設(shè)計(jì)不僅提升了系統(tǒng)性能,還顯著提高了性?xún)r(jià)比,降低了部署難度,使得單顆征程6芯片就能夠支持包括感知、規(guī)劃決策、控制、座艙感知等在內(nèi)的全棧計(jì)算任務(wù),適用于多種智能駕駛應(yīng)用場(chǎng)景。
這種多合一實(shí)際上就是SIP(System in Package),SIP技術(shù)是一種先進(jìn)的半導(dǎo)體封裝技術(shù),它允許將多種功能芯片、元器件(如處理器、存儲(chǔ)器、傳感器、RF組件等)以及被動(dòng)元件(如電阻、電容)集成在一個(gè)封裝內(nèi)部,形成一個(gè)具有完整或部分系統(tǒng)功能的封裝模塊。與傳統(tǒng)的單一封裝只包含一個(gè)主要芯片(如SoC)不同,SIP技術(shù)通過(guò)并排排列、堆疊或采用3D封裝等方法,將多個(gè)獨(dú)立的芯片和組件緊密集成,從而實(shí)現(xiàn)了更高的集成度和更小的封裝尺寸。
征程6系列不是人們之前猜測(cè)的3款芯片,而是6款,足以覆蓋智能駕駛的各個(gè)場(chǎng)景和價(jià)位。發(fā)布會(huì)上重點(diǎn)介紹了征程6B、6E、6M和6P,筆者認(rèn)為B應(yīng)該是Base,L是Light,E是Efficiency,M是Medium,H是High,P是Performance或Premium。地平線沒(méi)有公開(kāi)征程6L和6H的參數(shù),預(yù)估6H的AI算力是256-300 TOPS,CPU算力是250-300K DMIPS。6L的AI算力是30-40TOPS,CPU算力是40-50K DMIPS。
征程6系列與5系列相比,升級(jí)最明顯的是CPU算力。征程5的CPU是8核心Cortex-A55,算力大致是25-30K DMIPS,這次除了最低的征程6B,其余CPU算力都大幅度提高。
征程6系列的另一個(gè)升級(jí)是BPU架構(gòu),所謂BPU就是地平線對(duì)AI加速器的另一種稱(chēng)呼,B代表Brain,可以稱(chēng)為類(lèi)腦處理器,第一代BPU,地平線致敬數(shù)學(xué)家伯努利,伯努利分布是最簡(jiǎn)單的離散型概率分布模型。第二代BPU,地平線致敬英國(guó)數(shù)學(xué)家貝葉斯,他推導(dǎo)出貝葉斯定理,貝葉斯定理是一個(gè)由結(jié)果倒推原因的概率算法,當(dāng)年默默無(wú)聞,在人工智能的今天大放異彩。
征程6的第三代BPU架構(gòu)則致敬博弈論創(chuàng)始人納什,稱(chēng)之為納什架構(gòu)。約翰·納什,生于1928年6月13日,著名經(jīng)濟(jì)學(xué)家、博弈論創(chuàng)始人、《美麗心靈》男主角原型,并且還是前麻省理工學(xué)院助教,后任普林斯頓大學(xué)數(shù)學(xué)系教授,主要研究博弈論、微分幾何學(xué)和偏微分方程。由于他與另外兩位數(shù)學(xué)家(經(jīng)濟(jì)學(xué)家,約翰·C·海薩尼和萊因哈德·澤爾騰)在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響,而獲得1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。
博弈論主要針對(duì)智能車(chē)與智能車(chē),智能車(chē)與非智能車(chē)之間決策交互產(chǎn)生的影響,目前大部分智能駕駛都是基于單車(chē)的,未考慮其他車(chē)輛對(duì)智能車(chē)決策的影響,這使得智能車(chē)有時(shí)候看起來(lái)不十分靈活,比如對(duì)向車(chē)主動(dòng)讓道讓智能車(chē)先走,但智能車(chē)無(wú)法理解對(duì)向車(chē)的意圖,還是傻傻地等對(duì)向車(chē)先走。也就是智能駕駛的策略,大多都有強(qiáng)化學(xué)習(xí)的影子,強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)旨在通過(guò)與環(huán)境(可以是虛擬的也可以是真實(shí)的)的交互來(lái)使智能體(我們的「模型」)學(xué)習(xí)。RL 一開(kāi)始是根據(jù) Markov 過(guò)程提出的,我們讓智能體處于不確定的固定環(huán)境中,并試圖通過(guò)獎(jiǎng)勵(lì)/懲罰機(jī)制來(lái)學(xué)習(xí)到一個(gè)最優(yōu)策略。在單智能體的情況下,這種方法被證明是收斂的。但是,如果是將多個(gè)智能體放置在同一環(huán)境中(多智能體強(qiáng)化學(xué)習(xí),MARL),情況就復(fù)雜多了。
假設(shè)我們正在試著用智能車(chē)來(lái)改善城市的交通情況,這時(shí)每輛車(chē)的決策都會(huì)影響其他車(chē)的決策與表現(xiàn),比如智能車(chē)與智能車(chē)之間很可能會(huì)發(fā)生沖突,因?yàn)榭赡軐?duì)于兩輛智能車(chē)而言,沿著某條路線行駛都是最方便的(獲得最多的獎(jiǎng)勵(lì))。博弈論有個(gè)RL算法,它使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行函數(shù)逼近,迭代計(jì)算子游戲的收益矩陣(Gt)。這個(gè)子游戲就是上文提到的 stage games。在每個(gè)時(shí)間 t 處(每個(gè) stage game),都會(huì)計(jì)算出符合 NE 的回應(yīng)(σ),并得到最優(yōu)策略(π),然后添加新的策略來(lái)擴(kuò)展 Gt 為 Gt + 1,繼續(xù)重復(fù)上述過(guò)程。這是最高明的智能駕駛決策算法。
征程6全系列的AI加速都是納什架構(gòu)
征程6B主打極致性?xún)r(jià)比,CPU可能是6核心的Cortex-A55,制造工藝可能是14或28納米,征程6B的國(guó)際意向客戶(hù)是博世和電裝,國(guó)內(nèi)意向客戶(hù)是四維圖新、福瑞泰克和Minieye。主要對(duì)手可能是Mobileye的EyeQ5M/H和EyeQ6L。
征程6系列主打產(chǎn)品是E/M。
征程6系列將于2024年內(nèi)開(kāi)啟首個(gè)前裝量產(chǎn)車(chē)型交付,并預(yù)計(jì)于2025年實(shí)現(xiàn)超10款車(chē)型量產(chǎn)交付。面向中階智駕市場(chǎng),地平線推出普惠城區(qū)性?xún)r(jià)比方案最優(yōu)解——征程6M,以及極致體驗(yàn)高速NOA最優(yōu)解——征程6E,并提供符合AEC-Q104車(chē)規(guī)標(biāo)準(zhǔn)的SiP模組和Matrix 6域控參考設(shè)計(jì),以超高集成度實(shí)現(xiàn)更低的功耗和更優(yōu)的系統(tǒng)成本。發(fā)布會(huì)上,地平線官宣與多家Tier1、軟硬件合作伙伴達(dá)成征程6E/M的合作,并公布到2024年第二季度將有超過(guò)50家生態(tài)伙伴推出基于征程6E/M的準(zhǔn)量產(chǎn)級(jí)產(chǎn)品。
大家最關(guān)注的還是征程6系列的旗艦征程6P。
征程6P的AI算力是560TOPS,地平線謹(jǐn)慎地做了標(biāo)注,560TOPS是在1/2稀疏網(wǎng)絡(luò)下的等效算力,地平線未提及精度,應(yīng)該還是INT8位。這個(gè)算力實(shí)際遠(yuǎn)超4片Orin合并的算力,再?gòu)?qiáng)調(diào)一次,以目前車(chē)載領(lǐng)域用的最頂級(jí)車(chē)載以太網(wǎng)交換機(jī)帶寬不超過(guò)1.25GB/s,典型的PCIe 4.0交換機(jī),帶寬不超過(guò)32GB/s,即便是價(jià)格遠(yuǎn)超Orin 的PCIe 6.0交換機(jī),帶寬也不超過(guò)120GB/s。想要像服務(wù)器行業(yè)那樣是用4個(gè)H100就讓算力增加4倍,帶寬至少要做到900GB/s,而這根本做不到,用最頂級(jí)的車(chē)載以太網(wǎng)交換機(jī)連接4個(gè)Orin,算力頂多是1.2倍單個(gè)Orin算力,也就是300TOPS。這也是英偉達(dá)要花十幾億美元開(kāi)發(fā)NVLINK的原因,也是NVLINK被美國(guó)管制嚴(yán)禁出口的原因。
CPU是18核心的ARM Cortex-A78AE,算力是410K DMIPS,英偉達(dá)Orin-X是12核心,內(nèi)核也是ARM Cortex-A78AE,算力是227K DMIPS,因?yàn)镺rin的GPU發(fā)熱量比較大,所以其CPU的頻率較低,而地平線的GPU算力只有200GFLOPS,發(fā)熱量很低,所以CPU頻率可以高點(diǎn),算力幾乎是英偉達(dá)的兩倍,華為的昇騰610的CPU則是16核心,算力是200K DMIPS
征程6P里面添加了一個(gè)微型GPU,算力很低,只有200GFLOPS,主要是為了將智能駕駛領(lǐng)域的圖像輸出到儀表或中控屏上。
為了降低成本,更好管理供應(yīng)鏈,也為了減少軟件復(fù)雜度, 征程6P內(nèi)部添加了一個(gè)達(dá)到ASIL-D級(jí)的MCU島,算力是10K DMIPS ,目前 大家都是使用單獨(dú)的安全MCU來(lái)控制車(chē)輛底盤(pán),通常是英飛凌的TC397,TC397價(jià)格比較高,且價(jià)格波動(dòng)大,供應(yīng)狀況不穩(wěn)定,最高算力是4K DMIPS,典型算力是2.7K DMIPS 。地平線沒(méi)有公布詳細(xì)信息,應(yīng)該是 和高通SA8650/SA8255/SA8775那樣的4核心ARM Cortex-R52內(nèi)核,運(yùn)行頻率估計(jì)是800-1000MHz 。
存儲(chǔ)帶寬方面,升級(jí)到了LPDDR5,帶寬達(dá)205GB/s,與英偉達(dá)Orin相同。前視感知支持1800萬(wàn)像素,圖像帶寬5.3Gpixel/s。
- 內(nèi)部采用TB/s級(jí)高性能總線,訪存延時(shí)低至130納秒。
- 為應(yīng)對(duì)新一代大模型Transformer較多的矢量運(yùn)算,特別添加了VPU,即矢量浮點(diǎn)運(yùn)算加速單元。
- 地平線征程P6的晶體管數(shù)量高達(dá)370億,英偉達(dá)Orin只有170億,Xavier只有90億。
與征程6系列一同發(fā)布的還有 全場(chǎng)景智能駕駛解決方案SuperDrive ,它聚焦擬人化體驗(yàn)突破,打造好用的智駕系統(tǒng)2.0。憑借動(dòng)態(tài)、靜態(tài)、OCC(Occupancy占用網(wǎng)絡(luò))三網(wǎng)合一的端到端感知架構(gòu),數(shù)據(jù)驅(qū)動(dòng)的交互式博弈算法,SuperDrive在任何道路環(huán)境下都能兼顧場(chǎng)景通過(guò)率、通行效率和行為擬人,在擁堵匯流、路口交互-動(dòng)態(tài)Driveline、禮讓騎行人、擁堵?lián)Q道、城市環(huán)島通行等城區(qū)復(fù)雜場(chǎng)景下,均能夠?yàn)橛脩?hù)帶來(lái)優(yōu)雅不慫、從容篤定的智能駕駛體驗(yàn)。
SuperDrive復(fù)雜場(chǎng)景體驗(yàn)突破
動(dòng)態(tài)、靜態(tài)、Occupancy三網(wǎng)合一的感知端到端架構(gòu)是精準(zhǔn)還原客觀物理世界的有效手段。在此架構(gòu)下遮擋準(zhǔn)召率提升70%,動(dòng)態(tài)代碼行數(shù)降低90%,網(wǎng)絡(luò)負(fù)載降低50%,有效解決當(dāng)前行業(yè)感知架構(gòu)時(shí)延高、規(guī)則多、負(fù)載重的問(wèn)題。數(shù)據(jù)驅(qū)動(dòng)的交互博弈可帶來(lái)更擬人的最優(yōu)解,使得SuperDrive像老司機(jī)一樣靈活處理復(fù)雜交通流,在擁堵場(chǎng)景下變道成功率提升50%,路口通過(guò)率提升67%。
審核編輯 黃宇
-
芯片
+關(guān)注
關(guān)注
455文章
50714瀏覽量
423116
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論