華為開發(fā)者大會 2023(Cloud)在東莞召開。華為發(fā)布盤古大模型 3.0,將圍繞行業(yè)重塑、技術(shù)扎根、開放同飛三大創(chuàng)新方向,為行業(yè)客戶、伙伴及開發(fā)者提供更好的服務(wù)。
世界AI大會系列:數(shù)據(jù)為核,邁向多模態(tài)AI大模型時代
(一)分層解耦:盤古大模型 3.0 是一個面向行業(yè)的大模型系列,包括“5+N+X”三層架構(gòu)。盤古大模型采用完全的分層解耦設(shè)計,可以快速適配、快速滿足行業(yè)的多變需求。
(二)全棧自主:盤古大模型實現(xiàn)了以鯤鵬和昇騰為基礎(chǔ)的 AI算力云平臺,以及異構(gòu)計算架構(gòu) CANN、全場景 AI 框架昇思 MindSpore、AI 開發(fā)生產(chǎn)線 ModelArts 的全棧自主創(chuàng)新,盤古大模型訓(xùn)練效率達(dá)到業(yè)界主流 GPU的 1.1 倍。
(三)國際領(lǐng)先:根據(jù)華為云官網(wǎng),國際頂級學(xué)術(shù)期刊《自然》(Nature)雜志正刊發(fā)表了華為云盤古大模型研發(fā)團(tuán)隊研究成果——《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報》。
(一)分層解耦
未來盤古大模型能成為每個行業(yè)、企業(yè)和個人都有自己的專家助手,讓工作更輕松。盤古大模型 3.0 是一個面向行業(yè)的大模型系列,包括“5+N+X”三層架構(gòu):
?L0 層包括自然語言、視覺、多模態(tài)、預(yù)測、科學(xué)計算五個基礎(chǔ)大模型,提供滿足行業(yè)場景中的多種技能需求。盤古 3.0 為客戶提供 100 億參數(shù)、380 億參數(shù)、710 參數(shù)和 1000 億參數(shù)的系列化基礎(chǔ)大模型,匹配客戶不同場景、不同時延、不同響應(yīng)速度的行業(yè)多樣化需求。同時提供全新能力集,包括 NLP 大模型的知識問答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶和伙伴企業(yè)直接調(diào)用。無論多大參數(shù)規(guī)模的大模型,盤古提供一致的能力集。
?L1 層是 N 個行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù)、金融、制造、礦山、氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的 L0 和 L1 層上,為客戶訓(xùn)練自己的專有大模型。
?L2 層為客戶提供了更多細(xì)化場景的模型,更加專注于政務(wù)熱線、網(wǎng)點助手、先導(dǎo)藥物篩選、傳送帶異物檢測、臺風(fēng)路徑預(yù)測等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場景,為客戶提供“開箱即用”的模型服務(wù)。
盤古大模型采用完全的分層解耦設(shè)計,可以快速適配、快速滿足行業(yè)的多變需求??蛻艏瓤梢詾樽约旱拇竽P图虞d獨(dú)立的數(shù)據(jù)集,也可以單獨(dú)升級基礎(chǔ)模型,也可以單獨(dú)升級能力集。在 L0 和 L1 大模型的基礎(chǔ)上,華為云還為客戶提供了大模型行業(yè)開發(fā)套件,通過對客戶自有數(shù)據(jù)的二次訓(xùn)練,客戶就可以擁有自己的專屬行業(yè)大模型。
(二)全棧自主
大模型的創(chuàng)新不僅僅是模型自身的創(chuàng)新,而是需要全棧的創(chuàng)新,對算力,算子,計算框架及平臺進(jìn)行全面優(yōu)化。根據(jù)中國經(jīng)濟(jì)網(wǎng)報道,通過持續(xù)研發(fā),目前盤古大模型在性能、深度、架構(gòu)及數(shù)據(jù)增強(qiáng)方面均進(jìn)行了升級。盤古大模型實現(xiàn)了以鯤鵬和昇騰為基礎(chǔ)的 AI 算力云平臺,以及異構(gòu)計算架構(gòu) CANN、全場景 AI 框架昇思MindSpore、AI 開發(fā)生產(chǎn)線 ModelArts 的全棧自主創(chuàng)新,實現(xiàn)極致效能,打造世界 AI另一極。
此外,端到端的技術(shù)優(yōu)化為大模型開發(fā)和運(yùn)行提供分布式并行加速,算子和編譯優(yōu)化、集群級通信優(yōu)化等關(guān)鍵能力,使盤古大模型訓(xùn)練效率達(dá)到業(yè)界主流 GPU 的 1.1倍。
同時,昇騰 AI 云服務(wù)除了支持華為全場景 AI 框架昇思 MindSpore 外,還支持Pytorch、Tensorflow 等主流 AI 框架。這些框架中 90%的算子,都可以通過華為端到端的遷移工具平滑遷移到昇騰平臺。
盤古大模型要幫助每個企業(yè)、每個人都擁有自己的專家助手。華為云提供易用可靠的大模型工具套件、匯聚海量多行業(yè)場景 API 的開天 aPaaS,以及包含豐富優(yōu)質(zhì)課程和技術(shù)認(rèn)證的大模型專屬社區(qū),將與開發(fā)者及伙伴一起,共同探索盤古大模型與行業(yè)結(jié)合的創(chuàng)新路徑。
(三)國際領(lǐng)先
根據(jù)華為云官網(wǎng),近日國際頂級學(xué)術(shù)期刊《自然》(Nature)雜志正刊發(fā)表了華為云盤古大模型研發(fā)團(tuán)隊研究成果——《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報》。根據(jù)華為云官網(wǎng),這是近年來中國科技公司首篇作為唯一署名單位發(fā)表的《自然》正刊論文?!蹲匀弧穼徃迦藢υ摮晒o予高度評價:“華為云盤古氣象大模型讓人們重新審視氣象預(yù)報模型的未來,模型的開放將推動該領(lǐng)域的發(fā)展?!?/p>
華為云盤古氣象大模型是首個精度超過傳統(tǒng)數(shù)值預(yù)報方法的 AI 模型,速度相比傳統(tǒng)數(shù)值預(yù)報提速 10000 倍以上。目前,盤古氣象大模型能夠提供全球氣象秒級預(yù)報,其氣象預(yù)測結(jié)果包括位勢、濕度、風(fēng)速、溫度、海平面氣壓等,可以直接應(yīng)用于多個氣象研究細(xì)分場景,歐洲中期預(yù)報中心和中央氣象臺等都在實測中發(fā)現(xiàn)盤古預(yù)測的優(yōu)越性。
-
華為
+關(guān)注
關(guān)注
216文章
34411瀏覽量
251496 -
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268886 -
nlp
+關(guān)注
關(guān)注
1文章
488瀏覽量
22033 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2640 -
盤古大模型
+關(guān)注
關(guān)注
1文章
109瀏覽量
251
原文標(biāo)題:華為盤古大模型3.0,重塑千行百業(yè)
文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論