電子發(fā)燒友原創(chuàng) 章鷹
7月7日,華為開發(fā)者大會在東莞松山湖正式揭開帷幕,華為常務(wù)董事、華為云CEO張平安在下午舉行的主題會議上,正式重磅發(fā)布盤古大模型3.0。張平安表示:“盤古大模型不會做詩只會做事。它要幫助各行各業(yè),在各個(gè)領(lǐng)域讓AI賦予價(jià)值,在礦山、金融、政務(wù)、氣象,我們有很多的工作小組派下去,為各個(gè)行業(yè)賦予價(jià)值。我們堅(jiān)持的方向,AIforindustry。”
?
圖:華為常務(wù)董事、華為云CEO張平安
2023年,中國的AI團(tuán)隊(duì)開始密集發(fā)布各種大模型,從3月開啟到7月就有七款大模型發(fā)布,清華智譜AI研發(fā)的GLM-1308在3月14日開啟內(nèi)測; 百度于3月 16 日推出了其最新的生成式人工智能產(chǎn)品和知識增強(qiáng)型大語言模型文心一言;4月10日商湯公布“日日新Sensenova”;阿里4月11日推出大語言模型“通義千問”;科大訊飛在5月6日推出星火認(rèn)知大模型V1.0版本;時(shí)隔一個(gè)月,6月9日又推出星火大模型V1.5版;到7月6日,2023世界人工智能大會在上海開幕,中國電信發(fā)布大語言模型Telechat。在這屆大會的“邁向通用人工智能”主題展區(qū),集中展示了國內(nèi)外的30多款大模型。可以說大模型卷起來了。
?
圖:電子發(fā)燒友根據(jù)公開資料整理
華為云推出的盤古大模型3.0的架構(gòu)有何精妙之處?在從通用人工智能邁向行業(yè)人工智能,走深向?qū)嵉牡缆飞希A為云的盤古云大模型3.0有哪些接地氣的行業(yè)應(yīng)用?在氣象預(yù)報(bào)領(lǐng)域,盤古云大模型研發(fā)團(tuán)隊(duì)的研發(fā)成果為何能登上國際一流期刊《自然》(Nature)雜志?發(fā)布會的現(xiàn)場揭示了許多核心疑問。
聚焦行業(yè)應(yīng)用,盤古大模型推出“5+N+X”三層架構(gòu)
“今年上半年,國內(nèi)廠商發(fā)布了80多個(gè)AI大模型,我們注意到這些大模型發(fā)布后都具有非常好的對話能力,文案生成能力,很多大模型都會做詩,有的大模型甚至都會作畫。華為盤古大模型不會寫詩,只會做事,盤古大模型需要扎根行業(yè),為各個(gè)行業(yè)帶來價(jià)值?!比A為云CEO張平安強(qiáng)調(diào)說。
“我們發(fā)現(xiàn)當(dāng)前通用的大模型落地行業(yè)應(yīng)用存在三大挑戰(zhàn):1、大模型通用性強(qiáng),但專業(yè)性弱,落地行業(yè)需要專業(yè)知識,了解行業(yè)的工作流程,給出專業(yè)回答;2、大模型知識多,但是技能不足;3、數(shù)據(jù)是企業(yè)的核心資產(chǎn)之一,大模型可以有效的存儲和挖掘知識,在訓(xùn)練和使用大模型需要保證企業(yè)數(shù)據(jù)的安全合規(guī)?!?華為云人工智能領(lǐng)域首席科學(xué)家田奇表示。
為了應(yīng)對這些挑戰(zhàn),華為將盤古大模型3.0定位為面向行業(yè)的大模型系列,包括“5+N+X”三層架構(gòu)。
L0層的盤古基礎(chǔ)大模型,包括自然語言、視覺、多模態(tài)、預(yù)測、科學(xué)計(jì)算五個(gè)基礎(chǔ)大模型,提供滿足行業(yè)場景中的多種技能需求。盤古3.0為客戶提供100億參數(shù)、380億參數(shù)、710億參數(shù)和1000億參數(shù)的系列化基礎(chǔ)大模型,匹配客戶不同場景、不同時(shí)延、不同響應(yīng)速度的行業(yè)多樣化需求。同時(shí)提供全新能力集,包括NLP大模型的知識問答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶和伙伴企業(yè)直接調(diào)用。無論多大參數(shù)規(guī)模的大模型,盤古提供一致的能力集。
L1層是N個(gè)行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù),金融,制造,礦山,氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的L0和L1層上,為客戶訓(xùn)練自己的專有大模型。
L2層為客戶提供了更多細(xì)化場景的模型,更加專注于政務(wù)熱線、網(wǎng)點(diǎn)助手、先導(dǎo)藥物篩選、傳送帶異物檢測、臺風(fēng)路徑預(yù)測等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場景,為客戶提供“開箱即用”的模型服務(wù)。
在煤礦領(lǐng)域,企業(yè)用戶通過盤古視覺大模型,識別采掘過程中的大塊的煤和大塊的巖石。山東能源集團(tuán)及其技術(shù)公司云鼎科技,已經(jīng)和華為深度合作,開發(fā)了21個(gè)場景化的應(yīng)用,覆蓋了7大業(yè)務(wù)系統(tǒng)。盤古礦山大模型已經(jīng)在全國8個(gè)礦井規(guī)模使用,一個(gè)大模型可以覆蓋煤礦的采、掘、機(jī)、運(yùn)、通、洗選等業(yè)務(wù)流程下的1000多個(gè)細(xì)分場景,讓更多的煤礦工人能夠在地面上作業(yè),不僅能讓煤礦工人的工作環(huán)境更加舒適,而且可以極大地減少安全事故。
在鐵路領(lǐng)域,盤古鐵路大模型能精準(zhǔn)識別現(xiàn)網(wǎng)運(yùn)行的67種貨車、430多種故障,無故障圖片篩除率高達(dá)95%,成為貨運(yùn)列檢員身邊有力的數(shù)字助手,將列檢員從每日數(shù)百萬張的“圖?!睓z測中解放出來。檢測效率提升20倍。
“原來傳統(tǒng)方式預(yù)測10天臺風(fēng)的路徑,需要在3000臺服務(wù)器的高性能計(jì)算機(jī)集群上花費(fèi)5小時(shí)進(jìn)行仿真?,F(xiàn)在基于預(yù)訓(xùn)練的盤古氣象大模型,通過AI推理的方式,研究者只需單臺服務(wù)器上單卡配置,10秒內(nèi)就可以獲得更精確的預(yù)測結(jié)果?!睆埰桨脖硎?,“今年5月份,中國氣象局和盤古進(jìn)行了合作,預(yù)測瑪娃臺風(fēng)路徑,盤古提前10天精確預(yù)測瑪娃臺風(fēng)的路徑,盤古預(yù)測的速度和精度已明顯優(yōu)于傳統(tǒng)的方法。在剛剛結(jié)束的第19屆世界氣象大會上,歐洲氣象局也指出,華為云盤古氣象大模型在精度上有不可否認(rèn)的能力,對2月份芬蘭寒潮的預(yù)測,比歐洲的預(yù)測方法提前2天,溫度預(yù)測更加接近實(shí)際發(fā)生的溫度?!?br />
盤古氣象大模型的最新成果剛剛登上Nature正刊,只需要1.4秒就能完成24小時(shí)全球氣象預(yù)報(bào)。
扎根AI根技術(shù),實(shí)現(xiàn)行業(yè)大模型做到四大關(guān)鍵點(diǎn)
盤古大模型3.0最底層的基礎(chǔ)大模型包括100億參數(shù)、380億參數(shù)、710億參數(shù)和1000億參數(shù)四個(gè)版本,預(yù)訓(xùn)練使用了超3萬億tokens。
“要適配行業(yè)的不同場景,就必須做完全的解耦。我們將大模型和能力層解耦之后,不管你使用的是380億參數(shù)的模型,還是1000億參數(shù)的模型,能力級是不變的,是一致的。預(yù)測的大模型可以調(diào)用能力集,科學(xué)大模型也可以調(diào)用多模態(tài)能力?!睆埰桨仓赋?。
?
華為云人工智能領(lǐng)域首席科學(xué)家田奇介紹如何從基礎(chǔ)大模型煉成行業(yè)大模型
“盤古大模型基礎(chǔ)層L0層,我們做了上百種能力,包括語言模型的實(shí)時(shí)問答,文案生成能力,視覺模型的檢測分割,三維重建能力,多模態(tài)模型的文生圖能力,以及模型編排和插件等高階能力。盤古大模型的各項(xiàng)能力能夠做到解耦和按需組合,企業(yè)客戶可以根據(jù)具體的場景需求選擇所需要的數(shù)據(jù)集,使用盤古大模型工作流,快速開發(fā)行業(yè)大模型性能力?!?華為云人工智能領(lǐng)域首席科學(xué)家田奇表示。
實(shí)現(xiàn)行業(yè)大模型的四大關(guān)鍵點(diǎn),田奇分析指出:一是沉淀行業(yè)知識;二是淬煉行業(yè)技能,結(jié)合專家和行業(yè)數(shù)字環(huán)境的反饋進(jìn)行強(qiáng)化學(xué)習(xí),以達(dá)到符合行業(yè)應(yīng)用的最佳結(jié)果;三是對話專業(yè)工具,除了人與機(jī)器的對話,我們更多解決的是機(jī)器與機(jī)器,機(jī)器與工具的對話,將大模型與業(yè)務(wù)系統(tǒng)進(jìn)行融合,產(chǎn)生對話和交流,讓大模型可以調(diào)用大量的行業(yè)資產(chǎn)和工具;四是保證安全合規(guī),盤古提供公有云、混合云大模型專區(qū),這三種模式保證安全部署。建立長效機(jī)制,確保大模型安全合規(guī),包括數(shù)據(jù)集來源和使用合規(guī),數(shù)據(jù)全生命周期安全,構(gòu)建完整的數(shù)據(jù)標(biāo)注以及審核機(jī)制,構(gòu)建模型合規(guī)使用的政策,確保大模型的使用邊界。
華為在最底層構(gòu)建了以鯤鵬和昇騰為基礎(chǔ)的AI算力云平臺,以及異構(gòu)計(jì)算架構(gòu)CANN、全場景AI框架昇思MindSpore,AI開發(fā)生產(chǎn)線ModelArts等,為大模型開發(fā)和運(yùn)行提供分布式并行加速,算子和編譯優(yōu)化、集群級通信優(yōu)化等關(guān)鍵能力。基于華為的AI根技術(shù),大模型訓(xùn)練效能可以調(diào)優(yōu)到業(yè)界主流GPU的1.1倍。
張平安還宣布,單集群2000P Flops算力的昇騰AI云服務(wù)在華為云的烏蘭察布和貴安AI算力中心同時(shí)上線。昇騰AI云服務(wù)除了支持華為全場景AI框架昇思MindSpore外,還支持Pytorch、Tensorflow等主流AI框架。同時(shí),這些框架中90%的算子,都可以通過華為端到端的遷移工具平滑遷移到昇騰平臺。
小結(jié):
行業(yè)專家強(qiáng)調(diào)AI賦能千行百業(yè),行業(yè)大模型非常重要。通用大模型有很強(qiáng)的能力,但并不能解決很多企業(yè)的具體問題。企業(yè)的大模型應(yīng)用需要綜合考慮行業(yè)專業(yè)性、數(shù)據(jù)安全、持續(xù)迭代和綜合成本等因素。基于行業(yè)大模型構(gòu)建自己的專屬模型,也許是企業(yè)更優(yōu)的選項(xiàng)。
盤古大模型3.0已經(jīng)開始在10多個(gè)行業(yè)踐行智能化的能力,目前國內(nèi)在金融、政府、教育、電信、能源領(lǐng)域,多家公司已經(jīng)發(fā)布了行業(yè)大模型,競爭日益激烈,具體客戶是否能為華為云、百度云、科大訊飛等公司推出的行業(yè)大模型買單,關(guān)鍵還要看各家迭代的模型在實(shí)際應(yīng)用當(dāng)中的應(yīng)用效果和價(jià)值。
-
華為
+關(guān)注
關(guān)注
216文章
34411瀏覽量
251496 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2640 -
盤古大模型
+關(guān)注
關(guān)注
1文章
109瀏覽量
251
發(fā)布評論請先 登錄
相關(guān)推薦
評論