大模型下半場(chǎng)將更聚焦在垂直化應(yīng)用以及生態(tài)化發(fā)展。
? ITValue
離大模型橫空出世已經(jīng)過(guò)去一年有余,在AI大模型的浪潮下,各大科技企業(yè)爭(zhēng)先恐后的推出了自家的大模型產(chǎn)品。與此同時(shí),各行業(yè)企業(yè)也對(duì)大模型保持著高度關(guān)注,一些其他行業(yè)的企業(yè)也都紛紛跨界布局大模型相關(guān)產(chǎn)品。
如果說(shuō),各大廠商紛紛推出大模型產(chǎn)品形成“百模大戰(zhàn)”的局勢(shì),是大模型這場(chǎng)“戰(zhàn)役”的上半場(chǎng)的話,那么這場(chǎng)“戰(zhàn)役”的下半場(chǎng)將更聚焦在大模型的垂直化應(yīng)用以及生態(tài)化發(fā)展。
01
從通用大模型 到行業(yè)大模型
《北京市人工智能行業(yè)大模型創(chuàng)新應(yīng)用白皮書(2023年)》中顯示,截至2023年10月,我國(guó)10億參數(shù)規(guī)模以上的大模型廠商及高校院所共計(jì)254家,分布于20余個(gè)省市/地區(qū)。商業(yè)咨詢機(jī)構(gòu)愛(ài)分析的報(bào)告稱,2023年中國(guó)大模型市場(chǎng)規(guī)模約為50億元,預(yù)計(jì)到2024年這一數(shù)字將達(dá)到120億元。
顯然,2024年,大模型將繼續(xù)其火熱的現(xiàn)象,進(jìn)一步滲透到各行各業(yè)的數(shù)字化進(jìn)程中。
大模型真正的價(jià)值在于行業(yè)側(cè)的應(yīng)用落地,就目前業(yè)內(nèi)對(duì)大模型的認(rèn)知來(lái)看,絕大多數(shù)人對(duì)大模型相關(guān)產(chǎn)品的發(fā)展觀點(diǎn)類似于互聯(lián)網(wǎng)——消費(fèi)級(jí)只是開始,產(chǎn)業(yè)級(jí)價(jià)值更大。但就如同互聯(lián)網(wǎng)一樣,消費(fèi)互聯(lián)網(wǎng)發(fā)展迅速,甚至已經(jīng)接近“天花板”;產(chǎn)業(yè)互聯(lián)網(wǎng)也僅是近年來(lái)在政策引導(dǎo),數(shù)字技術(shù)驅(qū)動(dòng)下,逐步發(fā)展提速。
大模型的發(fā)展與互聯(lián)網(wǎng)的發(fā)展類似。回看剛剛過(guò)去的2023年,以ChatGPT為代表的語(yǔ)言大模型發(fā)展迅速,除了ChatGPT、必應(yīng)以外,國(guó)內(nèi)眾多廠商也紛紛布局,包括華為、阿里、百度、京東、科大訊飛、商湯等在內(nèi)的眾多科技公司也都積極布局,紛紛推出了各自的大模型產(chǎn)品。
不過(guò)回看這些大模型產(chǎn)品,大多是聚焦C端,也就是終端用戶的產(chǎn)品,為用戶提供了辦公、生活上的輔助。
不過(guò),企業(yè)對(duì)于大模型產(chǎn)品還是保持開放的態(tài)度,據(jù)IBM商業(yè)價(jià)值研究院最近發(fā)布的調(diào)研報(bào)告顯示:有四分之三的受訪CEO認(rèn)為,部署先進(jìn)的生成式人工智能將為企業(yè)帶來(lái)競(jìng)爭(zhēng)優(yōu)勢(shì)。
大模型真正的價(jià)值是:產(chǎn)業(yè)側(cè)應(yīng)用的落地,也就是行業(yè)級(jí)大模型產(chǎn)品成熟度的提高。據(jù)市場(chǎng)研究機(jī)構(gòu)預(yù)測(cè),到2025年,全球生成式AI市場(chǎng)規(guī)模將達(dá)到100億美元以上。其中,企業(yè)級(jí)生成式AI市場(chǎng)將占據(jù)相當(dāng)大的份額,成為最大的應(yīng)用領(lǐng)域之一。
行業(yè)大模型是指針對(duì)特定行業(yè)或領(lǐng)域的大模型,這種模型針對(duì)特定領(lǐng)域的任務(wù)進(jìn)行了優(yōu)化和定制。相比通用大模型,行業(yè)大模型專業(yè)性更強(qiáng)、性能更優(yōu)。不過(guò)行業(yè)大模型在發(fā)展的過(guò)程中,與通用大模型也存在著不少差別。
目前已知的主要差別是——行業(yè)大模型不僅需要通用的語(yǔ)料庫(kù),還需要針對(duì)不同行業(yè),不同場(chǎng)景的專業(yè)語(yǔ)料庫(kù)。神州數(shù)碼副總裁CTO李剛曾對(duì)鈦媒體表示,行業(yè)大模型具有極強(qiáng)的專業(yè)性,需要大量行業(yè)專業(yè)知識(shí)庫(kù),“目前,這個(gè)行業(yè)知識(shí)庫(kù)的語(yǔ)料需控制在20%,不多不少。”李剛強(qiáng)調(diào),“超過(guò)20%,訓(xùn)練出來(lái)的大模型可能就‘不會(huì)說(shuō)人話’,造成溝通障礙;少于20%,又不具備行業(yè)的專業(yè)性?!?/p>
02? ?醫(yī)療、法律、金融等行業(yè)
率先落地 目前行業(yè)級(jí)大模型還處于發(fā)展的初級(jí)階段,雖然有很多家企業(yè)推出了行業(yè)大模型,但是應(yīng)用并不成熟。就現(xiàn)階段大模型在各個(gè)行業(yè)的應(yīng)用現(xiàn)狀,以及發(fā)展趨勢(shì)來(lái)看,醫(yī)療、金融、法律等行業(yè)正率先落地較成熟的行業(yè)級(jí)大模型應(yīng)用。
智源研究院大模型行業(yè)應(yīng)用負(fù)責(zé)人周華曾對(duì)鈦媒體表示,現(xiàn)階段,容錯(cuò)性比較高的通用領(lǐng)域大模型成熟度較高,在類似智能客服、文檔處理等方面能夠發(fā)揮更多輔助作用,還有通用領(lǐng)域的文生圖應(yīng)用,以及通過(guò)檢索增強(qiáng)技術(shù)緩解部分幻覺(jué)問(wèn)題的專業(yè)領(lǐng)域應(yīng)用,都是目前企業(yè)比較好落地的一些應(yīng)用場(chǎng)景。
無(wú)獨(dú)有偶,IEEE標(biāo)準(zhǔn)協(xié)會(huì)新標(biāo)準(zhǔn)立項(xiàng)委員會(huì)副主席兼IEEE數(shù)字金融與經(jīng)濟(jì)標(biāo)準(zhǔn)委員會(huì)主席林道莊也有著相似的看法,林道莊表示,目前,大模型的應(yīng)用主要集中在“三產(chǎn)”(服務(wù)業(yè))居多,重點(diǎn)是輔助人更快、更好地服務(wù)其他人,而行業(yè)級(jí)的大模型也有望在服務(wù)業(yè)相關(guān)領(lǐng)域率先落地成熟度較高的應(yīng)用。
就目前的發(fā)展現(xiàn)狀來(lái)看,行業(yè)大模型發(fā)展較快的行業(yè)主要有金融、醫(yī)療、法律等。
金融行業(yè)方面,2023年3月,彭博首度針對(duì)金融業(yè)推出大型語(yǔ)言模型BloombergGPT,引發(fā)市場(chǎng)對(duì)金融垂直領(lǐng)域大模型的關(guān)注;6月,哥倫比亞大學(xué)聯(lián)合上海紐約大學(xué)推出FinGPT 。
在國(guó)內(nèi),同年7月,華為全新發(fā)布盤古大模型,金融行業(yè)大模型正是其中數(shù)個(gè)行業(yè)通用大模型之一;同年9月,螞蟻集團(tuán)正式發(fā)布自研“螞蟻基礎(chǔ)大模型”,以及在此基礎(chǔ)上進(jìn)行定制的“螞蟻金融大模型”。
雖然眾多具備大模型能力的公司都在積極布局金融行業(yè)大模型產(chǎn)品,不過(guò)基于金融行業(yè)的特殊性——對(duì)安全合規(guī)要求極高,大模型在金融行業(yè)具備完全成熟落地的能力仍需時(shí)日。
張勁曾對(duì)鈦媒體表示,金融行業(yè)不同于其他行業(yè),其監(jiān)管要求極高,從技術(shù)上看,像貸款審核等業(yè)務(wù)其實(shí)已具備初步落地的技術(shù)能力,但因?yàn)榘踩弦?guī)的要求,大模型只能在其中起到解放生產(chǎn)力的輔助作用。
現(xiàn)階段,大模型在金融行業(yè)的應(yīng)用主要還是集中在風(fēng)險(xiǎn)評(píng)估和管理,以及知識(shí)圖譜平臺(tái)搭建方面。在風(fēng)險(xiǎn)評(píng)估方面,大模型可以通過(guò)分析大量的歷史數(shù)據(jù)和實(shí)時(shí)信息,預(yù)測(cè)市場(chǎng)風(fēng)險(xiǎn)、評(píng)估信用風(fēng)險(xiǎn)等,為金融機(jī)構(gòu)提供更加準(zhǔn)確和及時(shí)的風(fēng)險(xiǎn)管理決策支持。
另一方面,將大模型與知識(shí)圖譜平臺(tái)結(jié)合,用大模型代替NLP技術(shù),金融機(jī)構(gòu)可以在提升效率的同時(shí),提升風(fēng)控水平。
除了在金融行業(yè)有望在今年有較成熟的應(yīng)用場(chǎng)景出現(xiàn)以外,林道莊對(duì)鈦媒體表示,像醫(yī)療、法律咨詢、教培、娛樂(lè)等風(fēng)險(xiǎn)要求較低、偏服務(wù)的行業(yè),在今年有望有較多成熟的應(yīng)用場(chǎng)景落地?!霸?024年,大模型將會(huì)在一些有人輔助校驗(yàn)、風(fēng)險(xiǎn)及精準(zhǔn)程度要求較低的行業(yè)落地,通過(guò)大模型輔助人類去進(jìn)行工作,可以使更多人享受到更好的服務(wù)。但還遠(yuǎn)不到代替人的能力?!绷值狼f強(qiáng)調(diào)。
以醫(yī)療行業(yè)為例,通過(guò)行業(yè)大模型對(duì)大量醫(yī)療數(shù)據(jù)的學(xué)習(xí)和分析,可以自動(dòng)識(shí)別病變特征,輔助醫(yī)生進(jìn)行疾病診斷,提高診斷準(zhǔn)確率與診斷效率。對(duì)此,林道莊表示,現(xiàn)階段,我國(guó)醫(yī)療資源比較緊缺,許多人排了很久的隊(duì)才能看上病,而醫(yī)生也很忙,通過(guò)大模型的輔助,能幫助醫(yī)生快速的識(shí)別諸如X光片、CT等病歷,從而大幅提升醫(yī)生工作效率,也能降低患者等待的時(shí)間?!皩?duì)于醫(yī)療、法律及翻譯服務(wù)等這類信息或能力嚴(yán)重不對(duì)稱的行業(yè),大模型的介入將大大提高服務(wù)提供的效率,推動(dòng)服務(wù)流程的標(biāo)準(zhǔn)化?!绷值狼f強(qiáng)調(diào)。
除“增效”以外,大模型在醫(yī)療行業(yè)的落地還可以幫助患者和醫(yī)院實(shí)現(xiàn)“降本”,通過(guò)自動(dòng)化和智能化的醫(yī)療輔助系統(tǒng),可以降低醫(yī)療成本,提高醫(yī)療服務(wù)的效率和質(zhì)量。
另一方面,行業(yè)大模型在醫(yī)療行業(yè)還可以幫助醫(yī)生優(yōu)化治療方案。通過(guò)大模型對(duì)對(duì)患者病情、病史、藥物過(guò)敏等情況進(jìn)行綜合分析,為醫(yī)生提供更加全面和個(gè)性化的治療方案,提高治療效果。
在林道莊看來(lái),行業(yè)大模型能率先落地的垂直行業(yè)具有一個(gè)普遍的共性——知識(shí)密集型行業(yè),“行業(yè)大模型能率先落地的行業(yè)一定是可以通過(guò)知識(shí)密集提供價(jià)值的行業(yè),”林道莊指出,“某種程度上講,通過(guò)知識(shí)收集、知識(shí)管理,實(shí)現(xiàn)輔助人生成內(nèi)容、提出決策建議,而不是代替人的目標(biāo)。”
在醫(yī)療、金融等行業(yè)之外,大模型在諸如工業(yè)、制造業(yè)等行業(yè)的落地還仍需時(shí)日。對(duì)此,周華對(duì)鈦媒體表示,現(xiàn)階段,大模型主要的能力還是體現(xiàn)在文字、文檔處理,一般性的聊天和較淺顯的專業(yè)問(wèn)答方面,以及通用視覺(jué)領(lǐng)域的問(wèn)答和生成方面,對(duì)于邏輯推理要求和準(zhǔn)確性要求高的專業(yè)語(yǔ)言領(lǐng)域,涉及學(xué)科和工程相關(guān)圖片、視頻識(shí)別的專業(yè)視覺(jué)領(lǐng)域,以及“文生視頻”等能力仍需技術(shù)迭代,“這種具備多模態(tài)能力的大模型產(chǎn)品目前仍難以在行業(yè)側(cè)的落地應(yīng)用的能力,”周華如是說(shuō),“2024年,多模態(tài)模型將成為大模型領(lǐng)域各大廠商角逐的焦點(diǎn)。而隨著多模態(tài)模型成熟度不斷變高,會(huì)有更多的行業(yè)應(yīng)用場(chǎng)景出現(xiàn)。”
03 ? ? ?
安全依舊“不容忽視”
行業(yè)大模型在落地應(yīng)用的過(guò)程中,企業(yè)也會(huì)遇見很多問(wèn)題,除了大模型的“幻覺(jué)”問(wèn)題以外,最大的一個(gè)問(wèn)題就是安全的問(wèn)題。
數(shù)據(jù)安全自從互聯(lián)網(wǎng)出現(xiàn)以來(lái),一直是所有參與者共同關(guān)注的焦點(diǎn)問(wèn)題,在AIGC時(shí)代,亦是如此。大模型在為我們帶來(lái)更多便利,提高效率的同時(shí),也帶來(lái)了日益嚴(yán)峻的安全挑戰(zhàn)。 當(dāng)下,數(shù)據(jù)已成為企業(yè),乃至國(guó)家重要資產(chǎn),數(shù)據(jù)安全、隱私保護(hù)等問(wèn)題也成為各行業(yè)企業(yè)關(guān)注的焦點(diǎn),據(jù)IBM Security 發(fā)布的《2023年數(shù)據(jù)泄露成本報(bào)告》中顯示,僅數(shù)據(jù)泄露一項(xiàng),2023年全球數(shù)據(jù)泄露的平均成本達(dá)到 445 萬(wàn)美元,創(chuàng)該報(bào)告有史以來(lái)以來(lái)最高記錄,較過(guò)去 3 年均值增長(zhǎng)了 15%。 而隨著大模型相關(guān)產(chǎn)品的落地,數(shù)據(jù)安全面臨的威脅也勢(shì)必將越來(lái)越大。IEEE調(diào)研顯示,2024年將會(huì)出現(xiàn)其他更具威脅的網(wǎng)絡(luò)安全問(wèn)題,包括勒索軟件攻擊(2024年為37%,高于2023年的30%)、網(wǎng)絡(luò)釣魚攻擊(2024年為35%,高于2023年的25%)以及內(nèi)部威脅(2024年為26%,高于2023年的19%)。 以目前技術(shù)發(fā)展來(lái)看,AIGC主要從三個(gè)方面給網(wǎng)絡(luò)安全帶來(lái)更大的挑戰(zhàn),分別是:惡意軟件/網(wǎng)絡(luò)攻擊、分布式拒絕服務(wù)攻擊,以及網(wǎng)絡(luò)監(jiān)控和隱私侵犯等;另一方面,企業(yè)在AIGC還面臨著數(shù)據(jù)泄露、數(shù)據(jù)篡改/偽造等數(shù)據(jù)安全方面的挑戰(zhàn)。
在林道莊看來(lái),雖然AI時(shí)代,企業(yè)面臨著更大的網(wǎng)絡(luò)安全和數(shù)據(jù)安全的挑戰(zhàn),但是在這個(gè)過(guò)程中,企業(yè)也可以充分應(yīng)用AI的能力進(jìn)行預(yù)警、防御,“通過(guò)AI自動(dòng)學(xué)習(xí)識(shí)別,預(yù)測(cè)一些潛在的風(fēng)險(xiǎn),并將這些風(fēng)險(xiǎn)自動(dòng)隔離起來(lái),”林道莊如是說(shuō),“通過(guò)AI的賦能,讓企業(yè)級(jí)防火墻具備更強(qiáng)的應(yīng)變能力?!?立足安全領(lǐng)域,其實(shí)已經(jīng)有不少頭部的廠商嘗試將AIGC能力整合進(jìn)安全產(chǎn)品及解決方案中,例如,云起無(wú)垠2023年底發(fā)布了名為「SecGPT」的網(wǎng)絡(luò)安全大模型開源項(xiàng)目;360于2023年9月開放360智腦大模型,據(jù)了解,該模型是全國(guó)首個(gè)原生安全大模型;騰訊安全在混元大模型基礎(chǔ)上投喂安全知識(shí)語(yǔ)料庫(kù)二次訓(xùn)練出安全大模型,并基于安全大模型打造了騰訊云AI安全助手........ 確實(shí),AIGC就好像一把“雙刃劍”,一方面,帶來(lái)了更多便捷,提升了效率;另一方面,基于AIGC技術(shù)的網(wǎng)絡(luò)攻擊,以及給數(shù)據(jù)安全的威脅也會(huì)越來(lái)越多。
而對(duì)于幾乎所有企業(yè)來(lái)說(shuō),選擇應(yīng)用數(shù)字技術(shù)的時(shí)候,所有一切的前提就是——安全。企業(yè)在享受AIGC帶來(lái)的技術(shù)紅利的過(guò)程中,對(duì)于安全的考慮也將成為AIGC發(fā)展的一個(gè)重要賽道。
審核編輯:黃飛
評(píng)論
查看更多