狂飆200多天后,國(guó)產(chǎn)大模型的數(shù)量已超過(guò)百家,正式邁入“百模大戰(zhàn)”階段。
越往后走,普通用戶和產(chǎn)業(yè)各界對(duì)大模型的期待,也從“你家的大模型涌現(xiàn)了嗎?”的能力突破,快進(jìn)到了“大模型究竟能幫我干什么”的“價(jià)值涌現(xiàn)”。
這時(shí)候,基礎(chǔ)大模型作為通用底座,要為行業(yè)/產(chǎn)業(yè)用戶提供堅(jiān)實(shí)的底層技術(shù)支撐,所承載的難度和重要性也不言而喻。
訓(xùn)基礎(chǔ)大模型的難度,堪比登月。
每一代大模型的發(fā)布,都像是“登月”計(jì)劃,前期工程細(xì)節(jié)準(zhǔn)備非常多,模型的訓(xùn)練環(huán)境和真實(shí)環(huán)境相差很遠(yuǎn),需要沒(méi)有短板的技術(shù)、極高的工程能力和精確性才能順利登陸產(chǎn)業(yè),達(dá)到落地可用的標(biāo)準(zhǔn)。
就在8 月 15 日,訊飛星火認(rèn)知大模型,就成功完成了第二次“登月”,發(fā)布了 V2.0 升級(jí)版本,代碼能力和多模態(tài)交互能力實(shí)現(xiàn)重大升級(jí)。
從多模態(tài)理解、多模態(tài)生成、代碼生成、代碼補(bǔ)齊、代碼解釋、代碼糾錯(cuò)和單元測(cè)試生成等一系列新能力及成果應(yīng)用中,我們看到了國(guó)產(chǎn)基礎(chǔ)大模型的持續(xù)進(jìn)化。
星火認(rèn)知大模型V2.0,就如同一艘新的“登月火箭”,進(jìn)一步拓展了大模型在產(chǎn)業(yè)的探索邊界,也為大模型應(yīng)用和生態(tài)的蓬勃爆發(fā),提供了堅(jiān)實(shí)支撐。
回溯訊飛星火的“登月”之路,我們可以看到,大模型的底座價(jià)值是如何一步步“涌現(xiàn)”的。
建造火箭:能力涌現(xiàn),為應(yīng)用筑底座
探索廣袤而未知的產(chǎn)業(yè)宇宙,需要一艘堅(jiān)固的可以長(zhǎng)途旅行的航天火箭。和“登月計(jì)劃”一樣,大模型的第一步,是建造并發(fā)布一個(gè)“能力涌現(xiàn)”的基礎(chǔ)模型。
大模型發(fā)展到今天,其能力限制已經(jīng)比較明顯了:
一是先天不足,容易產(chǎn)生幻覺(jué)和遺忘問(wèn)題,這會(huì)導(dǎo)致大模型的回答精度和準(zhǔn)確度不高,在需要復(fù)雜邏輯的嚴(yán)肅場(chǎng)景中,達(dá)不到產(chǎn)業(yè)客戶采購(gòu)所需要的質(zhì)量。
二是后天短板,大模型不是一次發(fā)布就高枕無(wú)憂了,需要用戶反饋的“數(shù)據(jù)飛輪”,充沛算力和迭代優(yōu)化的持續(xù)保障,沒(méi)有決心打持久戰(zhàn),通用大模型很快會(huì)在激烈的技術(shù)競(jìng)爭(zhēng)中落后。
對(duì)于行業(yè)和企業(yè)來(lái)說(shuō),所希望引入的,當(dāng)然是能夠持續(xù)進(jìn)化、能力領(lǐng)先的基礎(chǔ)大模型。
顯然,科大訊飛作為基礎(chǔ)大模型的“第一梯隊(duì)”,也注意到了上述應(yīng)用現(xiàn)狀,并在此次V2.0升級(jí)發(fā)布會(huì)上,為訊飛星火實(shí)現(xiàn)了三重能力升級(jí):
一是基礎(chǔ)能力的再升級(jí)。
大模型的基本綜合能力,是作為通用底座支撐智能經(jīng)濟(jì)的前提條件。
作為中國(guó)人工智能“國(guó)家隊(duì)”, 訊飛星火大模型推出以來(lái),就擁有7大核心能力,包括多風(fēng)格多任務(wù)長(zhǎng)文本生成能力、多層次跨語(yǔ)種語(yǔ)言理解能力、泛領(lǐng)域開放式知識(shí)問(wèn)答能力、情境式思維鏈邏輯推理能力、多題型可解析數(shù)學(xué)能力、多功能多語(yǔ)言代碼能力、多模態(tài)輸入和表達(dá)能力。此次V2.0升級(jí)中,訊飛星火的各項(xiàng)能力則再一次增強(qiáng)。
比如代碼能力,就被認(rèn)為是大模型的“硬實(shí)力”,是理解能力、邏輯能力、生成能力的集大成者。此次訊飛星火2.0對(duì)代碼能力進(jìn)行5個(gè)維度的升級(jí),包括代碼生成、代碼補(bǔ)齊、代碼糾錯(cuò)、代碼解釋、單元測(cè)試生成。
根據(jù)認(rèn)知智能國(guó)家重點(diǎn)實(shí)驗(yàn)室構(gòu)建的代碼的真實(shí)的場(chǎng)景使用的測(cè)試集,代碼生成和補(bǔ)齊維度上已經(jīng)超過(guò)了ChatGPT。
二是關(guān)鍵技術(shù)的再進(jìn)化。
經(jīng)過(guò)一段時(shí)間的產(chǎn)業(yè)實(shí)踐和反饋,訊飛星火也在不斷進(jìn)化,快速迭代,以回應(yīng)產(chǎn)業(yè)需求。
在劉慶峰看來(lái),多模態(tài)能力是賦能行業(yè)的剛需,也是實(shí)現(xiàn)通用人工智能的必經(jīng)之路,同時(shí)也是科大訊飛既定的人工智能技術(shù)長(zhǎng)期戰(zhàn)略。
在8 月 15 日的V2.0 升級(jí)版本中,訊飛星火還重磅發(fā)布了多模態(tài)能力,在圖像描述、圖像問(wèn)答、識(shí)圖創(chuàng)作、文圖生成、虛擬人合成等方面全新升級(jí)。多模態(tài)能力升級(jí)后,訊飛智作2.0進(jìn)一步降低短視頻制作的門檻,無(wú)論是視頻的后期處理還是創(chuàng)意視頻生產(chǎn)都能輕松搞定,有望滿足更多元的視頻制作需求,推動(dòng)AIGC產(chǎn)業(yè)的發(fā)展。
訊飛星火的能力持續(xù)突破,也將不斷賦能AI-native原生應(yīng)用,為生長(zhǎng)在“訊飛星火”上的垂類模型和AI應(yīng)用,提供源源不斷的創(chuàng)新動(dòng)能。
三是垂直領(lǐng)域的再創(chuàng)新。
提高大模型在嚴(yán)肅場(chǎng)景中的準(zhǔn)確率就需要聚焦場(chǎng)景,約束環(huán)境,結(jié)合專有數(shù)據(jù)進(jìn)行訓(xùn)練。至今,訊飛星火已經(jīng)在一些關(guān)鍵領(lǐng)域,比如教育、醫(yī)療、汽車、辦公、工業(yè)、智能硬件等,將認(rèn)知智能大模型技術(shù)落地應(yīng)用,打造獨(dú)具優(yōu)勢(shì)的行業(yè)專用模型,來(lái)支撐行業(yè)數(shù)字化轉(zhuǎn)型和應(yīng)用創(chuàng)新開發(fā)。
以教育場(chǎng)景為例,傳道受業(yè)解惑是非常認(rèn)真嚴(yán)肅的場(chǎng)景,用人工智能助力課堂創(chuàng)新,對(duì)大模型的認(rèn)知能力要求很高??拼笥嶏w全新發(fā)布的星火教師助手,支持教學(xué)設(shè)計(jì)的三大環(huán)節(jié),創(chuàng)新規(guī)劃單元教學(xué)設(shè)計(jì)、啟發(fā)創(chuàng)設(shè)情境教學(xué)活動(dòng)、一鍵生成互動(dòng)教學(xué)課件,大大提升老師的備課效率。
基礎(chǔ)大模型,是大模型產(chǎn)業(yè)的核心引擎,訊飛星火認(rèn)知大模型的這三重“能力涌現(xiàn)”,構(gòu)筑了一個(gè)堅(jiān)實(shí)底座,滿足了產(chǎn)業(yè)各界對(duì)基礎(chǔ)大模型的期待,也在后續(xù)的產(chǎn)業(yè)加速落地提供動(dòng)能。
加速推進(jìn):價(jià)值涌現(xiàn),為應(yīng)用輸動(dòng)力
大模型的“價(jià)值涌現(xiàn)”從產(chǎn)業(yè)的角度看,就是將大模型的AI技術(shù)紅利,轉(zhuǎn)化為最終的生產(chǎn)力,為產(chǎn)業(yè)提質(zhì)增效,帶來(lái)社會(huì)數(shù)字經(jīng)濟(jì)的增長(zhǎng)。
這就需要大量、廣泛、持續(xù)地應(yīng)用大模型,就像火箭分級(jí)一樣,僅僅發(fā)布出去還不夠,還需要加速器進(jìn)一步使力,推動(dòng)大模型與行業(yè)場(chǎng)景相融合,提升大模型在產(chǎn)業(yè)當(dāng)中的應(yīng)用密度。
當(dāng)各界的關(guān)注點(diǎn)從“能力涌現(xiàn)”轉(zhuǎn)移到“價(jià)值涌現(xiàn)”時(shí),訊飛星火認(rèn)知大模型也率先交出了答卷,實(shí)現(xiàn)了在教育、醫(yī)療、汽車、辦公、工業(yè)、智能硬件等多個(gè)行業(yè)的深度應(yīng)用。
具體來(lái)說(shuō),當(dāng)AI深入產(chǎn)業(yè)會(huì)遭遇一個(gè)“不可能三角”:普及度、質(zhì)量、成本。
如果一個(gè)AI大模型應(yīng)用的普及度很高,比如AIGC生成寫真,開發(fā)成本不高,用戶對(duì)質(zhì)量的要求低,就非常容易陷入低質(zhì)低價(jià)的紅海競(jìng)爭(zhēng)。而一個(gè)嚴(yán)肅的行業(yè)場(chǎng)景,比如礦山,對(duì)生成結(jié)果的質(zhì)量要求很高,但場(chǎng)景個(gè)性化與瑣碎,定制化開發(fā)的成本高,普及度就很難提高。
這個(gè)“不可能三角”禁錮著大模型的技術(shù)商業(yè)化和快速增長(zhǎng)。那么,有沒(méi)有辦法打破這個(gè)“不可能三角”,讓大模型的應(yīng)用受眾多、質(zhì)量高、成本低呢?
“訊飛星火”還真的實(shí)現(xiàn)了。主要做了以下幾件事:
首先,打磨產(chǎn)品助普及。
以提供應(yīng)用價(jià)值為導(dǎo)向,在一些特定場(chǎng)景中帶來(lái)實(shí)打?qū)嵉漠a(chǎn)品,持續(xù)釋放生產(chǎn)力,為大模型技術(shù)的普及度和質(zhì)量帶來(lái)保證,有力地提升用戶的采購(gòu)意愿。
此次升級(jí),除了技術(shù)獲得重大突破,搭載訊飛星火認(rèn)知大模型核心能力的應(yīng)用和產(chǎn)品也越來(lái)越豐富:既有代碼快速生成或者改Bug的智能編程助手iFlyCode1.0,能夠進(jìn)行視頻創(chuàng)作的訊飛智作2.0,還有幫助教師設(shè)計(jì)教學(xué)活動(dòng)、一鍵生成課件的星火教師助手,面向?qū)W生口語(yǔ)練習(xí)的星火語(yǔ)伴2.0,訊飛AI學(xué)習(xí)機(jī)也升級(jí)AI編程空間和AI創(chuàng)意畫板。
這些產(chǎn)品和應(yīng)用,會(huì)進(jìn)一步加速AI大模型的普及,成為人人可用的生產(chǎn)力工具。
其次,聚焦場(chǎng)景保質(zhì)量。
在通用大模型的基礎(chǔ)上,訊飛面向重點(diǎn)行業(yè)客戶以私有化部署的方式,幫助行業(yè)客戶構(gòu)建自主可控的行業(yè)大模型,目前已經(jīng)與多家行業(yè)頭部客戶達(dá)成合作意向。6月30日,訊飛和人保科技簽訂協(xié)議,推進(jìn)大模型技術(shù)在金融垂直領(lǐng)域的應(yīng)用,加速推動(dòng)金融業(yè)的數(shù)字化轉(zhuǎn)型和智能化發(fā)展。助力特定行業(yè)降本增效,產(chǎn)生的標(biāo)準(zhǔn)化解決方案則有望與行業(yè)伙伴一起,在其他企業(yè)規(guī)模復(fù)用。
最后,攜手伙伴降成本。
降低成本、擴(kuò)大產(chǎn)業(yè)影響力,不可能靠自己?jiǎn)未颡?dú)斗,需要產(chǎn)業(yè)鏈上下游生態(tài)的緊密支持。以算力成本為例,訊飛就始終堅(jiān)持開放合作,積極引入國(guó)產(chǎn)化算力,在WAIC2023期間舉辦的昇騰人工智能產(chǎn)業(yè)高峰論壇上,科大訊飛發(fā)布了與華為在自主可控方面的最新合作成果——訊飛星火與華為昇騰強(qiáng)強(qiáng)聯(lián)合,全力打造國(guó)產(chǎn)通用智能新底座。此次發(fā)布會(huì)上,訊飛又進(jìn)一步和華為合作,推出了每個(gè)行業(yè)都可以快速部署的星火一體機(jī),具備性能領(lǐng)先、安全可控、開箱即用等特點(diǎn)。
訊飛和產(chǎn)業(yè)鏈伙伴一起,緩解大模型算力荒、算力貴的問(wèn)題,降低大模型的落地成本,為長(zhǎng)期持續(xù)發(fā)展奠定了條件。
和OpenAI“拿著錘子找釘子”的大模型思路不同,科大訊飛在大模型領(lǐng)域的突出優(yōu)勢(shì),就是以應(yīng)用為導(dǎo)向,由具體場(chǎng)景牽引,與產(chǎn)業(yè)鏈協(xié)同進(jìn)化,以保證大模型可以快速完成價(jià)值的自證與他證,從而加速進(jìn)入各行各業(yè)。
此前科大訊飛發(fā)布的2023年半年報(bào)顯示,訊飛星火認(rèn)知大模型發(fā)布后,2023年5月-6月,公司C端硬件GMV創(chuàng)歷史新高,同比翻倍增長(zhǎng)。以學(xué)習(xí)機(jī)為例,5月-6月,大模型加持后學(xué)習(xí)機(jī)GMV分別同比增長(zhǎng)136%和217%。
由此可見(jiàn),大模型的真實(shí)價(jià)值,已經(jīng)在供給端(訊飛星火)和應(yīng)用端(行業(yè)用戶),都開始“涌現(xiàn)”。
成功著陸:生態(tài)涌現(xiàn),為應(yīng)用造叢林
“登月”的最后一個(gè)階段是“著陸”,沒(méi)有商業(yè)化的成功落地,廠商很難回收前期的研發(fā)成本,無(wú)力繼續(xù)投入新一輪技術(shù)研發(fā)。
開啟大模型的良性商業(yè)循環(huán),讓大模型產(chǎn)生業(yè)務(wù)價(jià)值,就需要在落地探索成功之后,營(yíng)造一個(gè)適合大模型持續(xù)壯大的產(chǎn)業(yè)生態(tài)環(huán)境,包括輔助大模型的開發(fā)工具、軟硬件基礎(chǔ)設(shè)施、開放平臺(tái)等。
正如劉慶峰所說(shuō),“中國(guó)人工智能的發(fā)展絕不是單個(gè)企業(yè)、單個(gè)科研院所使命,而是整個(gè)社會(huì)的機(jī)會(huì),生態(tài)的發(fā)展決定了產(chǎn)業(yè)的繁榮”。
圍繞訊飛星火認(rèn)知大模型的“生態(tài)叢林”建設(shè)起來(lái),意味著不同類型開發(fā)者、企業(yè)都會(huì)聚集,如同熱帶雨林一般,在各自的生態(tài)位上交流、互動(dòng)、生息,孵化出多樣化、多角度的AI應(yīng)用創(chuàng)新,才能讓大模型產(chǎn)業(yè)更加繁榮、生機(jī)勃勃。
目前,訊飛人工智能開放平臺(tái)已有很好的生態(tài)基礎(chǔ)。訊飛星火認(rèn)知大模型發(fā)布后,開發(fā)者數(shù)量在兩個(gè)月內(nèi)增加了85萬(wàn)家。截至2023年6月30日,訊飛人工智能開放平臺(tái)已聚集497.4萬(wàn)開發(fā)者,近一年增長(zhǎng)率45%;應(yīng)用數(shù)172.5萬(wàn),近一年增長(zhǎng)率13.7%。
此次V2.0升級(jí)發(fā)布會(huì)中,訊飛還進(jìn)一步面向包括央國(guó)企在內(nèi)的行業(yè)客戶提供業(yè)界領(lǐng)先、自主可控的私有化代碼能力平臺(tái),降低開發(fā)者門檻,助力行業(yè)客戶數(shù)字化、智能化轉(zhuǎn)型。
此外,訊飛開放平臺(tái)的AI星火營(yíng)生態(tài)以及星火助手計(jì)劃,可以讓更多有創(chuàng)意和想象力的伙伴加入到訊飛開放平臺(tái),共同繁榮發(fā)展。
能力涌現(xiàn)、價(jià)值涌現(xiàn)、生態(tài)涌現(xiàn),訊飛走完了這條從研到用、從點(diǎn)到鏈的產(chǎn)業(yè)成熟之路,國(guó)產(chǎn)大模型才有未來(lái),中國(guó)AI才有未來(lái)。訊飛星火的 “登月之路”,也是基礎(chǔ)大模型的通關(guān)密碼。
“登月”的目標(biāo)不是為了炫技,而是為了讓更多行業(yè)和用戶可以率先低成本地用上大模型,挖掘技術(shù)的富礦,觸碰智能時(shí)代的魅力和機(jī)遇。
惠特曼在詩(shī)中寫道:偉大的戲碼繼續(xù)上演,而你或可貢獻(xiàn)一行詩(shī)句,一首新詩(shī),甚至一個(gè)全新的故事。
大模型的“登月”之路上,科大訊飛正在全力以赴、不遺余力、充滿激情、充滿斗志地奮斗著,很快會(huì)在今年10月24日迎來(lái)第三次升級(jí),屆時(shí)將全面對(duì)標(biāo)ChatGPT。
通用人工智能的偉大變革,才剛剛開始,不妨拿起筆來(lái),點(diǎn)亮星火,和科大訊飛一起書寫全新的故事。
-
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268875 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238214 -
代碼
+關(guān)注
關(guān)注
30文章
4779瀏覽量
68519 -
科大訊飛
+關(guān)注
關(guān)注
19文章
800瀏覽量
61238 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2640
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論