RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

重讀AI大模型元年:“百模趕考,文心奪魁”

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-02-12 19:01 ? 次閱讀

把時間倒回一年之前,那時很多媒體和網(wǎng)友討論,中國能做出來類ChatGPT的大模型應(yīng)用嗎?

當(dāng)時我們就說,不用慌,不用忙,中國一定能做成大模型。轉(zhuǎn)瞬間,被稱為“大模型元年”的2023年即將在爆竹聲中結(jié)束。中國AI大模型,舉頭已覺千山綠。

根據(jù)相關(guān)數(shù)據(jù),到2023年10月中國市場已經(jīng)發(fā)布了超過230個大模型?!鞍倌Zs考”實至名歸。但是,大模型數(shù)量并不是做成大模型的終點,甚至不是做大模型的目的。

在今天這個階段,我們必須回答新的問題:大模型有了,怎么才能把大模型做好,用好?怎么才能讓大模型為社會經(jīng)濟做出巨大價值?

想回答這個問題,就必須知道大模型的“好”是什么。

評價大模型的質(zhì)量好壞,不是靠參數(shù),靠規(guī)模,而是比效率,比技術(shù),比應(yīng)用,比生態(tài),最終比誰最好用,誰最有用。

在探討這些問題時,我們會發(fā)現(xiàn)國產(chǎn)大模型格局的另一面:大模型雖多,但普通人知道,用到的卻并不多。隨便找個朋友問一問,會發(fā)現(xiàn)他大概率只知道一個國產(chǎn)大模型,那就是文心一言與其背后的文心大模型。

雖然有數(shù)量過百的大模型策馬奔騰,但卻是文心大模型一騎絕塵。為什么會這樣?

理解這個問題,才能理解大模型的本質(zhì)規(guī)律:只有厚積薄發(fā),做深做強,才是國產(chǎn)大模型的未來之路。

歲末回首,重新審視“百模趕考,文心奪魁”的行業(yè)格局,能看到AGI的曙光正悄然來到這片土地上。

身位之先:大模型的效率競賽

在AI大模型剛剛興起之際,用戶對它有好奇,行業(yè)對它有渴望,社會經(jīng)濟對它有廣泛多元的期待。這時,誰能夠率先將大模型帶給用戶與產(chǎn)業(yè),誰就能夠立下先鋒之功,通過身位領(lǐng)先來確定自身的行業(yè)優(yōu)勢。

回望過去一年大模型行業(yè)的發(fā)展,會發(fā)現(xiàn)文心大模型每次都在扮演先鋒的角色。最終將大模型技術(shù)最快交到用戶、開發(fā)者以及千行百業(yè)手中。文心大模型的高效率、快節(jié)奏,以及這背后的技術(shù)領(lǐng)先與產(chǎn)品自信,是其能夠保持“一騎絕塵”的首要關(guān)鍵。

2023年3月,百度率先發(fā)布了文心一言大語言模型。這得益于百度十余年布局和深耕深度學(xué)習(xí)技術(shù),并進(jìn)行了廣泛的AI業(yè)務(wù)實踐。從2019年開始,百度就深耕預(yù)模型研發(fā),打造了文心大模型體系。厚積薄發(fā),做足準(zhǔn)備的文心,在開年之際就達(dá)成了一路領(lǐng)先。

2023年7月,在2023世界人工智能大會期間,國家人工智能標(biāo)準(zhǔn)化總體組宣布了中國首個大模型標(biāo)準(zhǔn)化專題組組長單位名單,百度擔(dān)任聯(lián)合組長單位。至此,文心大模型正式進(jìn)入“大模型國家隊”,為國產(chǎn)大模型標(biāo)準(zhǔn)化事業(yè)探尋航道,確立方向。

wKgZomXCSpOASwPuAACm-8e2TvU488.jpg

接下來,在8月31日,文心一言正式面向全社會開放,成為中國公眾能夠最早體驗到的大語言模型,真正將大模型能力帶到千家萬戶,尋常巷陌。

2013年12月,中國首個官方“大模型標(biāo)準(zhǔn)符合性評測”結(jié)果出爐。文心一言成為首批通過評測,符合《人工智能大規(guī)模預(yù)訓(xùn)練模型 第2部分:評測指標(biāo)與方法》語言大模型的相關(guān)技術(shù)要求,通用性、智能性等維度全面達(dá)到國家相關(guān)標(biāo)準(zhǔn)。

最先推出,最新開放,最先符合國家標(biāo)準(zhǔn),“先”已經(jīng)成為文心大模型的關(guān)鍵詞。深耕AI核心技術(shù),打造AI生態(tài),帶來的是厚積薄發(fā)下的高效率與快節(jié)奏。

文心之先,一騎絕塵,可以為整個AI行業(yè)所借鑒。

技術(shù)做厚:大模型的技術(shù)差異化積累

在我們討論AI大模型數(shù)量過多,行業(yè)飽和的問題時,經(jīng)常會注意到一個現(xiàn)象:數(shù)百個大模型問世,但我們卻很難找到這些大模型之間的技術(shù)差異化有哪些?更遑論體會到技術(shù)差異帶來了應(yīng)用差異。

這個現(xiàn)象出現(xiàn)的原因,在于大模型盲目追求數(shù)據(jù)量與模型參數(shù),忽視了核心技術(shù)的研發(fā)與積累。文心大模型之所以反響好,用戶認(rèn)同高,就在于它選擇了最厚重,最扎實的技術(shù)研發(fā)之路。每一代文心大模型升級,都建立在新技術(shù)能力的研發(fā)與運用基礎(chǔ)上。這就導(dǎo)致文心越升級,與其他大模型的技術(shù)能力差距就越大。技術(shù)的滾雪球現(xiàn)象開始顯現(xiàn),最終形成了文心大模型在技術(shù)方面“人無我有,人有我優(yōu)”的戰(zhàn)略優(yōu)勢。堆山百仞,起于壘土。

2023年發(fā)布的文心一言背后,是文心大模型3.0。當(dāng)時文心已經(jīng)憑借知識增強技術(shù)確立了大模型領(lǐng)域的技術(shù)差異化,具備知識增強、檢索增強和對話增強的優(yōu)勢。

隨后到5月,文心大模型3.5版本發(fā)布。其在基礎(chǔ)模型、精調(diào)技術(shù)、知識點增強、邏輯推理、插件機制等方面進(jìn)行了創(chuàng)新,取得了生成效果和效率的全面提升。

wKgaomXCSpOAVGvoAAJUClTg10s566.jpg

到了10月,文心大模型4.0版本正式推出。其在多個關(guān)鍵技術(shù)方向上實現(xiàn)了突破,在理解、生成、邏輯、記憶四大能力上都有顯著提升。尤其邏輯和記憶能力大幅提升,帶給用戶非常直觀的幫助。

文心大模型能夠?qū)崿F(xiàn)如此高效率、大幅度的技術(shù)升級,離不開其背后高效算力、自研框架,以及數(shù)據(jù)處理機制的協(xié)同優(yōu)化。尤其文心飛槳聯(lián)合調(diào)優(yōu),成為業(yè)界著名的大模型高速發(fā)展案例,在過去一年受到了AI行業(yè)的廣泛討論。

文心大模型在萬卡算力上基于飛槳平臺,通過集群基礎(chǔ)設(shè)施和調(diào)度系統(tǒng)、飛槳框架的軟硬協(xié)同優(yōu)化,支持了大模型的穩(wěn)定高效訓(xùn)練。自2023年3月發(fā)布以來,文心大模型的訓(xùn)練效率已提升數(shù)倍,周均訓(xùn)練有效率已經(jīng)超過98%。

對核心技術(shù)的探索,對技術(shù)差異化的積累,讓文心大模型有了技術(shù)之厚。這是文心持續(xù)領(lǐng)先的底牌與底色。只要在技術(shù)上有更高追求,很多問題就自然會有答案。

應(yīng)用需廣:如何將大模型帶到應(yīng)用一線?

想要知道一棵樹是不是棟梁之材,不能僅僅坐而論道,把它夸得天花亂墜,而是要把它真正用起來,讓它去架梁持屋,發(fā)揮自己的價值。

對于AI大模型來說也是如此。大模型是否有用,不是在發(fā)布會和測試數(shù)據(jù)里說出來的,而是在億萬用戶,在千行百業(yè)手里用出來的。

審視過往一年的大模型行業(yè)發(fā)展,我們會發(fā)現(xiàn)在應(yīng)用的廣度上,文心是其他大模型難以望其項背的。在C端用戶,只有文心一言實現(xiàn)了億級用戶規(guī)模;在B端應(yīng)用,文心大模型的調(diào)用量超過了其他200家大模型的總和。

跨越數(shù)量級的應(yīng)用領(lǐng)先,讓文心大模型在行業(yè)用戶、開發(fā)者、普通用戶手中探索出了無數(shù)種價值可能。在百度業(yè)務(wù)當(dāng)中,文心大模型已大規(guī)模應(yīng)用于搜索、信息流、智能音箱等互聯(lián)網(wǎng)產(chǎn)品;在對外開放過程中,文心大模型通過飛槳開源開放平臺、百度智能云賦能制造、能源、金融、通信、媒體、城市、教育等各行各業(yè)。文心大模型已與各行業(yè)頭部企業(yè)、機構(gòu)共建了超過10個行業(yè)大模型,加速行業(yè)智能化升級。

wKgZomXCSpSAMTQlAABZA7Ofsr0869.jpg

在國家跳水隊,文心大模型對AI輔助訓(xùn)練系統(tǒng)進(jìn)行了全面升級,不僅能夠理解和執(zhí)行教練與運動員的復(fù)雜指令,還可以對動作實時打分、精準(zhǔn)量化分析。2023年,中國游泳協(xié)會授予百度“中國國家跳水隊人工智能合作伙伴”稱號。

wKgaomXCSpSARZiJAAbuoKFogo0978.jpg

在與國家圖書館的合作中,文心大模型通過大量學(xué)習(xí)古代方志和家譜數(shù)據(jù),并進(jìn)行文字識別和理解,打造了“古文今問”服務(wù)。用戶只需輸入尋根信息,就能得到相應(yīng)的線索反饋,幫助全球華人尋根訪祖。

在聲橋 AI 語訓(xùn)團隊手中,基于飛槳和文心大模型打造的 AI 口語康復(fù)應(yīng)用,可以提供文字形式的反饋指導(dǎo),幫助聽障人士進(jìn)行語言訓(xùn)練。

桃李不言,下自成蹊。文心的應(yīng)用之廣,是其價值最好的證明。同時也證明了中國的AI大模型并不只有數(shù)量,更有應(yīng)用的質(zhì)量,有真材實料的智能化探索。

生態(tài)需盛:大模型生態(tài)建設(shè)刻不容緩

我們都知道,做軟件最難的就是做生態(tài)。生態(tài)決定了基礎(chǔ)軟件技術(shù)的探索上限,也決定了其未來長期發(fā)展的可能性。在AI技術(shù)剛剛發(fā)展起來時,做AI必須做生態(tài)就成為產(chǎn)業(yè)共識。

但在目前階段,我們可以看到中國有數(shù)量過百的大模型,卻很少有廠商關(guān)注生態(tài)建設(shè)。長此以往,容易導(dǎo)致大模型變成沒人會用,也沒人想用的“孤品”。

文心大模型之所以能保持領(lǐng)先,很大一部分原因來自生態(tài)的支持與推動。只有千萬人共建、共創(chuàng)的大模型,才是有生命力和持久力的大模型。

為此,百度推進(jìn)飛槳與文心生態(tài)共同創(chuàng)新、相互促進(jìn)。截止2023年12月,飛槳已凝聚1070萬開發(fā)者,服務(wù)23.5萬家企事業(yè)單位,基于飛槳創(chuàng)建了86萬個模型。飛槳生態(tài)與文心生態(tài)互為助力,推動彼此高速發(fā)展。

wKgZomXCSpWAWWaXAABUg6N9gdE983.jpg

開發(fā)者社區(qū)是生態(tài)發(fā)展的關(guān)鍵支撐,百度打造了中國最大AI社區(qū)“星河社區(qū)”,伴隨大模型的發(fā)展,百度正式推出星河大模型社區(qū),為開發(fā)者提供一體化大模型開發(fā)體驗,以及豐富的產(chǎn)品功能。截至2023年12月,星河大模型社區(qū)已經(jīng)推出了超過4000個基于文心大模型的創(chuàng)新AI應(yīng)用。

在生態(tài)共創(chuàng)方面,百度發(fā)布了文心大模型星河共創(chuàng)計劃,希望與開發(fā)者和生態(tài)伙伴合作,實現(xiàn)AI應(yīng)用的廣泛創(chuàng)新。

與開發(fā)者生態(tài)的相輔相成的,是人才生態(tài)的建設(shè)。2020年,百度提出“5年為全社會培養(yǎng)500萬人工智能人才”的目標(biāo)。截至2023年10月,百度已經(jīng)培養(yǎng)了420萬AI人才。面對大模型技術(shù)巨大的人才需求,2023年百度發(fā)布了全新的人才培養(yǎng)星河計劃,將與產(chǎn)學(xué)研各界合作,為社會再培養(yǎng)500萬大模型人才。

無論從開發(fā)者聚合、應(yīng)用創(chuàng)新、人才培養(yǎng)等任何維度來看,文心大模型的生態(tài)建設(shè)都已經(jīng)展現(xiàn)出了繁盛的一面。生態(tài)起步快,活力高,受眾廣,真正實現(xiàn)文心大模型的土壤上“千樹萬樹梨花開”。

可以說,文心生態(tài)的興起,為國產(chǎn)大模型生態(tài)的整體建設(shè)奠定了典范,拓寬了邊界。

從大模型元年,到AGI曙光

經(jīng)過風(fēng)起云涌的一年,大模型領(lǐng)域的問題,從“有沒有大模型”,變成了“能不能做好大模型”“能不能用好大模型”。

面對新問題,新考驗,文心大模型在身位、技術(shù)、應(yīng)用、生態(tài)四個方面的領(lǐng)先就是答案。

根據(jù)IDC《AI大模型技術(shù)能力評估報告,2023》顯示,文心大模型在14個參評模型中拿下12項指標(biāo)的7個滿分,綜合評分位列國內(nèi)主流大模型第一,并在算法模型、行業(yè)覆蓋兩大關(guān)鍵指標(biāo)上拿下唯一滿分。

在人民數(shù)據(jù)發(fā)布的《AI大模型綜合能力測評報告》中顯示,文心一言不僅綜合評分超越ChatGPT,位居全球第一,更在內(nèi)容生態(tài)、數(shù)據(jù)認(rèn)知、知識問答三大維度評分超越ChatGPT。并且六大維度評分均位列國內(nèi)大模型榜首。

如果說,在大模型元年,我們看到的是大模型的數(shù)量。

那么在更遠(yuǎn)的未來,在我們所期待的大模型之春,需要看到的是大模型的應(yīng)用質(zhì)量和普惠價值。

如何才能實現(xiàn)這個進(jìn)化?文心大模型已經(jīng)在過去一年,用“先”“厚”“廣”“盛”這四個字做出了回答。只有整個行業(yè)都以這樣的路徑發(fā)展,去蕪存菁,避虛務(wù)實,國產(chǎn)大模型才能持續(xù)向好,打開行業(yè)之春,走向AGI之夏。

wKgaomXCSpaAGC45AAZ2n9EoH_g057.jpg

2023年8月16日,WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會2023在北京舉行。期間,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰表示,人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的基礎(chǔ)能力,這四項能力越強,越接近通用人工智能,而大語言模型具備了這四項能力,為通用人工智能帶來曙光。

在這場人類科技面向星辰大海的航行中,我們已經(jīng)見到了曙光,只有找到正確的方向,選擇技術(shù)長跑,選擇生態(tài)共贏,才能讓漫長的征程一步步落地,讓AGI的曙光點點化為現(xiàn)實。

“百模趕考,文心奪魁”的行業(yè)格局,本質(zhì)上是對技術(shù)主義與務(wù)實精神的肯定。

理解了這一點,也就找到了AI技術(shù)發(fā)展的前路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268885
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1558

    瀏覽量

    7592
  • 文心一言
    +關(guān)注

    關(guān)注

    0

    文章

    124

    瀏覽量

    1275
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2423

    瀏覽量

    2640
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    315

    瀏覽量

    305
收藏 人收藏

    評論

    相關(guān)推薦

    模型日均調(diào)用量超15億

    近日,度在上海世博中心舉辦了主題為“應(yīng)用來了”的度世界2024大會。會上,度董事長李彥宏分享了關(guān)于大模型行業(yè)的最新動態(tài)和
    的頭像 發(fā)表于 11-12 15:28 ?278次閱讀

    李彥宏宣布:模型日調(diào)用量超15億

    度世界2024大會上,度公司創(chuàng)始人李彥宏宣布了一項令人矚目的數(shù)據(jù):模型的日調(diào)用量
    的頭像 發(fā)表于 11-12 10:40 ?201次閱讀

    模型4.0免費了 心智能體平臺免費開放模型4.0

    據(jù)悉;7月5日起 心智能體平臺(AgentBuilder) 免費開放模型4.0。 開發(fā)者在
    的頭像 發(fā)表于 07-06 17:12 ?1218次閱讀

    度發(fā)布智能代碼助手“快碼”

    在近日舉辦的WAVE SUMMIT大會上,度公司震撼發(fā)布了全新的智能代碼助手——“快碼”。這款基于
    的頭像 發(fā)表于 07-01 11:20 ?897次閱讀

    度發(fā)布模型4.0 Turbo與飛槳框架3.0,引領(lǐng)AI技術(shù)新篇章

    SUMMIT深度學(xué)習(xí)開發(fā)者大會2024上,向世界展示了度在AI領(lǐng)域的最新成果——模型4.0 Turbo和飛槳框架3.0,并詳細(xì)披露
    的頭像 發(fā)表于 06-29 16:03 ?627次閱讀

    模型4.0 Turbo,正式發(fā)布 用戶規(guī)模已達(dá)3億

    的最新數(shù)據(jù),并正式發(fā)布模型4.0 Turbo、飛槳框架3.0等最新技術(shù),披露飛槳生態(tài)最新成果。 ?01?
    的頭像 發(fā)表于 06-29 10:06 ?853次閱讀

    模型擴展合作領(lǐng)域

    度創(chuàng)始人兼CEO李彥宏在2024年第一季度財報電話會上宣布,模型API在繼與中國三星、榮耀成功合作后,本季度再度實現(xiàn)重要突破。小米、OPPO、vivo等主流手機廠商已全面接入
    的頭像 發(fā)表于 05-17 11:17 ?558次閱讀

    李彥宏高度評價一言模型AI技術(shù),強調(diào)商業(yè)化將持續(xù)推進(jìn)

    據(jù)了解,目前已有近10萬家企業(yè)使用了一言的能力,其中10%的大搜流量由該模型產(chǎn)生,每日有250萬用戶受益于文庫的AI功能。未來,度計劃
    的頭像 發(fā)表于 05-11 10:44 ?514次閱讀

    度首席技術(shù)官王海峰解讀模型的關(guān)鍵技術(shù)和最新進(jìn)展

    4月16日,以“創(chuàng)造未來”為主題的Create 2024AI開發(fā)者大會在深圳國際會展中心成功舉辦。度首席技術(shù)官王海峰以“技術(shù)筑基,星河璀璨”為題,發(fā)表演講,解讀了智能體、代碼、多模型
    的頭像 發(fā)表于 04-18 09:20 ?691次閱讀
    <b class='flag-5'>百</b>度首席技術(shù)官王海峰解讀<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>的關(guān)鍵技術(shù)和最新進(jìn)展

    一言用戶破2億,AI原生應(yīng)用開發(fā)數(shù)量達(dá)19萬

    此外,李彥宏還提到,度在去年 8 月宣布開放一言后,不僅在C端借助大模型改造用戶產(chǎn)品,將AI功能融入旗下多款產(chǎn)品;同時在B端,通過云業(yè)
    的頭像 發(fā)表于 04-16 15:05 ?606次閱讀

    優(yōu)必選宣布人形機器人Walker S接入模型

    優(yōu)必選宣布人形機器人Walker S接入模型,共同探索中國AI模型+人形機器人的應(yīng)用
    的頭像 發(fā)表于 04-07 10:17 ?911次閱讀

    度攜手三星,模型日調(diào)用量破5000萬次

     值得一提的是,此前三星在其旗艦手機GalaxyS24系列新品發(fā)布會上宣布,與度智能云達(dá)成AI生態(tài)戰(zhàn)略合作伙伴關(guān)系。據(jù)悉,GalaxyAI深度整合了來自
    的頭像 發(fā)表于 02-29 10:22 ?675次閱讀

    是德科技如何賦能醫(yī)療AI模型應(yīng)用呢?

    自從ChatGPT爆火以來,各種AI模型紛紛亮相,如度科技的一言,科大訊飛的訊飛星火,華為的盤古
    的頭像 發(fā)表于 02-28 09:35 ?2350次閱讀

    三星Galaxy AI集成模型

    近日,中國三星與度智能云宣布正式結(jié)成AI生態(tài)戰(zhàn)略合作伙伴,共同推動AI技術(shù)在智能手機等設(shè)備上的應(yīng)用。作為這一合作的一部分,三星Galaxy AI深度集成了
    的頭像 發(fā)表于 01-29 17:03 ?1226次閱讀

    模型首批通過大模型標(biāo)準(zhǔn)符合性測試

    12月22日,在全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會人工智能分委會全體會議上,模型首批通過大模型標(biāo)準(zhǔn)符合性測試。
    的頭像 發(fā)表于 12-28 11:33 ?624次閱讀
    <b class='flag-5'>百</b>度<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>首批通過大<b class='flag-5'>模型</b>標(biāo)準(zhǔn)符合性測試
    RM新时代网站-首页