近日,在2024中國(guó)移動(dòng)全球合作伙伴大會(huì)上,一項(xiàng)關(guān)于大模型評(píng)測(cè)體系建設(shè)的新成果——《通用大模型評(píng)測(cè)標(biāo)準(zhǔn)》正式發(fā)布。這一標(biāo)準(zhǔn)由中國(guó)移動(dòng)攜手工信部中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院、中國(guó)電信、國(guó)家電網(wǎng)、中國(guó)石油以及科大訊飛等產(chǎn)業(yè)各方共同推出。
《通用大模型評(píng)測(cè)標(biāo)準(zhǔn)》旨在為產(chǎn)業(yè)界提供一個(gè)重要的參考依據(jù),幫助各方遴選出優(yōu)質(zhì)的AI大模型。隨著人工智能技術(shù)的快速發(fā)展,大模型在各個(gè)領(lǐng)域的應(yīng)用日益廣泛,因此建立一個(gè)統(tǒng)一、權(quán)威的評(píng)測(cè)標(biāo)準(zhǔn)顯得尤為重要。
此次發(fā)布的評(píng)測(cè)標(biāo)準(zhǔn)將有力推動(dòng)AI大模型技術(shù)的規(guī)范化發(fā)展,促進(jìn)產(chǎn)業(yè)界的技術(shù)交流與合作,為人工智能技術(shù)的進(jìn)一步創(chuàng)新和應(yīng)用奠定堅(jiān)實(shí)基礎(chǔ)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
中國(guó)移動(dòng)
-
人工智能
-
科大訊飛
相關(guān)推薦
剛剛,商湯科技日日新SenseNova多模態(tài)大模型,在權(quán)威綜合評(píng)測(cè)權(quán)威平臺(tái)OpenCompass的多模態(tài)評(píng)測(cè)中取得榜單第一。
發(fā)表于 12-20 10:39
?129次閱讀
的任務(wù)中出錯(cuò)。
(4)缺乏特定領(lǐng)域的知識(shí):沒(méi)學(xué)過(guò),瞎編個(gè)答案蒙一下。
通用大模型就像一個(gè)掌握了大量人類(lèi)通用知識(shí)且具備超強(qiáng)記憶與推理能力的優(yōu)秀學(xué)生,但可能不是某個(gè)垂直領(lǐng)域的專(zhuān)家(比如醫(yī)學(xué)或者法律專(zhuān)家
發(fā)表于 12-04 10:50
CRM流程、使用Copilot等提高員工效率。
但更多的行業(yè)雖然有充分的落地積極性,卻很難看清我們現(xiàn)在擁抱的“大模型”在企業(yè)工作流程中應(yīng)該長(zhǎng)成啥樣。在行業(yè)早期,因?yàn)槿狈?b class='flag-5'>標(biāo)準(zhǔn)化產(chǎn)品,最先落地的也往往是
發(fā)表于 10-28 15:34
工作日內(nèi)未聯(lián)系,視為放棄本次試用評(píng)測(cè)資格!
書(shū)籍介紹
大模型是近年來(lái)引人注目的熱點(diǎn)之一。大模型蓬勃發(fā)展的基礎(chǔ),是針對(duì)其需求設(shè)計(jì)的算力及基礎(chǔ)架構(gòu)。本書(shū)針對(duì)如何為大模型構(gòu)建基礎(chǔ)架構(gòu)進(jìn)行深入
發(fā)表于 08-16 18:33
WAIC 2024期間,中國(guó)移動(dòng)發(fā)起成立人工智能大模型評(píng)測(cè)聯(lián)盟(弈衡),商湯科技作為初創(chuàng)成員受邀加入聯(lián)盟。 人工智能實(shí)現(xiàn)突破發(fā)展,“AI+”評(píng)測(cè)正成為關(guān)鍵一環(huán)。人工智能大模型
發(fā)表于 07-12 14:20
?651次閱讀
,包括口語(yǔ)化表達(dá)、不完整句子和打字錯(cuò)誤等,確保評(píng)測(cè)集貼近實(shí)際使用情境。其次,設(shè)計(jì)問(wèn)題時(shí)應(yīng)加入多種限制條件,如身份信息、寫(xiě)作目的、格式規(guī)范和發(fā)布平臺(tái)等,以精準(zhǔn)評(píng)估模型性能。特別在無(wú)標(biāo)準(zhǔn)答
發(fā)表于 05-07 17:12
4月28日,中國(guó)信通院發(fā)布了由思必馳等多家單位共同編制的國(guó)內(nèi)首個(gè)“汽車(chē)大模型標(biāo)準(zhǔn)”,該標(biāo)準(zhǔn)聚焦汽車(chē)行業(yè)高質(zhì)量發(fā)展,受到央視報(bào)道。
發(fā)表于 04-30 14:49
?2193次閱讀
NVIDIA 于今日發(fā)布人形機(jī)器人通用基礎(chǔ)模型 Project GR00T,旨在進(jìn)一步推動(dòng)其在機(jī)器人和具身智能方面的突破。
發(fā)表于 03-20 10:00
?654次閱讀
對(duì)特定任務(wù)的高效處理上,更重要的是,它在處理多樣化任務(wù)和復(fù)雜場(chǎng)景中的靈活性顯著,甚至能在一定程度上模擬人類(lèi)的思考方式。這種能力的展現(xiàn),標(biāo)志著人工智能從專(zhuān)注于單一任務(wù)的傳統(tǒng)模型向通用人工智能轉(zhuǎn)變,其強(qiáng)大
發(fā)表于 03-18 15:49
近日,零一萬(wàn)物正式發(fā)布Yi大模型API開(kāi)放平臺(tái),為開(kāi)發(fā)者提供通用Chat、200k超長(zhǎng)上下文、多模態(tài)交互等模型。
發(fā)表于 03-17 09:55
?1200次閱讀
評(píng)測(cè)資格!
2022年11月,ChatGPT的問(wèn)世展示了大模型的強(qiáng)大潛能,對(duì)人工智能領(lǐng)域有重大意義,并對(duì)自然語(yǔ)言處理研究產(chǎn)生了深遠(yuǎn)影響,引發(fā)了大模型研究的熱潮。
距ChatGPT問(wèn)世不到一年,截至
發(fā)表于 03-11 15:16
近日,在中國(guó)信通院組織的可信AI大模型標(biāo)準(zhǔn)符合性驗(yàn)證中,華為云的盤(pán)古大模型表現(xiàn)出色,成功通過(guò)了金融大模型標(biāo)準(zhǔn)的符合性驗(yàn)證,并榮獲優(yōu)秀級(jí)(4+
發(fā)表于 03-05 10:12
?637次閱讀
國(guó)際權(quán)威標(biāo)準(zhǔn)性能評(píng)估組織SPEC第35屆年會(huì)日前在美國(guó)舉行。會(huì)上,SPEC組織確定新一年工作計(jì)劃,為推動(dòng)AI算力產(chǎn)業(yè)的更快發(fā)展,國(guó)際最新AI算力評(píng)測(cè)標(biāo)準(zhǔn)SPEC ML即將發(fā)布,該
發(fā)表于 02-24 19:07
?3622次閱讀
近日,大模型開(kāi)源開(kāi)放評(píng)測(cè)體系司南(OpenCompass2.0)正式發(fā)布,旨在為大語(yǔ)言模型、多模態(tài)模型等各類(lèi)
發(fā)表于 02-05 11:28
?1048次閱讀
百川智能近日發(fā)布了超千億參數(shù)的大語(yǔ)言模型Baichuan 3,引發(fā)了業(yè)界的廣泛關(guān)注。這款模型在多個(gè)權(quán)威通用能力評(píng)測(cè)中表現(xiàn)卓越,展現(xiàn)了其強(qiáng)大的
發(fā)表于 01-31 14:58
?837次閱讀
評(píng)論