12月1日,阿里云通義千問720億參數(shù)模型Qwen-72B宣布開源。與此同時(shí),他們還開源了18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。
據(jù)了解,Qwen-72B是基于3T tokens高質(zhì)量數(shù)據(jù)進(jìn)行訓(xùn)練的模型,在10個(gè)權(quán)威基準(zhǔn)測(cè)試中表現(xiàn)出色,超越了閉源的GPT-3.5和GPT-4。
阿里云是國(guó)內(nèi)最早開源自研大模型的科技企業(yè),通義千問是第一個(gè)全尺寸開源的大模型,從18億、70億、140億到720億參數(shù)規(guī)模。用戶可以在魔搭社區(qū)直接體驗(yàn)Qwen系列模型的效果,也可以通過(guò)阿里云靈積平臺(tái)調(diào)用模型API,或者在阿里云百煉平臺(tái)上定制大模型應(yīng)用。此外,阿里云人工智能平臺(tái)PAI為通義千問全系列模型提供了輕量級(jí)微調(diào)、全參數(shù)微調(diào)、分布式訓(xùn)練、離線推理驗(yàn)證、在線服務(wù)部署等服務(wù)。
開源模型Qwen-1.8B在推理2K長(zhǎng)度的文本內(nèi)容時(shí)只需3G顯存,可以在消費(fèi)級(jí)終端上進(jìn)行部署。而Qwen-Audio可以感知和理解各種語(yǔ)音信號(hào),包括人聲、自然聲、動(dòng)物聲和音樂聲等。用戶可以輸入一段音頻,并要求模型對(duì)音頻進(jìn)行理解,甚至進(jìn)行文學(xué)創(chuàng)作、邏輯推理和故事續(xù)寫等任務(wù)。
阿里云CTO周靖人表示,開源生態(tài)對(duì)于推動(dòng)中國(guó)大型模型的技術(shù)進(jìn)步和應(yīng)用實(shí)踐至關(guān)重要。通義千問將繼續(xù)投入開源,并希望成為“AI時(shí)代最開放的大型模型”,與合作伙伴共同推動(dòng)大型模型生態(tài)建設(shè)。
審核編輯:黃飛
-
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238241 -
GPT
+關(guān)注
關(guān)注
0文章
352瀏覽量
15342 -
阿里云
+關(guān)注
關(guān)注
3文章
952瀏覽量
43006 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2640
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論