微軟研究院近期公開發(fā)布了Phi-3系列AI模型,該系列包括mini版(38億參數(shù))、small版(70億參數(shù))以及medium版(140億參數(shù))。
微軟稱,帶有38億參數(shù)的phi-3-mini經(jīng)過3.3萬億token的強(qiáng)化學(xué)習(xí),其基礎(chǔ)表現(xiàn)已經(jīng)超過Mixtral 8x7B及GPT-3.5;此外,該模型可在手機(jī)等移動(dòng)設(shè)備上運(yùn)行,并在phi-2模型(27億參數(shù))的基礎(chǔ)上,進(jìn)一步融合了嚴(yán)格篩選的網(wǎng)絡(luò)數(shù)據(jù)與合成數(shù)據(jù)。
盡管phi-3-mini在語言理解和推理方面已能匹敵大參數(shù)模型,但在TriviaQA等特定任務(wù)中仍受限于模型規(guī)模。
值得注意的是,phi-3-small和phi-3-medium兩款模型在MMLU測試中的得分分別達(dá)到了75.3和78.2。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
微軟
-
移動(dòng)設(shè)備
-
強(qiáng)化學(xué)習(xí)
相關(guān)推薦
2024年4月23日,微軟研究院公布Phi-3系列AI大模型,包含三個(gè)版本:mini(3.8B參數(shù))、small(7B參數(shù))以及medium(14B參數(shù))。
發(fā)表于 08-30 16:58
?581次閱讀
GPT-4. GPT-4o mini的定價(jià)為每百萬輸入標(biāo)記15美分和每百萬輸出標(biāo)記60美分,比之前的前沿模型便宜了一個(gè)數(shù)量級(jí),比GPT-3.5 Turbo便宜了60%以上。
發(fā)表于 07-21 10:20
?1019次閱讀
Anthropic 發(fā)布Claude 3.5 Sonnet最新模型 新模型在推理、知識(shí)和編碼能力評估方面超越了以前的版本和競爭對手
發(fā)表于 06-21 15:43
?795次閱讀
Phi-3-vision 是一種小型多模式語言模型(SLM),主要適用于本地人工智能場景。其模型參數(shù)高達(dá) 42 億,上下文序列包含 128k 個(gè)符號(hào),可滿足各種視覺推理和其他任務(wù)需求。
發(fā)表于 05-28 11:35
?471次閱讀
據(jù)悉,Phi-3-vision 作為微軟 Phi-3 家族的首款多模態(tài)模型,繼承自 Phi-3-mini 的文本理解能力,兼具輕巧便攜特性
發(fā)表于 05-27 15:56
?472次閱讀
近日,英特爾宣布針對微軟的Phi-3家族開放模型,成功驗(yàn)證并優(yōu)化了其跨客戶端、邊緣及數(shù)據(jù)中心的AI產(chǎn)品組合。這一重要舉措旨在提供更為靈活和高效的AI
發(fā)表于 05-27 11:47
?660次閱讀
近日,英特爾針對微軟的多個(gè)Phi-3家族的開放模型,驗(yàn)證并優(yōu)化了其跨客戶端、邊緣和數(shù)據(jù)中心的AI產(chǎn)品組合。
發(fā)表于 05-27 11:15
?571次閱讀
5 月 22 日,微軟Build 2024大會(huì)在美正式開幕。薩提亞·納德拉CEO、董事長宣布,OpenAI新款旗艦模型GPT-4o已經(jīng)在Azure AI Studio上線,并開放API
發(fā)表于 05-22 11:18
?497次閱讀
NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個(gè)開源庫,用于優(yōu)化從 PC 到云端的 NVIDIA GPU 上運(yùn)行的大語言
發(fā)表于 04-28 10:36
?547次閱讀
Meta決定將Llama 3的80億參數(shù)版開源,以期讓更多人能夠接觸到尖端的AI技術(shù)。全球范圍內(nèi)的開發(fā)者、研究員以及對AI充滿好奇的人士均可參與其中,進(jìn)行游戲開發(fā)、模型構(gòu)建與實(shí)驗(yàn)探索。
發(fā)表于 04-19 10:21
?858次閱讀
“我們的模型在識(shí)別各種類型實(shí)體方面都有顯著提升,即使是小尺寸模型,在屏幕實(shí)體識(shí)別準(zhǔn)確性上也已超過原有的系統(tǒng)5%以上。在與GPT-3.5和GPT-4.0的比較中,小型
發(fā)表于 04-02 11:23
?452次閱讀
起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級(jí)至GPT-4取得顯著進(jìn)步,如今再次更新至性能卓
發(fā)表于 03-13 13:42
?723次閱讀
近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型,其中包括最強(qiáng)版Claude 3 Opus。據(jù)該公司稱,Claude
發(fā)表于 03-05 09:58
?646次閱讀
近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語言能力等關(guān)鍵領(lǐng)域展現(xiàn)出卓越
發(fā)表于 03-05 09:49
?679次閱讀
近日,人工智能領(lǐng)域迎來了一場革命性的突破。Anthropic公司發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語言能力等關(guān)鍵指標(biāo)上展現(xiàn)出卓越
發(fā)表于 03-05 09:42
?642次閱讀
評論