RM公司,新时代软件下载

大語(yǔ)言模型推理的改進(jìn)

LLM 的發(fā)展仍保持著驚人的速度。盡管現(xiàn)有的 LLM 已經(jīng)具備強(qiáng)大的功能，但通過(guò) OpenVINO 的優(yōu)化和推理加速，可以對(duì)這些復(fù)雜模型的執(zhí)行進(jìn)行精煉，實(shí)現(xiàn)更快、更高效的處理，減少計(jì)算開(kāi)銷(xiāo)并最大限度發(fā)揮硬件潛力，這將直接導(dǎo)致 LLM 實(shí)現(xiàn)更高的吞吐量和更低的延遲。

通過(guò)采用壓縮嵌入實(shí)現(xiàn)額外優(yōu)化，有效地縮減了 LLM 的編譯耗時(shí)與內(nèi)存占用。與此同時(shí)，基于英特爾銳炫GPU，以及英特爾高級(jí)矩陣擴(kuò)展（Intel AMX）的第4代和第5代英特爾至強(qiáng)平臺(tái)之上，LLM 的第一個(gè) token 處理性能得到了顯著提升。

通過(guò) oneDNN 可實(shí)現(xiàn)更好的 LLM 壓縮與性能提升。如今，經(jīng)過(guò)量化或壓縮后的 INT4 和 INT8 精度的 LLM 可在英特爾銳炫GPU 上得到支持。在搭載集成 GPU 的英特爾酷睿Ultra 處理器上，針對(duì)部分小型 GenAI 模型顯著減少了內(nèi)存消耗。

此外，現(xiàn)在可以在 PyTorch 模型進(jìn)行訓(xùn)練后量化之后，對(duì)其進(jìn)行微調(diào)，以提高模型精度并簡(jiǎn)化從訓(xùn)練后量化過(guò)渡到訓(xùn)練感知量化的過(guò)程。

已添加演示示例：https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

更多生成式 AI 覆蓋范圍和框架集成

進(jìn)一步深入了解搭載 OpenVINO 的生成式 AI，該新版本拓寬了生成式AI的邊界，使其能夠覆蓋更廣泛的神經(jīng)網(wǎng)絡(luò)架構(gòu)與應(yīng)用場(chǎng)景。

針對(duì)最新發(fā)布的最先進(jìn)的 Llama 3 和 Phi3 模型， OpenVINO 對(duì)其實(shí)現(xiàn)了支持和優(yōu)化。

具備混合專(zhuān)家（MoE）架構(gòu)的 LLM 模型 Mixtral 以及 URLNet 模型，均針對(duì)英特爾至強(qiáng)處理器進(jìn)行了性能提升優(yōu)化。

而文生圖模型 Stable Diffusion 1.5，以及 LLMs 模型 ChatGLM3-6b和Qwen-7B，則專(zhuān)為搭載了集成 GPU 的英特爾酷睿Ultra 處理器進(jìn)行了推理速度的改進(jìn)和優(yōu)化。

現(xiàn)在，OpenVINO 已支持 Falcon-7B-Instruct，這是一款即用型、具備優(yōu)秀性能指標(biāo)的生成式AI大語(yǔ)言模型，適用于聊天與指令場(chǎng)景。

新版本支持的其他模型包括：

Yolo V9、Yolo V8 Oriented Bounding Box Detection （OOB）、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及帶有 OpenVINO 和 LangChain 的 RAG 系統(tǒng)。

我們還在 OpenVINO Notebooks 存儲(chǔ)庫(kù)中提供了 Jupyter Notebook 示例。

新平臺(tái)的更改和現(xiàn)有平臺(tái)的增強(qiáng)

除了 PyPI 上的主 OpenVINO 軟件包外，英特爾酷睿Ultra 處理器的預(yù)覽 NPU 插件現(xiàn)在在 OpenVINO 開(kāi)源 GitHub 存儲(chǔ)庫(kù)中可用。

現(xiàn)在，可以通過(guò) npm 存儲(chǔ)庫(kù)更輕松地訪問(wèn) JavaScript API，使 JavaScript 開(kāi)發(fā)人員能夠無(wú)縫訪問(wèn) OpenVINO API。我們擴(kuò)展了文檔，可幫助開(kāi)發(fā)人員將他們的 JavaScript 應(yīng)用程序與 OpenVINO 集成。

現(xiàn)在，默認(rèn)情況下已在 ARM 處理器上為卷積神經(jīng)網(wǎng)絡(luò)（CNN）啟用 FP16 推理。在多種 ARM 設(shè)備上，已顯著提升了眾多模型的性能。已實(shí)現(xiàn)與 CPU 架構(gòu)無(wú)關(guān)的構(gòu)建，旨在為不同 ARM 設(shè)備提供統(tǒng)一的二進(jìn)制分發(fā)。

新增和更新的 Notebook

OpenVINO Notebooks 仍然是非常有價(jià)值的資源，用于展示如何利用 OpenVINO 在人工智能領(lǐng)域?qū)崿F(xiàn)重要進(jìn)展。最近，我們對(duì) OpenVINO notebooks 存儲(chǔ)庫(kù)做了一些改動(dòng)，包括將默認(rèn)分支從 'main' 更改為 'latest'，以及對(duì) "notebooks" 文件夾內(nèi) notebook 的命名結(jié)構(gòu)進(jìn)行了改進(jìn)。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

GPU芯片

GPU芯片

+關(guān)注

關(guān)注
1

文章
303

瀏覽量
5804
生成式AI

生成式AI

+關(guān)注

關(guān)注
0

文章
502

瀏覽量
471
OpenVINO

OpenVINO

+關(guān)注

關(guān)注
0

文章
92

瀏覽量
196

原文標(biāo)題：解鎖 LLM 新高度，拓寬模型新邊界 —— OpenVINO? 2024.1 賦能生成式 AI 高效運(yùn)行 | 開(kāi)發(fā)者實(shí)戰(zhàn)

文章出處：【微信號(hào)：英特爾物聯(lián)網(wǎng)，微信公眾號(hào)：英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

三行代碼完成生成式AI部署

OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分為兩個(gè)安裝包分別是基礎(chǔ)包與生成式AI支持包，新發(fā)布的Ge

發(fā)表于 08-30 16:49 ?410次閱讀

三行代碼完成<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>部署

高通第三代驍龍7s移動(dòng)平臺(tái)發(fā)布,賦能中端智能手機(jī)以卓越AI新體驗(yàn)

式AI技術(shù)，并兼容包括Baichuan-7B及擁有10億參數(shù)的Llama 2在內(nèi)的大型語(yǔ)言模型（LLM），極大地推動(dòng)了智能手機(jī)智能化進(jìn)程的新高度。

發(fā)表于 08-21 15:42 ?2192次閱讀

亞馬遜云科技賦能Shulex打造基于生成式AI的客服和消費(fèi)者洞察

"Shulex"）在亞馬遜云科技的技術(shù)賦能下，打造基于生成式AI的"AI Agent客服機(jī)器人"

發(fā)表于 08-13 20:38 ?284次閱讀

使用OpenVINO GenAI API的輕量級(jí)生成式AI

隨著 ChatGPT 等聊天機(jī)器人的風(fēng)暴席卷全球，生成式預(yù)訓(xùn)練 Transformers （GPT）在開(kāi)發(fā)者中正在成為家喻戶(hù)曉的新名字。生成式 A

發(fā)表于 07-24 15:08 ?579次閱讀

商湯發(fā)布《2024生成式AI賦能教育未來(lái)》白皮書(shū)

生成式AI正在各個(gè)行業(yè)中展現(xiàn)出巨大的應(yīng)用前景。在關(guān)系國(guó)計(jì)民生的教育行業(yè)，生成式AI能夠催生哪些創(chuàng)

發(fā)表于 06-29 09:48 ?838次閱讀

Wayve邁入AV 2.0新時(shí)代,生成式AI賦能

NVIDIA DRIVE Thor。NVIDIA DRIVE Thor 采用 NVIDIA Blackwell GPU 架構(gòu)，專(zhuān)為T(mén)ransformer、大語(yǔ)言模型（LLM）和生成式 AI

發(fā)表于 06-07 15:14 ?1002次閱讀

亞馬遜云科技攜手SAP通過(guò)生成式AI解鎖創(chuàng)新潛力

科技與SAP宣布擴(kuò)大戰(zhàn)略合作，旨在革新現(xiàn)代化的云ERP體驗(yàn)，并利用生成式AI為企業(yè)帶來(lái)全新功能與效率提升。雙方將共同努力，簡(jiǎn)化客戶(hù)在亞馬遜云科技上采用RISE with SAP解決方案的流程，提高SAP工作負(fù)載在云端

發(fā)表于 06-07 10:53 ?335次閱讀

Arm平臺(tái)賦能移動(dòng)端生成式AI

生成式人工智能 (Generative AI) 涵蓋了當(dāng)下廣為人知，且備受關(guān)注的大語(yǔ)言模型 (LLM)，如今也已落地邊緣側(cè)的移動(dòng)設(shè)備。

發(fā)表于 04-26 11:09 ?799次閱讀

生成式 AI 進(jìn)入模型驅(qū)動(dòng)時(shí)代

隨著ChatGPT和大型語(yǔ)言模型(LLM)呈現(xiàn)爆炸式增長(zhǎng)，生成式人工智能(GenerativeAI)成為近來(lái)的一大熱詞。由此引發(fā)了一場(chǎng)爭(zhēng)論：哪種AI

發(fā)表于 04-13 08:12 ?524次閱讀

研揚(yáng)攜手英特爾，聯(lián)合舉辦創(chuàng)AI百城行（武漢站）：用OpenVINO?賦能AI于邊緣計(jì)算平臺(tái)

邊緣計(jì)算作為實(shí)現(xiàn)智能化、高效化數(shù)據(jù)處理的關(guān)鍵技術(shù)，日益受到業(yè)界的廣泛關(guān)注。為了進(jìn)一步推動(dòng)AI邊緣計(jì)算技術(shù)的發(fā)展與應(yīng)用，3月27日研揚(yáng)科技與英特爾在武漢共同舉辦了以“用OpenVINO賦

發(fā)表于 04-04 08:05 ?248次閱讀

亞馬遜云科技助力沐瞳應(yīng)用生成式AI技術(shù)打造卓越游戲體驗(yàn) 賦能業(yè)務(wù)決策

北京 ——2024 年 2 月 21 日 ? 亞馬遜云科技宣布，上海沐瞳科技有限公司（以下簡(jiǎn)稱(chēng)“沐瞳”）應(yīng)用亞馬遜云科技Amazon Bedrock等生成式AI服務(wù)，為玩家打造卓越的游戲體驗(yàn)并

發(fā)表于 02-22 11:20 ?224次閱讀

亞馬遜云科技助力沐瞳應(yīng)用生成式AI技術(shù)打造卓越游戲體驗(yàn) 賦能業(yè)務(wù)決策

北京2024年2月21日?/美通社/ -- 亞馬遜云科技宣布，上海沐瞳科技有限公司（以下簡(jiǎn)稱(chēng)"沐瞳"）應(yīng)用亞馬遜云科技Amazon Bedrock等生成式AI服務(wù)，為玩家打造卓越的游戲體驗(yàn)并賦

發(fā)表于 02-22 09:25 ?418次閱讀

安霸發(fā)布全新N1系列生成式AI芯片

安霸在CES 2024上發(fā)布了全新的N1系列生成式AI芯片，這是一款專(zhuān)門(mén)為前端設(shè)備設(shè)計(jì)的芯片，支持本地運(yùn)行大型語(yǔ)言模型（LLM）應(yīng)用。其單顆

發(fā)表于 01-09 15:32 ?1363次閱讀

安霸發(fā)布N1系列生成式AI芯片支持前端設(shè)備運(yùn)行本地LLM應(yīng)用

單顆 SoC 支持 1 至 340 億參數(shù)的多模態(tài)大模型（Multi-Modal LLM）推理，實(shí)現(xiàn)前端低功耗生成式 AI。

發(fā)表于 01-09 15:19 ?938次閱讀

OpenVINO? 賦能千元級(jí)『哪吒』AI開(kāi)發(fā)套件大語(yǔ)言模型 | 開(kāi)發(fā)者實(shí)戰(zhàn)

，大多數(shù)高性能模型通常需要昂貴的計(jì)算資源，使得它們的應(yīng)用受限于有限的環(huán)境。本文將探討在OpenVINO的賦能下，如何在不足千元的AI開(kāi)發(fā)板上部署Stable-Zeph

發(fā)表于 01-06 08:05 ?1517次閱讀