RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

vLLM項(xiàng)目加入PyTorch生態(tài)系統(tǒng),引領(lǐng)LLM推理新紀(jì)元

jf_23871869 ? 來(lái)源:jf_23871869 ? 作者:jf_23871869 ? 2024-12-18 17:06 ? 次閱讀

近日,vLLM項(xiàng)目宣布正式成為PyTorch生態(tài)系統(tǒng)的一部分,標(biāo)志著該項(xiàng)目與PyTorch的合作進(jìn)入了一個(gè)全新的階段。本文將從以下幾個(gè)方面進(jìn)行介紹,特別提醒:安裝方案在第四個(gè)部分,可選擇性閱讀。

vLLM項(xiàng)目概述

vLLM的成就與實(shí)際應(yīng)用

支持流行模型

安裝與使用vLLM

總結(jié)

一,vLLM項(xiàng)目概述

vLLM是一個(gè)為大型語(yǔ)言模型(LLMs)設(shè)計(jì)的高吞吐量、內(nèi)存高效的推理和服務(wù)引擎。該項(xiàng)目最初基于創(chuàng)新的PagedAttention算法構(gòu)建,如今已經(jīng)發(fā)展成為一個(gè)全面的、最先進(jìn)的推理引擎。vLLM社區(qū)不斷為其添加新功能和優(yōu)化,包括流水線(xiàn)并行處理、分塊預(yù)填充、推測(cè)性解碼和分離服務(wù)。

wKgZPGdikGaARrC8AAMapEZDw_Y377.png

二,vLLM的成就與實(shí)際應(yīng)用

自發(fā)布以來(lái),vLLM獲得了超過(guò)31,000個(gè)GitHub星標(biāo),這一成就證明了其受歡迎程度和社區(qū)的活力。vLLM與PyTorch的深度集成,使其能夠支持包括NVIDIA GPU、AMD GPU、Google Cloud TPU在內(nèi)的多種硬件后端,確保了跨平臺(tái)的兼容性和性能優(yōu)化。

在今年的亞馬遜Prime Day,vLLM在向數(shù)百萬(wàn)用戶(hù)提供快速響應(yīng)中發(fā)揮了關(guān)鍵作用。它在三個(gè)區(qū)域的80,000個(gè)Trainium和Inferentia芯片上,每分鐘處理了300萬(wàn)個(gè)令牌,同時(shí)保持了P99延遲在1秒以?xún)?nèi)的首次響應(yīng)。這意味著,當(dāng)客戶(hù)與亞馬遜應(yīng)用中的Rufus聊天時(shí),他們實(shí)際上是在與vLLM互動(dòng)。

三,支持流行模型

vLLM與領(lǐng)先的模型供應(yīng)商緊密合作,支持包括Meta LLAMA、Mistral、QWen和DeepSeek在內(nèi)的流行模型。特別值得一提的是,vLLM作為首發(fā)合作伙伴,首次啟用了LLAMA 3.1(405B)模型,展示了其處理復(fù)雜和資源密集型語(yǔ)言模型的能力。

wKgZPGdikH2APXfvAAAutVrtNXY766.png

四,安裝與使用vLLM

安裝vLLM非常簡(jiǎn)單,用戶(hù)只需在命令行中運(yùn)行:

pip install vllm

vLLM既可以作為OpenAI API兼容服務(wù)器運(yùn)行,也可以作為一個(gè)簡(jiǎn)單的函數(shù)使用。以下是如何使用vLLM生成文本的示例代碼:

vllm serve meta-llama/Llama-3.1-8B

將vLLM作為簡(jiǎn)單函數(shù)運(yùn)行:

from vllm import LLM, SamplingParams

五,總結(jié)

隨著vLLM的加入,PyTorch生態(tài)系統(tǒng)更加強(qiáng)大,為L(zhǎng)LM服務(wù)帶來(lái)了便捷和高效。期待vLLM在未來(lái)解鎖更多創(chuàng)新,推動(dòng)AI技術(shù)的普及和發(fā)展

如果你有更好的文章,歡迎投稿!

稿件接收郵箱:nami.liu@pasuntech.com

更多精彩內(nèi)容請(qǐng)關(guān)注“算力魔方?”!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9949

    瀏覽量

    171692
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    807

    瀏覽量

    13198
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    286

    瀏覽量

    327
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Arm KleidiAI助力提升PyTorchLLM推理性能

    生成式人工智能 (AI) 正在科技領(lǐng)域發(fā)揮關(guān)鍵作用,許多企業(yè)已經(jīng)開(kāi)始將大語(yǔ)言模型 (LLM) 集成到云端和邊緣側(cè)的應(yīng)用中。生成式 AI 的引入也使得許多框架和庫(kù)得以發(fā)展。其中,PyTorch 作為
    的頭像 發(fā)表于 12-03 17:05 ?733次閱讀
    Arm KleidiAI助力提升<b class='flag-5'>PyTorch</b>上<b class='flag-5'>LLM</b><b class='flag-5'>推理</b>性能

    對(duì)三星而言開(kāi)放生態(tài)系統(tǒng)是什么

    在過(guò)去的五年里,三星投入了大量精力來(lái)建立團(tuán)隊(duì)、文化和流程,成為開(kāi)放生態(tài)系統(tǒng)的積極貢獻(xiàn)者。那么,為什么一家硬件公司會(huì)進(jìn)行這樣的投資?其價(jià)值何在?我們?nèi)绾螌⒂布町惢c開(kāi)源和標(biāo)準(zhǔn)結(jié)合起來(lái)?
    的頭像 發(fā)表于 11-13 15:58 ?311次閱讀

    倒計(jì)時(shí)1天 | 第三屆OpenHarmony技術(shù)大會(huì)——明天,上海見(jiàn)!

    技術(shù)引領(lǐng)生態(tài),萬(wàn)物智聯(lián)創(chuàng)未來(lái) OpenHarmony 開(kāi)源生態(tài) 繁榮于各方共建,又賦能于千行百業(yè) 開(kāi)創(chuàng)了萬(wàn)物智聯(lián)的新紀(jì)元,開(kāi)源盛事,亦是開(kāi)源盛世!
    發(fā)表于 10-11 23:29

    跨越地理限制:動(dòng)態(tài)海外住宅IP技術(shù)引領(lǐng)全球化網(wǎng)絡(luò)新紀(jì)元

    跨越地理限制:動(dòng)態(tài)海外住宅IP技術(shù)引領(lǐng)全球化網(wǎng)絡(luò)新紀(jì)元這一主題,凸顯了動(dòng)態(tài)海外住宅IP技術(shù)在全球化網(wǎng)絡(luò)環(huán)境中的重要作用。
    的頭像 發(fā)表于 09-27 08:30 ?303次閱讀

    能耗管理系統(tǒng)新紀(jì)元:智能科技引領(lǐng)綠色生活風(fēng)尚

    能耗管理系統(tǒng)新紀(jì)元:智能科技引領(lǐng)綠色生活風(fēng)尚 在科技日新月異的今天,我們的生活正經(jīng)歷著前所未有的變革,而能耗管理系統(tǒng)作為連接環(huán)保與可持續(xù)發(fā)展的橋梁,正步入一個(gè)由智能科技
    的頭像 發(fā)表于 08-15 18:17 ?512次閱讀

    LLM大模型推理加速的關(guān)鍵技術(shù)

    LLM(大型語(yǔ)言模型)大模型推理加速是當(dāng)前人工智能領(lǐng)域的一個(gè)研究熱點(diǎn),旨在提高模型在處理復(fù)雜任務(wù)時(shí)的效率和響應(yīng)速度。以下是對(duì)LLM大模型推理加速關(guān)鍵技術(shù)的詳細(xì)探討,內(nèi)容將涵蓋模型壓縮、
    的頭像 發(fā)表于 07-24 11:38 ?855次閱讀

    OpenAI草莓項(xiàng)目:引領(lǐng)人工智能向類(lèi)人推理新紀(jì)元邁進(jìn)

    在人工智能技術(shù)的浩瀚星海中,OpenAI正以其獨(dú)特的“草莓”項(xiàng)目,引領(lǐng)著一場(chǎng)前所未有的智能革命。據(jù)權(quán)威媒體路透社的最新揭秘,這家由微軟鼎力支持的初創(chuàng)企業(yè),正秘密醞釀一項(xiàng)旨在極大提升人工智能推理能力的革命性技術(shù),其代號(hào)——“草莓”
    的頭像 發(fā)表于 07-16 14:37 ?414次閱讀

    蘋(píng)果硬件生態(tài)系統(tǒng)豐富,用戶(hù)黏性大

     蘋(píng)果以其豐富多元的硬件生態(tài)系統(tǒng),涵蓋了從 iPhone 至 Mac 電腦等多種設(shè)備,每個(gè)設(shè)備都有其獨(dú)特的用戶(hù)群體。
    的頭像 發(fā)表于 04-18 11:03 ?480次閱讀

    淺談AMD Ryzen AI PC生態(tài)系統(tǒng)

    AMD與OEM合作伙伴聯(lián)想和華碩,以及生態(tài)系統(tǒng)合作伙伴百川智能、有道、游戲加加、生數(shù)、始智AI等共同努力,共慶龍年,并在大中華區(qū)擴(kuò)展了Ryzen AI生態(tài)系統(tǒng)。
    的頭像 發(fā)表于 04-11 11:05 ?749次閱讀

    萊迪思舉辦2024萊迪思技術(shù)峰會(huì)展示其強(qiáng)大的FPGA合作生態(tài)系統(tǒng)

    萊迪思半導(dǎo)體近日在上海舉辦的2024年萊迪思技術(shù)峰會(huì)上展示了其強(qiáng)大且不斷增長(zhǎng)的全球生態(tài)系統(tǒng),該生態(tài)系統(tǒng)由客戶(hù)、IP和參考平臺(tái)合作伙伴以及致力于推動(dòng)FPGA創(chuàng)新的開(kāi)發(fā)人員組成。
    的頭像 發(fā)表于 03-14 15:10 ?569次閱讀

    Meta欲打造巨型AI覆蓋視頻推薦生態(tài)系統(tǒng)

    Meta正計(jì)劃打造一款巨型AI系統(tǒng),以全面覆蓋其視頻推薦生態(tài)系統(tǒng),為旗下產(chǎn)品提供統(tǒng)一的視頻推薦引擎。
    的頭像 發(fā)表于 03-11 11:14 ?677次閱讀

    HTX DAO生態(tài)系統(tǒng)加入19個(gè)重要建設(shè)者,共同為HTX DAO生態(tài)做出貢獻(xiàn)

    HTX DAO生態(tài)系統(tǒng)加入19個(gè)重要建設(shè)者,共同為HTX DAO生態(tài)做出貢獻(xiàn) 隨著2月2日第十一批HTX DAO生態(tài)建設(shè)者的加入,目前,H
    的頭像 發(fā)表于 02-21 16:46 ?335次閱讀
    HTX DAO<b class='flag-5'>生態(tài)系統(tǒng)</b>已<b class='flag-5'>加入</b>19個(gè)重要建設(shè)者,共同為HTX DAO<b class='flag-5'>生態(tài)</b>做出貢獻(xiàn)

    Renesas Ready生態(tài)系統(tǒng)合作伙伴解決方案介紹

    電子發(fā)燒友網(wǎng)站提供《Renesas Ready生態(tài)系統(tǒng)合作伙伴解決方案介紹.pdf》資料免費(fèi)下載
    發(fā)表于 02-21 09:38 ?0次下載
    Renesas Ready<b class='flag-5'>生態(tài)系統(tǒng)</b>合作伙伴解決方案介紹

    Renesas Ready生態(tài)系統(tǒng)合作伙伴解決方案

    電子發(fā)燒友網(wǎng)站提供《Renesas Ready生態(tài)系統(tǒng)合作伙伴解決方案.pdf》資料免費(fèi)下載
    發(fā)表于 01-14 11:04 ?0次下載
    Renesas Ready<b class='flag-5'>生態(tài)系統(tǒng)</b>合作伙伴解決方案

    芯原攜手趣戴科技擴(kuò)展手表GUI生態(tài)系統(tǒng)

    2024年1月9日,美國(guó)拉斯維加斯——芯原股份 (芯原,股票代碼:688521.SH) 今日宣布專(zhuān)注于提供圖形用戶(hù)界面 (GUI) 軟件服務(wù)的趣戴科技 (QDay Technology) 已加入其手表GUI生態(tài)系統(tǒng),共同開(kāi)發(fā)適用于各種應(yīng)用的智能手表GUI解決方案。
    的頭像 發(fā)表于 01-10 09:06 ?719次閱讀
    RM新时代网站-首页