在大咖云集的亞馬遜云科技re:Invent 2023全球大會(huì)現(xiàn)場(chǎng),大家最關(guān)注的焦點(diǎn)話(huà)題是什么?
對(duì)于這個(gè)問(wèn)題,相信很多人都會(huì)不假思索地在第一時(shí)間給出答案——生成式AI。
然而生成式AI的應(yīng)用以及大語(yǔ)言模型的訓(xùn)練,都對(duì)算力有著極高的需求。身為全球云計(jì)算開(kāi)拓者和領(lǐng)軍者,亞馬遜云科技認(rèn)為這意味著怎樣的機(jī)遇?同時(shí)又帶來(lái)了怎樣的挑戰(zhàn)?企業(yè)可以通過(guò)生成式AI實(shí)現(xiàn)怎樣的轉(zhuǎn)型升級(jí)?為了滿(mǎn)足客戶(hù)的迫切需求,亞馬遜云科技又提供了怎樣的解決方案?
生成式AI帶來(lái)的機(jī)遇與挑戰(zhàn)
“生成式AI帶來(lái)的機(jī)遇非常明顯,對(duì)吧?大家都已經(jīng)有目共睹?!眮嗰R遜云科技計(jì)算和網(wǎng)絡(luò)副總裁David Brown向趣味科技表示,“我們希望亞馬遜云科技能夠成為運(yùn)行這些工作負(fù)載的最佳場(chǎng)所,并且已經(jīng)為此投入了大量資金和資源。”
David Brown指出,生成式AI的發(fā)展帶來(lái)了極其廣袤的市場(chǎng),通過(guò)與NVIDIA等合作伙伴的攜手合作,以及自研的Amazon Graviton和Amazon Trainium系列定制芯片,亞馬遜云科技正在努力為客戶(hù)提供更好的性?xún)r(jià)比,希望能夠幫助客戶(hù)以更低的成本引入和運(yùn)行他們的模型。
而在挑戰(zhàn)方面,如何幫助客戶(hù)理解生成式AI,以及如何利用生成式AI為客戶(hù)的業(yè)務(wù)服務(wù),是當(dāng)下生成式AI應(yīng)用的難點(diǎn),也是亞馬遜云科技一直在努力的事情。在探索與試驗(yàn)的過(guò)程中,亞馬遜云科技很快意識(shí)到,在Amazon Bedrock模型中為客戶(hù)提供選擇是正確的做法。為此亞馬遜云科技在re:Invent 2023全球大會(huì)上宣布推出Amazon Bedrock更多模型選擇和強(qiáng)大功能,讓用戶(hù)可輕松訪問(wèn)來(lái)自AI21 Labs、Anthropic、Cohere、Meta、Stability AI以及亞馬遜的多種行業(yè)領(lǐng)先的大語(yǔ)言模型和其他模型,從而幫助企業(yè)更加輕松地構(gòu)建適合自身業(yè)務(wù)的定制化生成式AI應(yīng)用,極大地降低了生成式AI應(yīng)用的門(mén)檻。
當(dāng)前面臨的另一項(xiàng)挑戰(zhàn),是如何確保在客戶(hù)需要時(shí)提供足夠的GPU算力。為此亞馬遜云科技一邊持續(xù)在全球范圍內(nèi)構(gòu)建數(shù)據(jù)中心和電力足跡,一邊開(kāi)展了多項(xiàng)技術(shù)和服務(wù)創(chuàng)新,包括推出Capacity Blocks服務(wù),使得即使是在供應(yīng)受限的環(huán)境中,也能夠幫助客戶(hù)找到電源、GPU和加速器,獲得GPU訪問(wèn)權(quán)限,從而支持他們的生成式AI工作負(fù)載。
努力為客戶(hù)提供更好性?xún)r(jià)比
強(qiáng)大的算力自然離不開(kāi)強(qiáng)勁的芯片。在這方面,亞馬遜云科技主要是通過(guò)兩種方式來(lái)實(shí)現(xiàn)自己的目標(biāo)。
一種方式是與NVIDIA的緊密合作。亞馬遜云科技與NVIDIA攜手進(jìn)行了大量投資,將最新的NVIDIA GPU引入亞馬遜云科技。繼成為全球首家提供NVIDIA GH100 Grace Hopper數(shù)據(jù)中心GPU訪問(wèn)的云服務(wù)商之后,NVIDIA創(chuàng)始人、CEO黃仁勛又在re:Invent 2023全球大會(huì)現(xiàn)場(chǎng)宣布,亞馬遜云科技成為全球首家推出NVIDIA GH200 NVL32實(shí)例的云服務(wù)商。
“在數(shù)據(jù)中心運(yùn)行NVIDIA GPU的工作非常具有挑戰(zhàn)性,工程設(shè)計(jì)非常困難,需要世界上最好的供應(yīng)商才能做好這些事情?!盌avid Brown表示,“我認(rèn)為在這方面,亞馬遜云科技確實(shí)比其他任何公司都要出色?!?/p>
另一種方式是投資和設(shè)計(jì)自己的定制芯片。在re:Invent 2023全球大會(huì)上,亞馬遜云科技就宣布其自研芯片家族推出Amazon Graviton4和Amazon Trainium2等新一代產(chǎn)品,為生成式AI應(yīng)用和機(jī)器學(xué)習(xí)訓(xùn)練等廣泛的工作負(fù)載提供了更高的性?xún)r(jià)比和能效。其中Graviton4較上一代產(chǎn)品性能提升30%,獨(dú)立核心增加50%以上,內(nèi)存帶寬提升75%以上;Trainium2較上一代產(chǎn)品訓(xùn)練速度提升4倍,能效提升2倍,并能在EC2 UltraClusters中部署多達(dá)100,000個(gè)芯片。
“芯片是用戶(hù)所有工作負(fù)載的基礎(chǔ),如果你是一個(gè)希望運(yùn)行生成式AI工作負(fù)載的客戶(hù),你自然會(huì)選擇性?xún)r(jià)比最高、對(duì)自己來(lái)說(shuō)最合理的芯片?!盌avid Brown表示,“亞馬遜云科技每一代自研芯片都持續(xù)提升性?xún)r(jià)比和能效,為客戶(hù)提供了基于AMD、Intel以及NVIDIA等的最新芯片和實(shí)例組合之外的更多選擇,這使得Amazon EC2可以為客戶(hù)虛擬運(yùn)行幾乎所有應(yīng)用和工作負(fù)載,同時(shí)也為客戶(hù)提供了更好的性?xún)r(jià)比?!?/p>
利用生成式AI助力企業(yè)轉(zhuǎn)型
如今越來(lái)越多的企業(yè)都對(duì)生成式AI投入了更多的關(guān)注。如何將生成式AI技術(shù)應(yīng)用到自身業(yè)務(wù),如何實(shí)現(xiàn)降本增效,如何為公司帶來(lái)價(jià)值,也成為了廣大企業(yè)正在努力研究的課題。
“生成式AI太新了,許多客戶(hù)都在努力研究如何將這一技術(shù)應(yīng)用到自己的業(yè)務(wù)當(dāng)中。我真正需要思考的主要是兩件事?!盌avid Brown說(shuō)道。
第一件事,是企業(yè)如何利用生成式AI的能力,并想出用這些能力為最終用戶(hù)構(gòu)建什么?David Brown認(rèn)為這是每家企業(yè)都在考慮的事情,實(shí)際上在亞馬遜云科技內(nèi)部,就有團(tuán)隊(duì)通過(guò)機(jī)器學(xué)習(xí)實(shí)驗(yàn)室與客戶(hù)合作,幫助他們構(gòu)建概念證明,以實(shí)際測(cè)試生成式AI可以為客戶(hù)業(yè)務(wù)做些什么。目前在幫助客戶(hù)構(gòu)建生成式AI解決方案方面,亞馬遜云科技已經(jīng)取得了很大的成功。
第二件事,是一旦企業(yè)有了一個(gè)生成式AI解決方案,那么就必須確保公司盈虧能夠負(fù)擔(dān)得起它的運(yùn)行成本。因?yàn)槿绻\(yùn)行成本太高的話(huà),企業(yè)實(shí)際上是無(wú)法實(shí)施部署的。因此亞馬遜云科技所做的就是幫助客戶(hù)找到成本優(yōu)化的方法。無(wú)論是改進(jìn)開(kāi)發(fā)模型的方式,還是通過(guò)像Trainium這樣的自研芯片,亞馬遜云科技都希望能夠真正降低生成式AI應(yīng)用的成本。
在re:Invent 2023全球大會(huì)上,亞馬遜云科技數(shù)據(jù)與機(jī)器學(xué)習(xí)副總裁Swami Sivasubramanian博士在主題演講中重點(diǎn)介紹了亞馬遜云科技推出的生成式AI技術(shù)堆棧。該堆棧包括了底層負(fù)責(zé)訓(xùn)練和推理的基礎(chǔ)設(shè)施層、中間微調(diào)模型需求的工具服務(wù)層、上層構(gòu)建生成式AI應(yīng)用層等三個(gè)重要層級(jí)。通過(guò)對(duì)這三個(gè)層級(jí)的不斷重構(gòu),亞馬遜云科技能夠?yàn)榭蛻?hù)提供更具性?xún)r(jià)比和安全性的技術(shù)與服務(wù),從而利用生成式AI更好地助力企業(yè)轉(zhuǎn)型升級(jí)。
摩爾定律失效但芯片仍在進(jìn)步
說(shuō)起芯片,很多人都會(huì)想起英特爾創(chuàng)始人之一戈登·摩爾多年前提出的大名鼎鼎的“摩爾定律”,也就是集成電路芯片上可容納的晶體管數(shù)目,大約每隔18個(gè)月便會(huì)增加一倍。
在上個(gè)世紀(jì),摩爾定律被證明是有效的,并且著實(shí)推動(dòng)了芯片市場(chǎng)的進(jìn)步。然而近年來(lái),由于晶體管尺寸和制造工藝的限制,摩爾定律也日益逼近極限。NVIDIA CEO黃仁勛就認(rèn)為,這種蠻力增加晶體管的方法基本上已經(jīng)走到了盡頭,從而引發(fā)了眾多業(yè)界人士有關(guān)“摩爾定律是否已死”的爭(zhēng)論。
“摩爾定律的爭(zhēng)論非常有趣,如果我們回到上個(gè)世紀(jì),有時(shí)會(huì)看到英特爾工程師們?cè)跒槿绾巫屜乱话?a target="_blank">CPU晶體管數(shù)量翻倍而絞盡腦汁,有時(shí)又會(huì)看到他們已經(jīng)實(shí)現(xiàn)了晶體管翻倍,反而要為下一代產(chǎn)品故意做一些保留?!闭勂鹉柖傻脑?huà)題,David Brown如是表示,“但是令人驚訝的是,在幾十年后的今天,我們似乎已經(jīng)看到了摩爾定律的極限,因?yàn)楝F(xiàn)階段物理問(wèn)題的限制,我們?cè)诩夹g(shù)上已經(jīng)無(wú)法再使CPU上的晶體管數(shù)量在短期內(nèi)實(shí)現(xiàn)翻倍?!?/p>
David Brown指出,事實(shí)上除了增加晶體管的數(shù)量之外,還有各種各樣的其他方法可以提升芯片的性能,包括改變?cè)O(shè)計(jì)芯片的方式,改變構(gòu)建芯片的方式,改變?yōu)樾酒峁┠芰康姆绞降鹊?。因此即便是摩爾定律失效,也并不意味著芯片不?huì)繼續(xù)創(chuàng)新和提高性能。這就是Amazon Graviton和Amazon Trainium系列芯片向其他芯片制造商展示的意義所在。
審核編輯:黃飛
-
摩爾定律
+關(guān)注
關(guān)注
4文章
634瀏覽量
78998 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4978瀏覽量
102987 -
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268886 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2650瀏覽量
83315 -
AI算力
+關(guān)注
關(guān)注
0文章
72瀏覽量
8652
原文標(biāo)題:生成式AI算力如此緊張,怎樣選擇才最劃算
文章出處:【微信號(hào):funnytechnology,微信公眾號(hào):趣味科技v】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論