相比GPU和GPP，F(xiàn)PGA是深度學(xué)習(xí)的未來？

相比GPU和GPP，FPGA在滿足深度學(xué)習(xí)的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計(jì)算的能力和高效的能耗，F(xiàn)PGA將在一般的深度學(xué)習(xí)應(yīng)用中展現(xiàn)GPU和GPP所沒有的獨(dú)特優(yōu)勢。同時(shí)，算法設(shè)計(jì)工具日漸成熟，如今將FPGA集成到常用的深度學(xué)習(xí)框架已成為可能。未來，F(xiàn)PGA將有效地適應(yīng)深度學(xué)習(xí)的發(fā)展趨勢，從架構(gòu)上確保相關(guān)應(yīng)用和研究能夠自由實(shí)現(xiàn)。
作者：Griffin Lacey Graham Taylor Shawaki Areibi 來源：arxiv
摘要
最近幾年數(shù)據(jù)量和可訪問性的迅速增長，使得人工智能的算法設(shè)計(jì)理念發(fā)生了轉(zhuǎn)變。人工建立算法的做法被計(jì)算機(jī)從大量數(shù)據(jù)中自動習(xí)得可組合系統(tǒng)的能力所取代，使得計(jì)算機(jī)視覺、語音識別、自然語言處理等關(guān)鍵領(lǐng)域都出現(xiàn)了重大突破。深度學(xué)習(xí)是這些領(lǐng)域中所最常使用的技術(shù)，也被業(yè)界大為關(guān)注。然而，深度學(xué)習(xí)模型需要極為大量的數(shù)據(jù)和計(jì)算能力，只有更好的硬件加速條件，才能滿足現(xiàn)有數(shù)據(jù)和模型規(guī)模繼續(xù)擴(kuò)大的需求?，F(xiàn)有的解決方案使用圖形處理單元（GPU）集群作為通用計(jì)算圖形處理單元（GPGPU），但現(xiàn)場可編程門陣列（FPGA）提供了另一個(gè)值得探究的解決方案。日漸流行的FPGA設(shè)計(jì)工具使其對深度學(xué)習(xí)領(lǐng)域經(jīng)常使用的上層軟件兼容性更強(qiáng)，使得FPGA更容易為模型搭建和部署者所用。FPGA架構(gòu)靈活，使得研究者能夠在諸如GPU的固定架構(gòu)之外進(jìn)行模型優(yōu)化探究。同時(shí)，F(xiàn)PGA在單位能耗下性能更強(qiáng)，這對大規(guī)模服務(wù)器部署或資源有限的嵌入式應(yīng)用的研究而言至關(guān)重要。本文從硬件加速的視角考察深度學(xué)習(xí)與FPGA，指出有哪些趨勢和創(chuàng)新使得這些技術(shù)相互匹配，并激發(fā)對FPGA如何幫助深度學(xué)習(xí)領(lǐng)域發(fā)展的探討。

1.簡介
機(jī)器學(xué)習(xí)對日常生活影響深遠(yuǎn)。無論是在網(wǎng)站上點(diǎn)擊個(gè)性化推薦內(nèi)容、在智能手機(jī)上使用語音溝通，或利用面部識別技術(shù)來拍照，都用到了某種形式的人工智能技術(shù)。這股人工智能的新潮流也伴隨著算法設(shè)計(jì)的理念轉(zhuǎn)變。過去基于數(shù)據(jù)的機(jī)器學(xué)習(xí)大多是利用具體領(lǐng)域的專業(yè)知識來人工地“塑造”所要學(xué)習(xí)的“特征”，計(jì)算機(jī)從大量示例數(shù)據(jù)中習(xí)得組合特征提取系統(tǒng)的能力，則使得計(jì)算機(jī)視覺、語音識別和自然語言處理等關(guān)鍵領(lǐng)域?qū)崿F(xiàn)了重大的性能突破。對這些數(shù)據(jù)驅(qū)動技術(shù)的研究被稱為深度學(xué)習(xí)，如今正受到技術(shù)界兩個(gè)重要群體的關(guān)注：一是希望使用并訓(xùn)練這些模型、從而實(shí)現(xiàn)極高性能跨任務(wù)計(jì)算的研究者，二是希望為現(xiàn)實(shí)世界中的新應(yīng)用來部署這些模型的應(yīng)用科學(xué)家。然而，他們都面臨著一個(gè)限制條件，即硬件加速能力仍需加強(qiáng)，才可能滿足擴(kuò)大現(xiàn)有數(shù)據(jù)和算法規(guī)模的需求。
對于深度學(xué)習(xí)來說，目前硬件加速主要靠使用圖形處理單元（GPU）集群作為通用計(jì)算圖形處理單元（GPGPU）。相比傳統(tǒng)的通用處理器（GPP），GPU的核心計(jì)算能力要多出幾個(gè)數(shù)量級，也更容易進(jìn)行并行計(jì)算。尤其是NVIDIA CUDA，作為最主流的GPGPU編寫平臺，各個(gè)主要的深度學(xué)習(xí)工具均用其來進(jìn)行GPU加速。最近，開放型并行程序設(shè)計(jì)標(biāo)準(zhǔn)OpenCL作為異構(gòu)硬件編程的替代性工具備受關(guān)注，而對這些工具的熱情也在高漲。雖然在深度學(xué)習(xí)領(lǐng)域內(nèi)，OpenCL獲得的支持相較CUDA還略遜一籌，但OpenCL有兩項(xiàng)獨(dú)特的性能。首先，OpenCL對開發(fā)者開源、免費(fèi)，不同于CUDA單一供應(yīng)商的做法。其次，OpenCL支持一系列硬件，包括GPU、GPP、現(xiàn)場可編程門陣列（FPGA）和數(shù)字信號處理器（DSP）。
1.1. FPGA
作為GPU在算法加速上強(qiáng)有力的競爭者，F(xiàn)PGA是否立即支持不同硬件，顯得尤為重要。FPGA與GPU不同之處在于硬件配置靈活，且FPGA在運(yùn)行深入學(xué)習(xí)中關(guān)鍵的子程序（例如對滑動窗口的計(jì)算）時(shí)，單位能耗下通常能比GPU提供更好的表現(xiàn)。不過，設(shè)置FPGA需要具體硬件的知識，許多研究者和應(yīng)用科學(xué)家并不具備，正因如此，F(xiàn)PGA經(jīng)常被看作一種行家專屬的架構(gòu)。最近，F(xiàn)PGA工具開始采用包括OpenCL在內(nèi)的軟件級編程模型，使其越來越受經(jīng)主流軟件開發(fā)訓(xùn)練的用戶青睞。
對考察一系列設(shè)計(jì)工具的研究者而言，其對工具的篩選標(biāo)準(zhǔn)通常與其是否具備用戶友好的軟件開發(fā)工具、是否具有靈活可升級的模型設(shè)計(jì)方法以及是否能迅速計(jì)算、以縮減大模型的訓(xùn)練時(shí)間有關(guān)。隨著FPGA因?yàn)楦叱橄蠡O(shè)計(jì)工具的出現(xiàn)而越來越容易編寫，其可重構(gòu)性又使得定制架構(gòu)成為可能，同時(shí)高度的并行計(jì)算能力提高了指令執(zhí)行速度，F(xiàn)PGA將為深度學(xué)習(xí)的研究者帶來好處。
對應(yīng)用科學(xué)家而言，盡管有類似的工具級選擇，但硬件挑選的重點(diǎn)在于最大化提高單位能耗的性能，從而為大規(guī)模運(yùn)行降低成本。所以，F(xiàn)PGA憑借單位能耗的強(qiáng)勁性能，加上為特定應(yīng)用定制架構(gòu)的能力，就能讓深度學(xué)習(xí)的應(yīng)用科學(xué)家受益。
FPGA能滿足兩類受眾的需求，是一個(gè)合乎邏輯的選擇。本文考察FPGA上深度學(xué)習(xí)的現(xiàn)狀，以及目前用于填補(bǔ)兩者間鴻溝的技術(shù)發(fā)展。因此，本文有三個(gè)重要目的。首先，指出深度學(xué)習(xí)領(lǐng)域存在探索全新硬件加速平臺的機(jī)會，而FPGA是一個(gè)理想的選擇。其次，勾勒出FPGA支持深度學(xué)習(xí)的現(xiàn)狀，指出潛在的限制。最后，對FPGA硬件加速的未來方向提出關(guān)鍵建議，幫助解決今后深度學(xué)習(xí)所面臨的問題。
2. FPGA
傳統(tǒng)來說，在評估硬件平臺的加速時(shí)，必須考慮到靈活性和性能之間的權(quán)衡。一方面，通用處理器（GPP）可提供高度的靈活性和易用性，但性能相對缺乏效率。這些平臺往往更易于獲取，可以低廉的價(jià)格生產(chǎn)，并且適用于多種用途和重復(fù)使用。另一方面，專用集成電路（ASIC）可提供高性能，但代價(jià)是不夠靈活且生產(chǎn)難度更大。這些電路專用于某特定的應(yīng)用程序，并且生產(chǎn)起來價(jià)格昂貴且耗時(shí)。
FPGA是這兩個(gè)極端之間的折中。FPGA屬于一類更通用的可編程邏輯設(shè)備（PLD），并且簡單來說，是一種可重新配置的集成電路。因此，F(xiàn)PGA既能提供集成電路的性能優(yōu)勢，又具備GPP可重新配置的靈活性。FPGA能夠簡單地通過使用觸發(fā)器（FF）來實(shí)現(xiàn)順序邏輯，并通過使用查找表（LUT）來實(shí)現(xiàn)組合邏輯?，F(xiàn)代的FPGA還含有硬化組件以實(shí)現(xiàn)一些常用功能，例如全處理器內(nèi)核、通信內(nèi)核、運(yùn)算內(nèi)核和塊內(nèi)存（BRAM）。另外，目前的FPGA趨勢趨向于系統(tǒng)芯片（SoC）設(shè)計(jì)方法，即ARM協(xié)處理器和FPGA通常位于同一芯片中。目前的FPGA市場由Xilinx主導(dǎo)，占據(jù)超過85％的市場份額。此外，F(xiàn)PGA正迅速取代ASIC和應(yīng)用專用標(biāo)準(zhǔn)產(chǎn)品（ASSP）來實(shí)現(xiàn)固定功能邏輯。 FPGA市場規(guī)模預(yù)計(jì)在2016年將達(dá)到100億美元。
對于深度學(xué)習(xí)而言，F(xiàn)PGA提供了優(yōu)于傳統(tǒng)GPP加速能力的顯著潛力。GPP在軟件層面的執(zhí)行依賴于傳統(tǒng)的馮·諾依曼架構(gòu)，指令和數(shù)據(jù)存儲于外部存儲器中，在需要時(shí)再取出。這推動了緩存的出現(xiàn)，大大減輕了昂貴的外部存儲器操作。該架構(gòu)的瓶頸是處理器和存儲器之間的通信，這嚴(yán)重削弱了GPP的性能，尤其影響深度學(xué)習(xí)經(jīng)常需要獲取的存儲信息技術(shù)。相比較而言，F(xiàn)PGA的可編程邏輯原件可用于實(shí)現(xiàn)普通邏輯功能中的數(shù)據(jù)和控制路徑，而不依賴于馮·諾伊曼結(jié)構(gòu)。它們也能夠利用分布式片上存儲器，以及深度利用流水線并行，這與前饋性深度學(xué)習(xí)方法自然契合?，F(xiàn)代FPGA還支持部分動態(tài)重新配置，當(dāng)FPGA的一部分被重新配置時(shí)另一部分仍可使用。這將對大規(guī)模深度學(xué)習(xí)模式產(chǎn)生影響，F(xiàn)PGA的各層可進(jìn)行重新配置，而不擾亂其他層正在進(jìn)行的計(jì)算。這將可用于無法由單個(gè)FPGA容納的模型，同時(shí)還可通過將中間結(jié)果保存在本地存儲以降低高昂的全球存儲讀取費(fèi)用。
最重要的是，相比于GPU，F(xiàn)PGA為硬件加速設(shè)計(jì)的探索提供了另一個(gè)視角。GPU和其它固定架構(gòu)的設(shè)計(jì)是遵循軟件執(zhí)行模型，并圍繞自主計(jì)算單元并行以執(zhí)行任務(wù)搭建結(jié)構(gòu)。由此，為深度學(xué)習(xí)技術(shù)開發(fā)GPU的目標(biāo)就是使算法適應(yīng)這一模型，讓計(jì)算并行完成、確保數(shù)據(jù)相互依賴。與此相反，F(xiàn)PGA架構(gòu)是為應(yīng)用程序?qū)ｉT定制的。在開發(fā)FPGA的深度學(xué)習(xí)技術(shù)時(shí)，較少強(qiáng)調(diào)使算法適應(yīng)某固定計(jì)算結(jié)構(gòu)，從而留出更多的自由去探索算法層面的優(yōu)化。需要很多復(fù)雜的下層硬件控制操作的技術(shù)很難在上層軟件語言中實(shí)現(xiàn)，但對FPGA執(zhí)行卻特別具有吸引力。然而，這種靈活性是以大量編譯（定位和回路）時(shí)間為成本的，對于需要通過設(shè)計(jì)循環(huán)快速迭代的研究人員來說這往往會是個(gè)問題。
除了編譯時(shí)間外，吸引偏好上層編程語言的研究人員和應(yīng)用科學(xué)家來開發(fā)FPGA的問題尤為艱難。雖然能流利使用一種軟件語言常常意味著可以輕松地學(xué)習(xí)另一種軟件語言，但對于硬件語言翻譯技能來說卻非如此。針對FPGA最常用的語言是Verilog和VHDL，兩者均為硬件描述語言（HDL）。這些語言和傳統(tǒng)的軟件語言之間的主要區(qū)別是，HDL只是單純描述硬件，而例如C語言等軟件語言則描述順序指令，并無需了解硬件層面的執(zhí)行細(xì)節(jié)。有效地描述硬件需要對數(shù)字化設(shè)計(jì)和電路的專業(yè)知識，盡管一些下層的實(shí)現(xiàn)決定可以留給自動合成工具去實(shí)現(xiàn)，但往往無法達(dá)到高效的設(shè)計(jì)。因此，研究人員和應(yīng)用科學(xué)家傾向于選擇軟件設(shè)計(jì)，因其已經(jīng)非常成熟，擁有大量抽象和便利的分類來提高程序員的效率。這些趨勢使得FPGA領(lǐng)域目前更加青睞高度抽象化的設(shè)計(jì)工具。

FPGA深度學(xué)習(xí)研究里程碑：
1987VHDL成為IEEE標(biāo)準(zhǔn)
1992GANGLION成為首個(gè)FPGA神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)項(xiàng)目（Cox et al.）
1994Synopsys推出第一代FPGA行為綜合方案
1996VIP成為首個(gè)FPGA的CNN實(shí)現(xiàn)方案（Cloutier et al.）
2005FPGA市場價(jià)值接近20億美元
2006首次利用BP算法在FPGA上實(shí)現(xiàn)5 GOPS的處理能力
2011Altera推出OpenCL，支持FPGA
出現(xiàn)大規(guī)模的基于FPGA的CNN算法研究（Farabet et al.）
2016在微軟Catapult項(xiàng)目的基礎(chǔ)上，出現(xiàn)基于FPGA的數(shù)據(jù)中心CNN算法加速（Ovtcharov et al.）
4. 未來展望
深度學(xué)習(xí)的未來不管是就FPGA還是總體而言，主要取決于可擴(kuò)展性。要讓這些技術(shù)成功解決未來的問題，必須要拓展到能夠支持飛速增長的數(shù)據(jù)規(guī)模和架構(gòu)。FPGA技術(shù)正在適應(yīng)這一趨勢，而硬件正朝著更大內(nèi)存、更少的特征點(diǎn)數(shù)量、更好的互連性發(fā)展，來適應(yīng)FPGA多重配置。英特爾收購了Altera，IBM與Xilinx合作，都昭示著FPGA領(lǐng)域的變革，未來也可能很快看到FPGA與個(gè)人應(yīng)用和數(shù)據(jù)中心應(yīng)用的整合。另外，算法設(shè)計(jì)工具可能朝著進(jìn)一步抽象化和體驗(yàn)軟件化的方向發(fā)展，從而吸引更廣技術(shù)范圍的用戶。
4.1. 常用深度學(xué)習(xí)軟件工具
在深度學(xué)習(xí)最常用的軟件工具中，有些工具已經(jīng)在支持CUDA的同時(shí)，認(rèn)識到支持OpenCL的必要性。這將使得FPGA更容易實(shí)現(xiàn)深度學(xué)習(xí)的目的。雖然據(jù)我們所知，目前沒有任何深度學(xué)習(xí)工具明確表示支持FPGA，不過下面的表格列出了哪些工具正朝支持OpenCL方向發(fā)展：
Caffe，由伯克利視覺與學(xué)習(xí)中心開發(fā)，其GreenTea項(xiàng)目對OpenCL提供非正式支持。Caffe另有支持OpenCL的AMD版本。
Torch，基于Lua語言的科學(xué)計(jì)算框架，使用范圍廣，其項(xiàng)目CLTorch對OpenCL提供非正式支持。
Theano，由蒙特利爾大學(xué)開發(fā)，其正在研發(fā)的gpuarray后端對OpenCL提供非正式支持。
DeepCL，由Hugh Perkins開發(fā)的OpenCL庫，用于訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。
對于剛進(jìn)入此領(lǐng)域、希望選擇工具的人來說，我們的建議是從Caffe開始，因?yàn)樗殖Ｓ?，支持性好，用戶界面簡單。利用Caffe的model zoo庫，也很容易用預(yù)先訓(xùn)練好的模型進(jìn)行試驗(yàn)。
4.2. 增加訓(xùn)練自由度
有人或許以為訓(xùn)練機(jī)器學(xué)習(xí)算法的過程是完全自動的，實(shí)際上有一些超參數(shù)需要調(diào)整。對于深度學(xué)習(xí)尤為如此，模型在參數(shù)量上的復(fù)雜程度經(jīng)常伴隨著大量可能的超參數(shù)組合。可以調(diào)整的超參數(shù)包括訓(xùn)練迭代次數(shù)、學(xué)習(xí)速率、批梯度尺寸、隱藏單元數(shù)和層數(shù)等等。調(diào)整這些參數(shù)，等于在所有可能的模型中，挑選最適用于某個(gè)問題的模型。傳統(tǒng)做法中，超參數(shù)的設(shè)置要么依照經(jīng)驗(yàn)，要么根據(jù)系統(tǒng)網(wǎng)格搜索或更有效的隨機(jī)搜索來進(jìn)行。最近研究者轉(zhuǎn)向了適應(yīng)性的方法，用超參數(shù)調(diào)整的嘗試結(jié)果為配置依據(jù)。其中，貝葉斯優(yōu)化是最常用的方法。
不管用何種方法調(diào)整超參數(shù)，目前利用固定架構(gòu)的訓(xùn)練流程在某種程度上局限了模型的可能性，也就是說，我們或許只在所有的解決方案中管窺了一部分。固定架構(gòu)讓模型內(nèi)的超參數(shù)設(shè)置探究變得很容易（比如，隱藏單元數(shù)、層數(shù)等），但去探索不同模型間的參數(shù)設(shè)置變得很難（比如，模型類別的不同），因?yàn)槿绻鸵粋€(gè)并不簡單符合某個(gè)固定架構(gòu)的模型來進(jìn)行訓(xùn)練，就可能要花很長時(shí)間。相反，F(xiàn)PGA靈活的架構(gòu)，可能更適合上述優(yōu)化類型，因?yàn)橛肍PGA能編寫一個(gè)完全不同的硬件架構(gòu)并在運(yùn)行時(shí)加速。
4.3. Low power compute clusters低耗能計(jì)算節(jié)點(diǎn)集群
深度學(xué)習(xí)模型最讓人著迷的就是其拓展能力。不管是為了從數(shù)據(jù)中發(fā)現(xiàn)復(fù)雜的高層特征，還是為數(shù)據(jù)中心應(yīng)用提升性能，深度學(xué)習(xí)技術(shù)經(jīng)常在多節(jié)點(diǎn)計(jì)算基礎(chǔ)架構(gòu)間進(jìn)行拓展。目前的解決方案使用具備Infiniband互連技術(shù)的GPU集群和MPI，從而實(shí)現(xiàn)上層的并行計(jì)算能力和節(jié)點(diǎn)間數(shù)據(jù)的快速傳輸。然而，當(dāng)大規(guī)模應(yīng)用的負(fù)載越來越各不相同，使用FPGA可能會是更優(yōu)的方法。FPGA的可編程行允許系統(tǒng)根據(jù)應(yīng)用和負(fù)載進(jìn)行重新配置，同時(shí)FPGA的能耗比高，有助于下一代數(shù)據(jù)中心降低成本。

閱讀全文

FPGA(591969) FPGA(591969)
gpu(126254) gpu(126254)
機(jī)器學(xué)習(xí)(130422) 機(jī)器學(xué)習(xí)(130422)

FPGA比CPU和GPU快的原理是什么

本文首先闡述了FPGA的原理了，其次分析了FPGA比CPU和GPU快的原理，最后闡述了CPU與GPU的區(qū)別。

2018-05-31 09:00:29

15956

看FPGA如何擊敗GPU和GPP

本文從硬件加速的視角考察深度學(xué)習(xí)與FPGA，指出有哪些趨勢和創(chuàng)新使得這些技術(shù)相互匹配，并激發(fā)對FPGA如何幫助深度學(xué)習(xí)領(lǐng)域發(fā)展的探討。

2016-03-24 13:41:06

2481

深度學(xué)習(xí)框架只為GPU? 答案在這里

目前大多數(shù)的機(jī)器學(xué)習(xí)是在處理器上完成的，大多數(shù)機(jī)器學(xué)習(xí)軟件會針對GPU進(jìn)行更多的優(yōu)化，甚至有人認(rèn)為學(xué)習(xí)加速必須在GPU上才能完成，但事實(shí)上無論是運(yùn)行機(jī)器學(xué)習(xí)的處理器還是優(yōu)化的深度學(xué)習(xí)框架，都不

2018-03-14 18:29:09

8148

深度學(xué)習(xí)顯卡選型指南:關(guān)于GPU選擇的一般建議

當(dāng)一個(gè)人開始涉足深度學(xué)習(xí)時(shí)，擁有一塊高速GPU是一件很重要的事，因?yàn)樗軒腿烁咝У胤e累實(shí)踐經(jīng)驗(yàn)，而經(jīng)驗(yàn)是掌握專業(yè)知識的關(guān)鍵，能打開深入學(xué)習(xí)新問題的大門。如果沒有這種快速的反饋，我們從錯(cuò)誤中汲取經(jīng)驗(yàn)的時(shí)間成本就太高了，同時(shí)，過長的時(shí)間也可能會讓人感到挫敗和沮喪。

2018-08-24 09:11:25

80990

FPGA在做深度學(xué)習(xí)加速時(shí)需要的技能

的主要有三種不同架構(gòu)的器件種類：CPU，GPU，AI芯片/FPGA。CPU是一個(gè)通用架構(gòu)芯片，其計(jì)算能力和數(shù)據(jù)帶寬相對受到限制，面對大計(jì)算量的深度學(xué)習(xí)就顯露出其缺點(diǎn)了。GPU含有大量的計(jì)算陣列，可以適用于大規(guī)模運(yùn)算，而且其生態(tài)較為成熟和完整，所以現(xiàn)在包

2020-10-10 16:25:43

3349

FPGA上部署深度學(xué)習(xí)的算法模型的方法以及平臺

今天給大家介紹一下FPGA上部署深度學(xué)習(xí)的算法模型的方法以及平臺。希望通過介紹，算法工程師在FPGA的落地上能“稍微”緩和一些，小白不再那么迷茫。

2022-07-22 10:14:44

3535

相比CPU、GPU、ASIC，FPGA有什么優(yōu)勢

CPU、GPU 都屬于馮·諾依曼結(jié)構(gòu)，指令譯碼執(zhí)行、共享內(nèi)存。FPGA 之所以比 CPU 甚至 GPU 能效高，本質(zhì)上是無指令、無需共享內(nèi)存的體系結(jié)構(gòu)帶來的福利。

2022-11-22 16:00:05

1256

3GPP的概念是什么？

3GPP的目標(biāo)是實(shí)現(xiàn)由2G網(wǎng)絡(luò)到3G網(wǎng)絡(luò)的平滑過渡，保證未來技術(shù)的后向兼容性，支持輕松建網(wǎng)及系統(tǒng)間的漫游和兼容性。

2019-09-20 09:10:03

FPGA 超越 GPU，問鼎下一代深度學(xué)習(xí)主引擎

的合著者之一，說：“深度學(xué)習(xí)是AI中最令人興奮的領(lǐng)域，因?yàn)槲覀円呀?jīng)看到了深度學(xué)習(xí)帶來的巨大進(jìn)步和大量應(yīng)用。雖然AI 和DNN 研究傾向于使用 GPU，但我們發(fā)現(xiàn)應(yīng)用領(lǐng)域和英特爾下一代FPGA 架構(gòu)之間

2017-04-27 14:10:12

FPGA為什么快？

任務(wù)中：在數(shù)據(jù)中心，FPGA相比GPU的核心優(yōu)勢在于延遲。FPGA為什么比GPU的延遲低很多？本質(zhì)上是體系結(jié)構(gòu)的區(qū)別。FPGA同時(shí)擁有流水線并行和數(shù)據(jù)并行，而GPU幾乎只有數(shù)據(jù)并行（流水線深度受限

2018-08-16 09:54:23

FPGA和CPU、GPU有什么區(qū)別？為什么越來越重要？

和 CPU 互聯(lián)，以完成高并行的計(jì)算加速。圖6：將CPU的核心簡化以加快執(zhí)行速度，是GPU設(shè)計(jì)的思想 FPGA相比CPU的巨大優(yōu)勢在于確定性的低時(shí)延，這是架構(gòu)差異造成的。CPU 的時(shí)延

2023-11-09 14:09:46

FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class="flag-6" style="color: red">GPU

現(xiàn)場可編程門陣列 (FPGA) 解決了 GPU 在運(yùn)行深度學(xué)習(xí)模型時(shí)面臨的許多問題在過去的十年里，人工智能的再一次興起使顯卡行業(yè)受益匪淺。英偉達(dá) (Nvidia) 和 AMD 等公司的股價(jià)也大幅

2024-03-21 15:19:45

FPGA的過去，現(xiàn)在，未來

加速器的每瓦性能都有了令人信服的改進(jìn)。根據(jù)微軟的運(yùn)行測試，在執(zhí)行深度學(xué)習(xí)算法的時(shí)候，CPU-FPGA和CPU-GPU混合計(jì)算在內(nèi)的每瓦性能也不相伯仲。GPU在運(yùn)行中更熱和有類似的每瓦性能表現(xiàn)，但是同時(shí)

2017-03-07 11:52:29

深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

理解，但是在其高冷的背后，卻有深遠(yuǎn)的應(yīng)用場景和未來。深度學(xué)習(xí)是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的一種方式或一條路徑。其動機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)，它模仿人腦的機(jī)制來解釋數(shù)據(jù)。比如其按特定的物理距離連接

2018-07-04 16:07:53

深度學(xué)習(xí)中過擬合/欠擬合的問題及解決方案

的數(shù)據(jù)可以對未來的數(shù)據(jù)進(jìn)行推測與模擬，因此都是使用歷史數(shù)據(jù)建立模型，即使用已經(jīng)產(chǎn)生的數(shù)據(jù)去訓(xùn)練，然后使用該模型去擬合未來的數(shù)據(jù)。在我們機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的訓(xùn)練過程中，經(jīng)常會出現(xiàn)過擬合和欠擬合的現(xiàn)象。訓(xùn)練一開始，模型通常會欠擬合，所以會對模型進(jìn)行優(yōu)化，然而等到訓(xùn)練到一定程度的時(shí)候，就需要解決過擬合的問題了。

2021-01-28 06:57:47

深度學(xué)習(xí)介紹

在未來的某個(gè)時(shí)候，人們必定能夠相對自如地運(yùn)用人工智能，安全地駕車出行。這個(gè)時(shí)刻何時(shí)到來我無法預(yù)見；但我相信，彼時(shí)“智能”會顯現(xiàn)出更“切實(shí)”的意義。與此同時(shí)，通過深度學(xué)習(xí)方法，人工智能的實(shí)際應(yīng)用能夠在

2022-11-11 07:55:50

深度學(xué)習(xí)在汽車中的應(yīng)用

未來的某個(gè)時(shí)候，人們必定能夠相對自如地運(yùn)用人工智能，安全地駕車出行。這個(gè)時(shí)刻何時(shí)到來我無法預(yù)見；但我相信，彼時(shí)“智能”會顯現(xiàn)出更“切實(shí)”的意義。與此同時(shí)，通過深度學(xué)習(xí)方法，人工智能的實(shí)際應(yīng)用能夠在汽車

2019-03-13 06:45:03

深度學(xué)習(xí)存在哪些問題？

深度學(xué)習(xí)常用模型有哪些？深度學(xué)習(xí)常用軟件工具及平臺有哪些？深度學(xué)習(xí)存在哪些問題？

2021-10-14 08:20:47

深度學(xué)習(xí)推理和計(jì)算-通用AI核心

摘要與深度學(xué)習(xí)算法的進(jìn)步超越硬件的進(jìn)步，你如何確保算法明天是一個(gè)很好的適合現(xiàn)有的人工智能芯片下發(fā)展？，這些人工智能芯片大多是為今天的人工智能算法算法進(jìn)化，這些人工智能芯片的許多設(shè)計(jì)都可能成為甚至在

2020-11-01 09:28:57

深度學(xué)習(xí)框架TensorFlow&TensorFlow-GPU詳解

TensorFlow&TensorFlow-GPU：深度學(xué)習(xí)框架TensorFlow&TensorFlow-GPU的簡介、安裝、使用方法詳細(xì)攻略

2018-12-25 17:21:10

深度學(xué)習(xí)框架只為GPU?

CPU優(yōu)化深度學(xué)習(xí)框架和函數(shù)庫機(jī)器學(xué)***器

2021-02-22 06:01:02

Mali GPU支持tensorflow或者caffe等深度學(xué)習(xí)模型嗎

Mali GPU 支持tensorflow或者caffe等深度學(xué)習(xí)模型嗎？好像caffe2go和tensorflow lit可以部署到ARM，但不知道是否支持在GPU運(yùn)行？我希望把訓(xùn)練

2022-09-16 14:13:01

Nanopi深度學(xué)習(xí)之路(1)深度學(xué)習(xí)框架分析

最耳熟能詳?shù)木褪荰ensorFlow，但再稍有了解的，會知道TensorFlow太過于底層，實(shí)現(xiàn)深度學(xué)習(xí)的過程復(fù)雜，但其框架是相當(dāng)好的，Keras相比TensorFlow，具有簡單易用的特點(diǎn)，更適合深度學(xué)習(xí)

2018-06-04 22:32:12

labview調(diào)用深度學(xué)習(xí)tensorflow模型非常簡單，附上源碼和模型

]`labview調(diào)用高性能YOLOV5：http://t.elecfans.com/c1659.html 讓你的CPU也可以運(yùn)行最新深度學(xué)習(xí)模型labview調(diào)用高性能Tensorflow+YOLOV4：http://t.elecfans.com/c1553.html 讓你的GPU也可以運(yùn)行最新深度學(xué)習(xí)模型

2021-06-03 16:38:25

　　華為云深度學(xué)習(xí)服務(wù)，讓企業(yè)智能從此不求人

。由于深度學(xué)習(xí)需要使用海量數(shù)據(jù)來進(jìn)行業(yè)務(wù)訓(xùn)練，因此計(jì)算資源需求很大，動則幾十上百個(gè)GPU，甚至上千GPU等等；同時(shí)訓(xùn)練時(shí)間也很長，每次訓(xùn)練都是以天、周或甚至月年為單位。但是，開源的分布式訓(xùn)練框架，在保證

2018-08-02 20:44:09

【產(chǎn)品活動】阿里云GPU云服務(wù)器年付5折！阿里云異構(gòu)計(jì)算助推行業(yè)發(fā)展！

的參數(shù)空間已從百萬級上升到百億級，這對計(jì)算能力提出了新的挑戰(zhàn)。相比CPU，GPU更適合深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型，可進(jìn)行高度統(tǒng)異構(gòu)計(jì)算明星規(guī)格族“GN5”。阿里云異構(gòu)計(jì)算通用實(shí)例“GN5”規(guī)格族就是一款

2017-12-26 11:22:09

【詳解】FPGA：深度學(xué)習(xí)的未來？

的未來方向提出關(guān)鍵建議，幫助解決今后深度學(xué)習(xí)所面臨的問題。2. FPGA傳統(tǒng)來說，在評估硬件平臺的加速時(shí)，必須考慮到靈活性和性能之間的權(quán)衡。一方面，通用處理器（GPP）可提供高度的靈活性和易用性，但性能

2018-08-13 09:33:30

為什么說FPGA是機(jī)器深度學(xué)習(xí)的未來？

都出現(xiàn)了重大突破。深度學(xué)習(xí)是這些領(lǐng)域中所最常使用的技術(shù)，也被業(yè)界大為關(guān)注。然而，深度學(xué)習(xí)模型需要極為大量的數(shù)據(jù)和計(jì)算能力，只有更好的硬件加速條件，才能滿足現(xiàn)有數(shù)據(jù)和模型規(guī)模繼續(xù)擴(kuò)大的需求?！　?FPGA

2019-10-10 06:45:41

什么是深度學(xué)習(xí)？

深度學(xué)習(xí)是什么意思

2020-11-11 06:58:03

什么是深度學(xué)習(xí)？使用FPGA進(jìn)行深度學(xué)習(xí)的好處？

頻率低于 CPU 和 GPU，除非設(shè)計(jì)實(shí)現(xiàn)，否則性能往往較差。與 CPU 和 GPU 相比實(shí)施成本高，FPGA 上支持深度學(xué)習(xí)的軟件較少很多DNN參數(shù)量大，很難在FPGA上簡單實(shí)現(xiàn)需要高數(shù)據(jù)精度

2023-02-17 16:56:59

關(guān)于FPGA的學(xué)習(xí)和發(fā)展問題

我是大二的電子信息工程在讀生，目前沒有接觸過32方向的任何東西，只學(xué)習(xí)了一個(gè)學(xué)期的FPGA并參加了集創(chuàng)賽，感覺FPGA的學(xué)習(xí)難度還是很大的。但是我在網(wǎng)上搜索FPGA時(shí)，感覺大家對它的前景并不看好，在

2023-07-26 11:04:06

剛開始進(jìn)行深度學(xué)習(xí)的同學(xué)怎么選擇合適的機(jī)器配置

怎么為自己的深度學(xué)習(xí)機(jī)器選擇合適的GPU配置呢？對于那些一直想進(jìn)行深度學(xué)習(xí)研究的同學(xué)來說，一直是個(gè)比較糾結(jié)的問題，既要考慮到使用的場景，又要考慮到價(jià)格等各方面因素。如何選擇深度學(xué)習(xí)的組件？這真的很

2018-09-19 13:56:36

射頻系統(tǒng)的深度學(xué)習(xí)【回映分享】

本文由回映電子整理分享，歡迎工程老獅們參與學(xué)習(xí)與評論內(nèi)容? 射頻系統(tǒng)中的深度學(xué)習(xí)? Deepwave Digital技術(shù)? 信號檢測和分類示例? GPU的實(shí)時(shí)DSP基準(zhǔn)測試? 總結(jié)回映電子是一家

2022-01-05 10:00:58

帶你宏觀了解一下FPGA的市場，潛力？！

、應(yīng)用。自從2006年Hinton等人提出來之后，深度學(xué)習(xí)高速發(fā)展，在自然語言處理、圖像處理、語音處理等領(lǐng)域都取得了非凡的成就，受到了巨大的關(guān)注。相比GPU和GPP，FPGA在滿足深度學(xué)習(xí)的硬件需求上提供了

2018-02-08 10:25:32

當(dāng)AI遇上FPGA會產(chǎn)生怎樣的反應(yīng)

處理，并行計(jì)算的優(yōu)勢不能發(fā)揮出來。相比較而言，運(yùn)行深度學(xué)習(xí)算法實(shí)現(xiàn)同樣的性能，GPU所需功耗遠(yuǎn)大于FPGA，通常情況下，GPU只能達(dá)到FPGA能效比的一半或更低。目前來看，深度學(xué)習(xí)算法還未完全成熟

2021-09-17 17:08:32

機(jī)器學(xué)習(xí)的未來

機(jī)器學(xué)習(xí)的未來在工業(yè)領(lǐng)域采用機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)和大數(shù)據(jù)

2021-01-27 06:02:18

NVIDIA深度學(xué)習(xí)平臺

為幫助數(shù)據(jù)科學(xué)家和開發(fā)人員充分利用深度學(xué)習(xí)領(lǐng)域中的機(jī)遇，NVIDIA為其深度學(xué)習(xí)軟件平臺發(fā)布了三項(xiàng)重大更新，它們分別是NVIDIA DIGITS 4、CUDA深度神經(jīng)網(wǎng)絡(luò)庫(cuDNN)5.1和全新的GPU推理引擎(GIE)?！　? NVIDIA深度學(xué)習(xí)軟件平臺推三項(xiàng)重大更新

2016-08-06 15:00:26

1806

FPGA是深度學(xué)習(xí)的未來

FPGA是深度學(xué)習(xí)的未來，學(xué)習(xí)資料，感興趣的可以看看。

2016-10-26 15:29:04

基于GPU實(shí)現(xiàn)的深度學(xué)習(xí)的數(shù)據(jù)庫

項(xiàng)目組基于深度學(xué)習(xí)實(shí)現(xiàn)了視頻風(fēng)格化和人像摳圖的功能，但這是在PC/服務(wù)端上跑的，現(xiàn)在需要移植到移動端，因此需要一個(gè)移動端的深度學(xué)習(xí)的計(jì)算框架。同類型的庫 caffe-Android-lib 目前

2017-09-28 20:02:26

國內(nèi)首款FPGA云服務(wù)器的深度學(xué)習(xí)算法背景及算法分析

由騰訊云基礎(chǔ)產(chǎn)品中心、騰訊架構(gòu)平臺部組成的騰訊云FPGA聯(lián)合團(tuán)隊(duì)，在這里介紹國內(nèi)首款FPGA云服務(wù)器的工程實(shí)現(xiàn)深度學(xué)習(xí)算法（AlexNet），討論深度學(xué)習(xí)算法FPGA硬件加速平臺的架構(gòu)

2017-11-15 20:20:08

2468

GPU及由其驅(qū)動的深度學(xué)習(xí)技術(shù)推動智能醫(yī)療的無限接近

幾個(gè)世紀(jì)以來，醫(yī)生都試圖借助更好的醫(yī)療工具來深入檢查病人的身體狀況，讓他們遠(yuǎn)離病痛的折磨。如今，GPU及其推動的深度學(xué)習(xí)技術(shù)正在為智能醫(yī)學(xué)儀器打開一扇全新的大門。

2017-12-09 11:51:22

6860

NVIDIA推出全球最強(qiáng)PC級GPU 可提供110TFLOP深度學(xué)習(xí)運(yùn)算

NVIDIA創(chuàng)始人黃仁勛表示TITAN V GPU擁有210億個(gè)晶體管，基于Volta 架構(gòu)設(shè)計(jì)，110 TFLOP 的深度學(xué)習(xí)運(yùn)算能力是上一代的9 倍，可以說是全球最強(qiáng)的PC級GPU。

2017-12-15 13:38:38

1751

深度學(xué)習(xí)之GPU硬件選型

本文談了談gpu的一些重要的硬件組成，就深度學(xué)習(xí)而言，我覺得對內(nèi)存的需求還是比較大的，core多也并不是能夠全部用上，但現(xiàn)在開源的庫實(shí)在完整，想做卷積運(yùn)算有cudnn，想做卷積神經(jīng)網(wǎng)絡(luò)caffe

2018-01-06 12:01:09

3486

將TVM用于移動端常見的ARM GPU，提高移動設(shè)備對深度學(xué)習(xí)的支持能力

隨著深度學(xué)習(xí)不斷取得進(jìn)展，開發(fā)者們對在移動設(shè)備上的部署神經(jīng)網(wǎng)絡(luò)的需求也與日俱增。和我們之前在桌面級GPU上做過的嘗試類似，把深度學(xué)習(xí)框架移植到移動端需要做到這兩點(diǎn)：夠快的inference速度和合

2018-01-18 13:38:00

10463

FPGA為什么比CPU和GPU快

FPGA仿真篇-使用腳本命令來加速仿真二基于FPGA的HDMI高清顯示借口驅(qū)動基于FPGA灰度圖像高斯濾波算法的實(shí)現(xiàn) FPGA為什么比CPU和GPU快基于Xilinx FPGA的視頻圖像采集

2018-02-20 20:49:00

1479

深度學(xué)習(xí)方案ASIC、FPGA、GPU比較哪種更有潛力

幾乎所有深度學(xué)習(xí)的研究者都在使用GPU，但是對比深度學(xué)習(xí)硬鑒方案，ASIC、FPGA、GPU三種究竟哪款更被看好？主要是認(rèn)清對深度學(xué)習(xí)硬件平臺的要求。

2018-02-02 15:21:40

10203

新一代的PowerVR GPU與前一代的GPU相比

新一代的PowerVR GPU，可為成本敏感設(shè)備的圖形與運(yùn)算功能樹立新的標(biāo)準(zhǔn)。與前一代的GPU相比，SoC供應(yīng)商將能以相同的芯片面積實(shí)現(xiàn)顯著的性能提升。運(yùn)用新款 PowerVR Series9XE和Series9XM GPU，SoC供應(yīng)商與OEM廠商能把成本與功耗降至最低。

2018-04-09 07:19:00

3381

深度學(xué)習(xí)和機(jī)器學(xué)習(xí)深度的不同之處淺談深度學(xué)習(xí)的訓(xùn)練和調(diào)參

近年來，深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)中比較火的一種方法出現(xiàn)在我們面前，但是和非深度學(xué)習(xí)的機(jī)器學(xué)習(xí)相比（我將深度學(xué)習(xí)歸于機(jī)器學(xué)習(xí)的領(lǐng)域內(nèi)），還存在著幾點(diǎn)很大的不同，具體來說，有以下幾點(diǎn).

2018-05-02 10:30:00

4135

什么是ASIC芯片？與CPU、GPU、FPGA相比如何？

不過在聯(lián)發(fā)科副總經(jīng)理暨智能設(shè)備事業(yè)群總經(jīng)理游人杰看來，雖然CPU、GPU等通用型芯片以及FPGA可以適應(yīng)相對更多種的算法，但是特定算法下ASIC的性能和效能要更高。另外，雖然FPGA的便定制特性比ASIC芯片更加靈活，但部署FPGA所付出的成本也要比ASIC更高。

2018-05-04 15:39:03

251868

FPGA是如何實(shí)現(xiàn)30倍速度的云加速的？

硬件編程，可將性能提升至通用CPU服務(wù)器的30倍以上。同時(shí)，與已經(jīng)深入人心的高性能計(jì)算的代表GPU相比，FPGA具有硬件可編程、低功耗、低延時(shí)的特性，代表了高性能計(jì)算的未來發(fā)展趨勢。而在人工智能(AI)里面火熱的深度學(xué)習(xí)領(lǐng)域，企業(yè)同樣可以將FPGA用于深度學(xué)習(xí)的

2018-05-29 13:44:24

4844

人工智能深度學(xué)習(xí)的未來展望

本文是推出的人工智能深度學(xué)習(xí)綜述，也是Hinton、LeCun和Bengio三位大神首次合寫同一篇文章。該綜述在深度學(xué)習(xí)領(lǐng)域的重要性不言而喻，可以說是所有人入門深度學(xué)習(xí)的必讀作品。

2018-07-30 16:40:37

8574

深度學(xué)習(xí)的未來是不是在單片機(jī)身上

未來的深度學(xué)習(xí)能夠在微型的、低功耗的芯片上自由地奔跑。換句話說，單片機(jī) （MCU），有一天會成為深度學(xué)習(xí)最肥沃的土壤。這里面的邏輯走得有些繞，但好像還是有點(diǎn)道理的。

2019-06-04 17:52:00

FPGA在深度學(xué)習(xí)領(lǐng)域的應(yīng)用

2019-06-28 17:31:46

6529

微軟最新發(fā)布FPGA深度學(xué)習(xí)云平臺

微軟發(fā)布了 Project Brainwave，一個(gè)基于 FPGA 的低延遲深度學(xué)習(xí)云平臺。微軟官方測評顯示，當(dāng)使用英特爾的 Stratix 10 FPGA，Brainwave 不需要任何

2019-07-03 14:58:52

883

深度學(xué)習(xí)的冬天什么時(shí)候到來？

從 2016 年 AlphaGo 戰(zhàn)勝李世石掀起深度學(xué)習(xí)的熱潮，到如今深度學(xué)習(xí)寒冬論甚囂塵上，短短兩三年時(shí)間，深度學(xué)習(xí)被唱衰，如今在產(chǎn)業(yè)互聯(lián)網(wǎng)的高速發(fā)展下深度學(xué)習(xí)又該走向何方？未來的發(fā)展方向在何方？

2019-07-12 11:04:42

3417

Mipsology Zebra在深度學(xué)習(xí)推斷的應(yīng)用

Zebra 可消除深度學(xué)習(xí)推斷中具有挑戰(zhàn)性的編程及 FPGA 任務(wù)。Zebra 可輕松部署和適應(yīng)廣泛的神經(jīng)網(wǎng)絡(luò)及框架。

2019-07-21 10:59:09

893

GPU與CPU間的比較

GPU與CPU比較，GPU為什么更適合深度學(xué)習(xí)?

2019-08-26 15:32:00

4234

萬能的FPGA真的能取代CPU和GPU嗎

FPGA相對于CPU和GPU，在進(jìn)行感知處理等簡單重復(fù)的任務(wù)的時(shí)候的優(yōu)勢很明顯，按照現(xiàn)在的趨勢發(fā)展下去，FPGA或許會在未來取代機(jī)器人開發(fā)中GPU的工作。

2019-09-06 17:48:10

2115

FPGA的應(yīng)用領(lǐng)域主要是深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法

如果說FPGA是繼任傳統(tǒng)CPU與GPU的未來，就有些夸大其詞。且不論CPU與GPU技術(shù)已經(jīng)成熟，擁有完善的生態(tài)鏈，CPU與FPGA的結(jié)構(gòu)也有所不同。

2019-09-06 17:50:27

1514

在未來GPU、FPGA、ASIC芯片將三分天下

在GPU編程方面，阿里云會推出分布式多機(jī)多卡訓(xùn)練框架和其他GPU上的性能優(yōu)化服務(wù)，能夠大大降低客戶使用多機(jī)多卡的門檻，從而減少客戶在云上做深度學(xué)習(xí)訓(xùn)練的時(shí)間。

2019-10-14 14:29:04

487

GPU和GPP相比誰才是深度學(xué)習(xí)的未來

相比GPU和GPP，FPGA在滿足深度學(xué)習(xí)的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計(jì)算的能力和高效的能耗，FPGA將在一般的深度學(xué)習(xí)應(yīng)用中展現(xiàn)GPU和GPP所沒有的獨(dú)特優(yōu)勢。

2019-10-18 15:48:14

1326

FPGA有著優(yōu)于傳統(tǒng)GPP加速能力的顯著潛力

作為GPU在算法加速上強(qiáng)有力的競爭者，FPGA是否立即支持不同硬件，顯得尤為重要。FPGA與GPU不同之處在于硬件配置靈活，且FPGA在運(yùn)行深入學(xué)習(xí)中關(guān)鍵的子程序（例如對滑動窗口的計(jì)算）時(shí)，單位能耗下通常能比GPU提供更好的表現(xiàn)。

2019-10-18 15:42:04

626

FPGA相比GPU和CPU有什么行業(yè)競爭優(yōu)勢

與其他計(jì)算載體如CPU與GPU相比，FPGA具有高性能、低能耗以及可硬件編程的特點(diǎn)。圖1介紹了FPGA的硬件架構(gòu)，每個(gè)FPGA主要由叁個(gè)部分組成：輸入輸出邏輯，主要用于FPGA與外部其他部件，比如傳感器的通信。

2019-10-21 14:56:17

2476

FPGA在深度學(xué)習(xí)領(lǐng)域的未來會有怎樣的發(fā)展

近十年來，人工智能又到了一個(gè)快速發(fā)展的階段。深度學(xué)習(xí)在其發(fā)展中起到了中流砥柱的作用，盡管擁有強(qiáng)大的模擬預(yù)測能力，深度學(xué)習(xí)還面臨著超大計(jì)算量的問題。在硬件層面上，GPU，ASIC，FPGA都是解決龐大計(jì)算量的方案。

2019-10-22 15:26:21

977

如今FPGA飛速發(fā)展，它會是深度學(xué)習(xí)的未來嗎

2019-10-29 16:04:48

850

FPGA有什么優(yōu)勢，可以讓FPGA替代GPU嗎

的深度學(xué)習(xí)訓(xùn)練模型領(lǐng)域，并且GPU創(chuàng)建了包含CNN、DNN、RNN、LSTM以及強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)等算法在內(nèi)的應(yīng)用加速平臺和生態(tài)系統(tǒng)。

2019-11-01 15:07:07

2656

GPU相比FPGA更具優(yōu)勢，更能適應(yīng)AI快速的變化需求

在GTC19大會期間，NVIDIA 加速計(jì)算產(chǎn)品管理總監(jiān)Paresh Kharya對關(guān)于GPU相比FPGA的優(yōu)勢的問題時(shí)回答表示，GPU在可編程上具備明顯優(yōu)勢，整個(gè)開發(fā)時(shí)間更短。

2020-02-06 17:29:21

752

人工智能深度學(xué)習(xí)的成功

深度學(xué)習(xí)的最新成功是由于大量數(shù)據(jù)（大數(shù)據(jù)）的可用性增加以及圖形處理單元（GPU）的出現(xiàn)，顯著增加了用于訓(xùn)練計(jì)算機(jī)的數(shù)據(jù)的廣度和深度，并減少了所需的時(shí)間用于訓(xùn)練深度學(xué)習(xí)算法。

2020-04-02 09:20:18

2279

深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)和可視化學(xué)習(xí)

與其他機(jī)器學(xué)習(xí)技術(shù)相比，深度學(xué)習(xí)的主要優(yōu)勢在于它能夠自動學(xué)習(xí)輸入數(shù)據(jù)的抽象表示。

2020-05-03 18:02:00

1979

基于深度學(xué)習(xí)的ADAS系統(tǒng)，是GPU的主力市場

事實(shí)上，今天在汽車行業(yè)，GPU的用例幾乎涵蓋了從ADAS到自動駕駛，從儀表到中控信息娛樂等等多個(gè)車載系統(tǒng)。而在實(shí)際大規(guī)模量產(chǎn)落地領(lǐng)域，基于深度學(xué)習(xí)的ADAS系統(tǒng)，是GPU的主力市場。

2020-08-22 09:48:51

2003

這三種學(xué)習(xí)模式在于深度學(xué)習(xí)的未來

被提出來。不過，總的來說，現(xiàn)代深度學(xué)習(xí)可以分為三種基本的學(xué)習(xí)范式。每一種都有自己的學(xué)習(xí)方法和理念，提升了機(jī)器學(xué)習(xí)的能力，擴(kuò)大了其范圍。本文最初發(fā)布于 Towards Data Science 博客，由 InfoQ 中文站翻譯并分享。深度學(xué)習(xí)的未來在于這三種學(xué)習(xí)模式，而且它們

2020-10-23 09:37:25

1976

深度學(xué)習(xí)的GPU共享工作

當(dāng)前機(jī)器學(xué)習(xí)訓(xùn)練中，使用GPU提供算力已經(jīng)非常普遍，對于GPU-based AI system的研究也如火如荼。在這些研究中，以提高資源利用率為主要目標(biāo)的GPU共享(GPU sharing)是當(dāng)下

2020-11-27 10:06:21

3270

GPU深度學(xué)習(xí)面臨的挑戰(zhàn)分析

人工智能的興起觸發(fā)了市場對 GPU 的大量需求，但 GPU 在 AI 場景中的應(yīng)用面臨使用壽命短、使用成本高等問題?，F(xiàn)場可編程門陣列（FPGA）這一可以定制化硬件處理器反倒是更好的解決方案。隨著可編程性等問題在 FPGA 上的解決，FPGA 將成為市場人工智能應(yīng)用的選擇。

2020-12-11 15:02:41

2493

GPU引領(lǐng)的深度學(xué)習(xí)

早期的機(jī)器學(xué)習(xí)以搜索為基礎(chǔ)，主要依靠進(jìn)行過一定優(yōu)化的暴力方法。但是隨著機(jī)器學(xué)習(xí)逐漸成熟，它開始專注于加速技術(shù)已經(jīng)很成熟的統(tǒng)計(jì)方法和優(yōu)化問題。同時(shí)深度學(xué)習(xí)的問世更是帶來原本可能無法實(shí)現(xiàn)的優(yōu)化方法。本文

2021-02-26 06:11:43

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)有什么區(qū)別？

覺信息的理解可以被再現(xiàn)甚至超越。借助深度學(xué)習(xí)，作為機(jī)器學(xué)習(xí)的一部分，可以在應(yīng)用實(shí)例的基礎(chǔ)上學(xué)習(xí)和訓(xùn)練復(fù)雜的關(guān)系。機(jī)器學(xué)習(xí)中的另一種技術(shù)是例如“超級矢量機(jī)”。與深度學(xué)習(xí)相比，必須手動定義和驗(yàn)證功能。在深度學(xué)習(xí)中

2021-03-12 16:11:00

7762

什么？不用GPU也能加速你的YOLOv3深度學(xué)習(xí)模型

你還在為神經(jīng)網(wǎng)絡(luò)模型里的冗余信息煩惱嗎？或者手上只有CPU，對一些只能用昂貴的GPU建立的深度學(xué)習(xí)模型“望眼欲穿”嗎？最近，創(chuàng)業(yè)公司Neural Magic帶來了一種名叫新的稀疏化方法，可以幫你

2021-06-10 15:33:02

1975

FPGA上部署深度學(xué)習(xí)的算法模型的方法以及平臺

今天給大家介紹一下FPGA上部署深度學(xué)習(xí)的算法模型的方法以及平臺。希望通過介紹，算法工程師在FPGA的落地上能“稍微”緩和一些，小白不再那么迷茫。阿chai最近在肝一個(gè)開源的項(xiàng)目，等忙完了會給大家

2021-06-10 17:32:36

3141

NVIDIA GPU加快深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推斷

深度學(xué)習(xí)是推動當(dāng)前人工智能大趨勢的關(guān)鍵技術(shù)。在 MATLAB 中可以實(shí)現(xiàn)深度學(xué)習(xí)的數(shù)據(jù)準(zhǔn)備、網(wǎng)絡(luò)設(shè)計(jì)、訓(xùn)練和部署全流程開發(fā)和應(yīng)用。聯(lián)合高性能 NVIDIA GPU 加快深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推斷。

2022-02-18 13:31:44

1714

使用Apache Spark和NVIDIA GPU加速深度學(xué)習(xí)

　　隨著人們對深度學(xué)習(xí)（ deep learning ， DL ）興趣的日益濃厚，越來越多的用戶在生產(chǎn)環(huán)境中使用 DL 。由于 DL 需要強(qiáng)大的計(jì)算能力，開發(fā)人員正在利用 gpu 來完成他們的訓(xùn)練和推理工作。

2022-04-27 09:54:47

1873

何時(shí)使用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)

　　部署到嵌入式 GPU 也很受歡迎，因?yàn)樗梢栽诓渴鸬沫h(huán)境中提供快速的推理速度。GPU Coder 支持從 MATLAB 中的深度學(xué)習(xí)模型生成代碼，該模型利用來自 Intel、NVIDIA

2022-07-08 15:23:34

1303

FPGA中GPU深度學(xué)習(xí)面臨的挑戰(zhàn)

三維圖形是 GPU 擁有如此大的內(nèi)存和計(jì)算能力的根本原因，它與深度神經(jīng)網(wǎng)絡(luò) 有一個(gè)共同之處：都需要進(jìn)行大量矩陣運(yùn)算。

2022-08-06 15:56:02

624

GPU 引領(lǐng)的深度學(xué)習(xí)

GPU 引領(lǐng)的深度學(xué)習(xí)

2023-01-04 11:17:16

477

大模型為什么是深度學(xué)習(xí)的未來？

與傳統(tǒng)機(jī)器學(xué)習(xí)相比，深度學(xué)習(xí)是從數(shù)據(jù)中學(xué)習(xí)，而大模型則是通過使用大量的模型來訓(xùn)練數(shù)據(jù)。深度學(xué)習(xí)可以處理任何類型的數(shù)據(jù)，例如圖片、文本等等；但是這些數(shù)據(jù)很難用機(jī)器完成。大模型可以訓(xùn)練更多類別、多個(gè)級別的模型，因此可以處理更廣泛的類型。另外：在使用大模型時(shí)，可能需要一個(gè)更全面或復(fù)雜的數(shù)學(xué)和數(shù)值計(jì)算的支持。

2023-02-16 11:32:37

1605

從FPGA說起的深度學(xué)習(xí)

這是新的系列教程，在本教程中，我們將介紹使用 FPGA 實(shí)現(xiàn)深度學(xué)習(xí)的技術(shù)，深度學(xué)習(xí)是近年來人工智能領(lǐng)域的熱門話題。

2023-03-03 09:52:13

1088

如何使用FPGA加速深度學(xué)習(xí)計(jì)算？

當(dāng)今的深度學(xué)習(xí)應(yīng)用如此廣泛，它們能夠?yàn)獒t(yī)療保健、金融、交通、軍事等各行各業(yè)提供支持，但是大規(guī)模的深度學(xué)習(xí)計(jì)算對于傳統(tǒng)的中央處理器（CPU）和圖形處理器（GPU）來說是非常耗時(shí)和資源密集的。

2023-03-09 09:35:24

1941

FPGA在深度學(xué)習(xí)領(lǐng)域有哪些優(yōu)勢？

FPGA（Field-Programmable Gate Array）是一種靈活的可編程硬件設(shè)備，它在深度學(xué)習(xí)應(yīng)用領(lǐng)域中具有許多優(yōu)勢。

2023-03-09 09:41:15

1350

未來的高性能FPGA是否會優(yōu)于GPU？

DNN算法效率較之傳統(tǒng)的密集FP32 DNN有巨大改進(jìn)，但是它們引入了GPU難以處理的不規(guī)則并行度和定制數(shù)據(jù)類型。相比之下，FPGA正是設(shè)計(jì)用于在運(yùn)行不規(guī)則并行度和自定義數(shù)據(jù)類型時(shí)實(shí)現(xiàn)極端的可定制

2023-03-11 13:05:06

403

從FPGA說起的深度學(xué)習(xí)：任務(wù)并行性

2023-04-12 10:19:34

533

從FPGA說起的深度學(xué)習(xí)：數(shù)據(jù)并行性

2023-05-04 11:22:36

651

深度學(xué)習(xí)中的圖像分割

深度學(xué)習(xí)可以學(xué)習(xí)視覺輸入的模式，以預(yù)測組成圖像的對象類。用于圖像處理的主要深度學(xué)習(xí)架構(gòu)是卷積神經(jīng)網(wǎng)絡(luò)(CNN)，或者是特定的CNN框架，如AlexNet、VGG、Inception和ResNet。計(jì)算機(jī)視覺的深度學(xué)習(xí)模型通常在專門的圖形處理單元(GPU)上訓(xùn)練和執(zhí)行，以減少計(jì)算時(shí)間。

2023-05-05 11:35:28

720

GPU引領(lǐng)的深度學(xué)習(xí)

2023-05-09 09:58:33

540

深度學(xué)習(xí)如何挑選GPU？

NVIDIA的標(biāo)準(zhǔn)庫使在CUDA中建立第一個(gè)深度學(xué)習(xí)庫變得非常容易。早期的優(yōu)勢加上NVIDIA強(qiáng)大的社區(qū)支持意味著如果使用NVIDIA GPU，則在出現(xiàn)問題時(shí)可以輕松得到支持。

2023-07-12 11:49:28

399

深度學(xué)習(xí)框架是什么？深度學(xué)習(xí)框架有哪些？

深度學(xué)習(xí)框架是什么？深度學(xué)習(xí)框架有哪些？? 深度學(xué)習(xí)框架是一種軟件工具，它可以幫助開發(fā)者輕松快速地構(gòu)建和訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型。與手動編寫代碼相比，深度學(xué)習(xí)框架可以大大減少開發(fā)和調(diào)試的時(shí)間和精力，并提

2023-08-17 16:03:09

1585

基于深度學(xué)習(xí)的語音合成技術(shù)的進(jìn)展與未來趨勢

近年來，深度學(xué)習(xí)技術(shù)在語音合成領(lǐng)域取得了顯著的進(jìn)展。基于深度學(xué)習(xí)的語音合成技術(shù)能夠生成更加自然、真實(shí)的語音，提高了用戶體驗(yàn)。本文將介紹基于深度學(xué)習(xí)的語音合成技術(shù)的進(jìn)展以及未來趨勢。一、基于深度學(xué)習(xí)

2023-09-16 14:48:21

490

GPU的張量核心：深度學(xué)習(xí)的秘密武器

GPU最初是為圖形渲染而設(shè)計(jì)的，但是由于其卓越的并行計(jì)算能力，它們很快被引入深度學(xué)習(xí)中。深度學(xué)習(xí)的迅速發(fā)展離不開計(jì)算機(jī)圖形處理單元（GPU）的支持，而GPU中的張量核心則被譽(yù)為深度學(xué)習(xí)的秘密武器

2023-09-26 08:29:54

456

GPU在深度學(xué)習(xí)中的應(yīng)用與優(yōu)勢

人工智能的飛速發(fā)展，深度學(xué)習(xí)作為其重要分支，正在推動著諸多領(lǐng)域的創(chuàng)新。在這個(gè)過程中，GPU扮演著不可或缺的角色。就像超級英雄電影中的主角一樣，GPU在深度學(xué)習(xí)中擁有舉足輕重的地位。那么，GPU在深度

2023-12-06 08:27:37

608

已全部加載完成

搜索歷史

相比GPU和GPP，F(xiàn)PGA是深度學(xué)習(xí)的未來？

評論

相比GPU和GPP，F(xiàn)PGA是深度學(xué)習(xí)的未來？