深度剖析AI網(wǎng)絡(luò)中GPU與光模塊配比及需求

市場上存在多種計算光模塊與GPU比例的方法，導(dǎo)致結(jié)果不相同。造成這些差異的主要原因是不同網(wǎng)絡(luò)結(jié)構(gòu)中光模塊數(shù)量的波動。所需的光模塊的準(zhǔn)確數(shù)量主要取決于幾個關(guān)鍵因素。

網(wǎng)卡型號

主要包括兩個網(wǎng)卡，ConnectX-6 （200Gb/s，主要用于A100）和ConnectX-7 （400Gb/s，主要用于H100）。

同時，下一代ConnectX-8800Gb/s預(yù)計將于2024年發(fā)布。

交換機(jī)型號

主要包括兩種類型的交換機(jī)，QM 9700交換機(jī)（32口OSFP 2x400Gb/s），共64通道400Gb/s傳輸速率，總吞吐率達(dá)到51.2Tb/s。

而QM8700交換機(jī)（40口QSFP56，共40個通道，傳輸速率為200Gb/s，總吞吐率為16Tb/s）。

單元數(shù)量（可擴(kuò)展單元）

單元數(shù)量決定了交換機(jī)網(wǎng)絡(luò)架構(gòu)的配置。小批量采用兩層結(jié)構(gòu)，而大批量采用三層結(jié)構(gòu)。 H100 SuperPOD：每臺由32個節(jié)點（DGX H100服務(wù)器）組成，最多支持4臺組成集群，采用雙層交換架構(gòu)。 A100 SuperPOD：每臺由20個節(jié)點（DGX A100服務(wù)器）組成，最多支持7臺組成集群。如果單元數(shù)超過5個，則需要三層交換架構(gòu)。

四大網(wǎng)絡(luò)配置下的光模塊需求

A100+ConnectX6+QM8700三層網(wǎng)絡(luò)：比例1：6，全部采用200G光模塊。 A100+ConnectX6+QM9700兩層網(wǎng)絡(luò)：1：0.75的800G光模塊+1：1的200G光模塊。 H100+ConnectX7+QM9700兩層網(wǎng)絡(luò)：1：1.5的800G光模塊+1：1的400G光模塊。 H100+ConnectX8（尚未發(fā)布）+QM9700三層網(wǎng)絡(luò)：比例1：6，全部采用800G光模塊。光模塊市場逐步增長：假設(shè)2023年H100出貨量為30萬臺，A100出貨量為90萬臺，總需求量為315萬臺200G、30萬臺400G、787.5萬臺800G光模塊。這會導(dǎo)致人工智能市場的顯著增長，預(yù)計規(guī)模將達(dá)到13.8億美元以2024年出貨150萬臺H100和150萬臺A100為例，200G總需求量為75萬臺，400G光模塊75萬臺，800G光模塊675萬臺。這將導(dǎo)致人工智能市場的顯著增長，預(yù)計規(guī)模將達(dá)到49.7億美元，大約相當(dāng)于2021年光模塊行業(yè)的總市場規(guī)模。以下是上述每種情況的細(xì)致計算分解：

第一種情況：A100+ConnectX6+QM8700三層網(wǎng)絡(luò)

A100 GPU設(shè)計有8個計算接口，如圖所示，左側(cè)有4個接口，右側(cè)有4個接口。目前，A100 GPU的大部分出貨量都是與ConnectX-6配合使用，以實現(xiàn)高達(dá)200Gb/s的連接速率。

在首層架構(gòu)中，每個節(jié)點有8個接口（端口），節(jié)點連接8個葉交換機(jī)。每20個節(jié)點組成一個單元（SU）。因此，在第一層中，總共需要8xSU臺葉交換機(jī)，以及8xSUx20根線纜和2x8xSUx20個200G光模塊。

在第二層架構(gòu)中，由于采用了無阻塞設(shè)計，上行速率等于下行速率。在第一層中，總單向傳輸速率為200G乘以線纜數(shù)量。由于第二層也采用單纜200G傳輸速率，因此第二層的線纜數(shù)量應(yīng)與第一層相同，需要8xSUx20線纜和2x8xSUx20 200G光模塊。所需脊交換機(jī)的數(shù)量是通過將線纜數(shù)量除以葉交換機(jī)數(shù)量來計算的，得出所需的（8xSUx200）/（8xSU）脊交換機(jī)。但是，當(dāng)沒有足夠的葉交換機(jī)時，為了節(jié)省脊交換機(jī)的數(shù)量，可以在葉和脊交換機(jī)之間建立多個連接（只要不超過40個接口的限制）。因此，當(dāng)單元數(shù)為1/2/4/5時，所需的脊交換機(jī)數(shù)量為4/10/20/20，所需的光模塊數(shù)量為320/640/1280/1600。脊交換機(jī)的數(shù)量不會成比例增加，但光模塊的數(shù)量會按相同比例增加。當(dāng)系統(tǒng)擴(kuò)展到七個單元時，實施第三層架構(gòu)變得至關(guān)重要。由于其非阻塞配置，第三層中所需的線纜數(shù)量與第二層的線纜數(shù)量保持不變。英偉達(dá)（NVIDIA）建議的SuperPOD藍(lán)圖需要在七個單元之間集成網(wǎng)絡(luò)，采用第三層架構(gòu)及核心交換機(jī)。詳細(xì)的圖表說明了不同層的不同數(shù)量的交換機(jī)以及不同單元數(shù)所需的相關(guān)布線。

配置140臺服務(wù)器，參與的A100 GPU總數(shù)為1120，計算方式為服務(wù)器數(shù)量140乘以8。為了支持此配置，需要部署了140臺QM8790交換機(jī)以及3360根線纜。此外，該配置需要使用6720個200G光模塊?。A100 GPU與200G光模塊的比例為1:6，具體數(shù)量為1120個GPU對應(yīng)6720個光模塊。

第二種情況：A100+ConnectX6+QM9700兩層網(wǎng)絡(luò)

目前，該配置方案并不是建議配置的一種。盡管如此，隨著時間的推移，越來越多的A100 GPU可能會選擇通過QM9700交換機(jī)進(jìn)行連接。這種轉(zhuǎn)變將減少所需光模塊數(shù)量，但會產(chǎn)生對800G光模塊的需求。主要區(qū)別可以在第一層的連接中看到，目前使用8根獨立200G線纜的方法將被使用QSFP轉(zhuǎn)OSFP適配器替代，每個適配器能夠進(jìn)行兩個連接，從而實現(xiàn)1對4的連接。

在第一層中：對于具有7個單元和140個服務(wù)器的集群，總共有140x8=1120個接口。這相當(dāng)于280根1-4線纜，因此需要280個800G和1120個200G光模塊?？偣残枰?2臺QM9700交換機(jī)。在第二層：僅使用800G連接時，需要280x2=5600個800G光模塊以及9臺QM 9700交換機(jī)。因此，對于140臺服務(wù)器和1120臺A100 GPU配置，總共需要21臺交換機(jī)（12+9），以及840個800G光模塊和1120個200G光模塊。 A100 GPU與800G光模塊的比例為1120：840，簡化為1：0.75。A1000 GPU和200G光模塊的比例為1：1。

第三種情況：H100+ConnectX7+QM9700兩層網(wǎng)絡(luò)

H100架構(gòu)的一個顯著特點是，盡管該卡包含8個GPU，但配備了8個400G網(wǎng)卡，這些網(wǎng)卡組合成4個800G接口。這種融合帶來了對800G光模塊的巨大需求。在第一層中，根據(jù)英偉達(dá)（NVIDIA）推薦的配置，建議在服務(wù)器接口連接1個800G光模塊。這可以通過使用帶有兩根光纜（MPO）的雙端口連接來實現(xiàn)，其中每根光纜都插入單獨的交換機(jī)。

因此，在第一層中，每個單元由32臺服務(wù)器組成，每臺服務(wù)器連接2x4=8臺交換機(jī)。在具有4個單元的SuperkPOD中，第一層總共需要4x8=32臺葉交換機(jī)。英偉達(dá)（NVIDIA）建議為管理目的（UFM）保留一個節(jié)點。由于對光模塊的使用影響有限，因此我們以4臺設(shè)備、總共128臺服務(wù)器為基準(zhǔn)進(jìn)行近似計算。第一層共需要4x128=512個800G光模塊和2x4x128=1024個400G光模塊。

在第二層，交換機(jī)使用800G光模塊直接連接。每個葉交換機(jī)都以32x400G的單向速率向下連接。為保證上行和下行速率一致，上行連接需要16x800G的單向速率。這需要16個脊交換機(jī)，因此總共需要4x8x162=1024個800G光模塊。在這種架構(gòu)中，基礎(chǔ)設(shè)施總共需要1536個800G光模塊和1024個400G光模塊?？紤]到SuperPOD的完整組成，其中包括128臺（4x32）服務(wù)器，每臺服務(wù)器配備8個H100 GPU，總共有1024個H100 GPU。GPU與800G光模塊的比例為1：1.5，相當(dāng)于1024個GPU需要1536個光模塊。GPU與400G光模塊的比例為1：1，1024個GPU與1024個光模塊的數(shù)量相等。

第四種情況：H100+ConnectX8（暫未發(fā)布）+QM9700三層網(wǎng)絡(luò)

在假設(shè)的情景中，如果H100GPU的網(wǎng)卡升級到800G，那么外部接口就需要從四個擴(kuò)展到八個OSFP接口。因此，層間連接也將使用800G光模塊?；揪W(wǎng)絡(luò)設(shè)計與初始方案保持一致，唯一的變化是將200G光模塊替換為800G光模塊。在此網(wǎng)絡(luò)架構(gòu)內(nèi)，GPU數(shù)量與所需光模塊保持1：65的比例，與初始場景相同。基于上述情況整理，假如2023年H100 GPU的出貨量為300000個，A100 GPU的出貨量為900000個，將產(chǎn)生315萬個200G光模塊、300000個400G光模塊和787500個800G光模塊的總需求。展望2024年，預(yù)計交付150萬臺H100 GPU和150萬臺A100 GPU，產(chǎn)生需求將包括75萬臺200G光模塊、75萬臺400G光模塊和675萬臺800G光模塊。對于A100 GPU，其連接均勻分配在200G交換機(jī)和400G交換機(jī)之間。對于H100 GPU，其連接均勻分配在200G交換機(jī)和400G交換機(jī)之間。

綜上所述

隨著技術(shù)的不斷進(jìn)步和發(fā)展，網(wǎng)絡(luò)領(lǐng)域見證了400G多模光模塊、AOC和DAC的出現(xiàn)。預(yù)計這些將引領(lǐng)高速解決方案進(jìn)一步的發(fā)展，為數(shù)字時代的網(wǎng)絡(luò)需求提供強(qiáng)大的支持。

審核編輯：黃飛

閱讀全文

gpu(126637) gpu(126637)
交換機(jī)(95620) 交換機(jī)(95620)
光模塊(58092) 光模塊(58092)

相比GPU和GPP，F(xiàn)PGA是深度學(xué)習(xí)的未來？

相比GPU和GPP，F(xiàn)PGA在滿足深度學(xué)習(xí)的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗，F(xiàn)PGA將在一般的深度學(xué)習(xí)應(yīng)用中展現(xiàn)GPU和GPP所沒有的獨特優(yōu)勢。同時，算法

2016-07-28 12:16:38

7367

NVIDIA CUDA深度神經(jīng)網(wǎng)絡(luò)庫實現(xiàn)高性能GPU加速

NVIDIA CUDA 深度神經(jīng)網(wǎng)絡(luò)庫（cuDNN）是一個 GPU 加速的深度神經(jīng)網(wǎng)絡(luò)基元庫，能夠以高度優(yōu)化的方式實現(xiàn)標(biāo)準(zhǔn)例程（如前向和反向卷積、池化層、歸一化和激活層）。

2022-07-23 11:04:34

1341

AI訓(xùn)練，為什么需要GPU？

隨著由ChatGPT引發(fā)的人工智能熱潮，GPU成為了AI大模型訓(xùn)練平臺的基石，甚至是決定性的算力底座。為什么GPU能力壓CPU，成為炙手可熱的主角呢？要回答這個問題，首先需要了解當(dāng)前人工智能（AI

2024-04-24 08:05:10

177

5G商用，中回傳光模塊不可或缺

隨著各個運營商網(wǎng)絡(luò)的DC化網(wǎng)絡(luò)重構(gòu)，DC將成為主要載體，用于對云化網(wǎng)絡(luò)資源的承載，提供計算存儲和轉(zhuǎn)發(fā)能力?！　?G中傳和回傳光模塊https://www.gigalight.com/cn

2019-12-12 17:36:16

5G時代來臨，光模塊如何順應(yīng)發(fā)展？

，預(yù)計光模塊需求上升?！　?G網(wǎng)絡(luò)是從RRU到BBU再到核心機(jī)房，到5G網(wǎng)絡(luò)時代可能會把BBU功能做一些拆分，切分成DU和CU。原來RRU到BBU屬于前傳，BBU到核心機(jī)房屬于回傳，5G新增出中傳

2019-11-07 17:23:35

AI開發(fā)者福音！阿里云推出國內(nèi)首個基于英偉達(dá)NGC的GPU優(yōu)化容器

的開發(fā)環(huán)境需求強(qiáng)烈。過去，安裝驅(qū)動、編譯庫文件等軟件集成工作費時費力，阿里云上的GPU計算平臺聯(lián)同NGC將為開發(fā)者節(jié)省大量準(zhǔn)備開發(fā)環(huán)境的的時間。NGC可以幫助開發(fā)人員免費訪問深度學(xué)習(xí)容器，包括

2018-04-04 14:39:24

AI智能呼叫中心

、數(shù)據(jù)驅(qū)動決策以及人力成本節(jié)約，旨在深入剖析其核心優(yōu)勢和對企業(yè)的重要意義。一、自動化處理AI智能呼叫中心通過引入自然語言處理(NLP)、機(jī)器學(xué)習(xí)和自動化技術(shù)，使得呼叫中心的處理過程更加高效和準(zhǔn)確，AI

2023-09-20 17:53:17

AI芯片界的領(lǐng)頭羊進(jìn)軍機(jī)器人行業(yè)

算法和大數(shù)據(jù)時代的到來、以及AI芯片的出現(xiàn)。第三波AI浪潮的發(fā)展主要由深度學(xué)習(xí)技術(shù)的突破引領(lǐng)，而英偉達(dá)（Nvidia）憑借其通用的GPU單元，專門的TensorRT加速器，強(qiáng)勁的矩陣運算性能加上對其他

2018-06-11 08:20:23

AI運算核心，F(xiàn)PGA領(lǐng)域前程遠(yuǎn)大

裝置」與「感測裝置」成為不可或缺的一環(huán)。在AI模塊中，處理芯片與儲存系統(tǒng)之間的信道優(yōu)化，將直接影響系統(tǒng)在實時判斷與深度學(xué)習(xí)的效能，因此內(nèi)存模塊必須更重視客制化與穩(wěn)定性等需求。目前就AI產(chǎn)業(yè)面觀察，尤其

2017-12-05 08:09:38

Ai 部署的臨界考慮電子指南

%數(shù)據(jù)中心的工作量。平方GPU對培訓(xùn)工作量有效，但在人工智能的所有不同階段都不需要GPU。在2021年的一項研究中，56%的研究受訪者將成本列為他們面臨的最重大挑戰(zhàn)實施AI/ML解決方案。

2023-08-04 07:25:00

GPU八大主流的應(yīng)用場景

產(chǎn)生新需求，將帶來高性能GPU市場快速增長。GPU分類與主要廠商，資料來源：架構(gòu)師技術(shù)聯(lián)盟、華西證券研究所云端AI服務(wù)器AI服務(wù)器通常搭載GPU、FPGA、ASIC等加速芯片，利用CPU與加速芯片的組合

2021-12-07 10:04:11

ai芯片和gpu的區(qū)別

ai芯片和gpu的區(qū)別▌車載芯片的發(fā)展趨勢(CPU-GPU-FPGA-ASIC)過去汽車電子芯片以與傳感器一一對應(yīng)的電子控制單元(ECU)為主，主要分布與發(fā)動機(jī)等核心部件上。...

2021-07-27 07:29:46

光模塊價格是多少錢？單模光模塊和多模光模塊哪個貴？

`光模塊在現(xiàn)在的生活中應(yīng)用很廣，平時我們所用到的光網(wǎng)絡(luò)傳輸中也離不開光模塊的作用。光模塊在生活中應(yīng)用那么廣泛，那么，光模塊價格是多少錢？小編在上一篇文章中也有介紹到光模塊有著多種類型（不明白的戳這里

2017-08-31 14:09:57

光模塊技術(shù)：如何測試光模塊的性能？

安裝好光模塊后，測試其性能是必不可少的步驟。當(dāng)整個網(wǎng)絡(luò)系統(tǒng)中的光器件是由一個供應(yīng)商供應(yīng)時，如果網(wǎng)絡(luò)系統(tǒng)能夠正常工作，那么就不需要對系統(tǒng)的子組件分別進(jìn)行測試。但是，現(xiàn)在大部分網(wǎng)絡(luò)系統(tǒng)中的子部件都來

2022-04-14 20:46:41

光模塊是什么？光模塊的作用是什么？

光模塊是什么？光模塊有著哪些分類呢？光模塊的作用是什么？

2021-05-18 06:53:56

光模塊的結(jié)構(gòu)以及電源需求

本文基于光模塊標(biāo)準(zhǔn)和需求出發(fā)，介紹了TI多款小體積電源產(chǎn)品在光模塊里的應(yīng)用及其在光模塊應(yīng)用場景下的注意事項。1. 光模塊簡介光模塊(Optical module)是光電和電光轉(zhuǎn)換的光電子器件，見圖1

2022-11-03 07:14:50

剖析：10G粗波分復(fù)用CWDM技術(shù)原理和網(wǎng)絡(luò)應(yīng)用

利用光復(fù)用器將不同波長的光信號復(fù)用至單根光纖進(jìn)行傳輸，在鏈路的接收端，借助光解復(fù)用器將光纖中的混合信號分解為不同波長的信號，連接到相應(yīng)的接收設(shè)備。在本文中，易飛揚通信將詳細(xì)剖析10G粗波分復(fù)用CWDM

2018-03-27 14:58:14

深度剖析OpenHarmony AI調(diào)度管理與推理接口

，基于NCNN、MNN、Paddlelite多種常用端側(cè)推理框架進(jìn)行了接口的統(tǒng)一。圖1 AI推理任務(wù)管理與統(tǒng)一推理接口架構(gòu)圖各模塊介紹：任務(wù)安排：創(chuàng)建、任務(wù)、任務(wù)?？蚣苷{(diào)度：推理框架加載、卸載。算法引擎

2022-03-25 11:15:36

深度學(xué)習(xí)在汽車中的應(yīng)用

的“深度”層面源于輸入層和輸出層之間實現(xiàn)的隱含層數(shù)目，隱含層利用數(shù)學(xué)方法處理（篩選/卷積）各層之間的數(shù)據(jù)，從而得出最終結(jié)果。在視覺系統(tǒng)中，深度（vs.寬度）網(wǎng)絡(luò)傾向于利用已識別的特征，通過構(gòu)建更深的網(wǎng)絡(luò)

2019-03-13 06:45:03

深度學(xué)習(xí)推理和計算-通用AI核心

，支持廣泛的應(yīng)用程序和動態(tài)工作負(fù)載。本文將討論這些行業(yè)挑戰(zhàn)可以在不同級別的硬件和軟件設(shè)計采用Xilinx VERSAL AI核心，業(yè)界首創(chuàng)自適應(yīng)計算加速平臺超越了CPU/GPU和FPGA的性能。

2020-11-01 09:28:57

深度學(xué)習(xí)框架TensorFlow&TensorFlow-GPU詳解

TensorFlow&TensorFlow-GPU：深度學(xué)習(xí)框架TensorFlow&TensorFlow-GPU的簡介、安裝、使用方法詳細(xì)攻略

2018-12-25 17:21:10

AMD迎頭猛追Intel 全球首發(fā)7nm GPU很威風(fēng)！

MI60與MI50加速器，為全球首款7奈米資料中心GPU，旨在滿足新一代深度學(xué)習(xí)、高效能運算、云端運算以及渲染等應(yīng)用所需的運算效能需求。研究人員、科學(xué)家以及開發(fā)者等將能夠運用AMD Radeon

2018-11-20 11:35:12

C語言深度剖析

2017-08-25 09:08:28

C語言深度剖析

C語言深度剖析[完整版].pdfC語言深度剖析[完整版].pdf (919.58 KB )

2019-03-19 05:11:41

C語言深度剖析

C語言深度剖析——一本關(guān)于C語言學(xué)習(xí)的教程，里面包含C語言編寫規(guī)范，各種變量指針用法等。以含金量勇敢挑戰(zhàn)國內(nèi)外同類書籍

2012-08-14 11:36:46

FPGA 超越 GPU，問鼎下一代深度學(xué)習(xí)主引擎

，以使得數(shù)據(jù)可以理解和處理。數(shù)據(jù)分析通常依賴于機(jī)器學(xué)習(xí)（ML）算法。在ML算法中，深度卷積神經(jīng)網(wǎng)絡(luò)（DNN）為重要的圖像分類任務(wù)提供了最先進(jìn)的精度，并被廣泛采用。在最近

2017-04-27 14:10:12

FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class="flag-6" style="color: red">GPU

硬件公司供貨的不斷增加，GPU 在深度學(xué)習(xí)中的市場需求還催生了大量公共云服務(wù)，這些服務(wù)為深度學(xué)習(xí)項目提供強(qiáng)大的 GPU 虛擬機(jī)。但是顯卡也受硬件和環(huán)境的限制。Larzul 解釋說：“神經(jīng)網(wǎng)絡(luò)訓(xùn)練

2024-03-21 15:19:45

Gaudi Training系統(tǒng)介紹

，這就轉(zhuǎn)化為對訓(xùn)練系統(tǒng)高效擴(kuò)展的日益增長的需求。典型的深度學(xué)習(xí)訓(xùn)練算法包括多種類型的算子，這些算子加起來要進(jìn)行數(shù)十億次運算。這些大量的操作可以通過使用先進(jìn)GPU提供的固有并行處理來加速。然而，GPU主要

2023-08-04 06:48:48

Mali GPU支持tensorflow或者caffe等深度學(xué)習(xí)模型嗎

Mali GPU 支持tensorflow或者caffe等深度學(xué)習(xí)模型嗎？好像caffe2go和tensorflow lit可以部署到ARM，但不知道是否支持在GPU運行？我希望把訓(xùn)練

2022-09-16 14:13:01

Nanopi深度學(xué)習(xí)之路(1)深度學(xué)習(xí)框架分析

，高度模塊化，可擴(kuò)展性）。 ? 同時支持卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)，以及兩者的組合。? 在 CPU 和 GPU 上無縫運行。--摘自《Keras：基于-Python-的深度學(xué)習(xí)庫》

2018-06-04 22:32:12

Tir-RK3399+movidius AI深度學(xué)習(xí)評估板有哪些性能呢

Tir-RK3399+movidius是什么呢？Tir-RK3399+movidius AI深度學(xué)習(xí)評估板有哪些性能呢？RK3399的板卡配置主要有哪幾點呢？

2022-03-07 07:51:05

c語言深度剖析

2013-04-02 09:12:46

linux內(nèi)核深度剖析，另附有光盤資料

linux內(nèi)核深度剖析，對于想學(xué)linux內(nèi)核的人來說，絕對值得一看，另附有光盤資料。

2014-01-15 21:25:14

tengine是如何使用arm的GPU進(jìn)行加速的

【嵌入式AI】多目標(biāo)分類檢測系統(tǒng)實戰(zhàn)中，tengine是如何使用arm的GPU進(jìn)行加速的，這個原理能詳細(xì)說明一下嗎？

2022-09-02 14:18:54

　　華為云深度學(xué)習(xí)服務(wù)，讓企業(yè)智能從此不求人

服務(wù)，基于系統(tǒng)軟硬件結(jié)合方案，搭載華為云的云容器引擎CCE、GPU高性能計算、對象存儲服務(wù)(OBS)、高性能網(wǎng)絡(luò)等能力，并對分布式訓(xùn)練的調(diào)度算法、分布式梯度壓縮等進(jìn)行深度優(yōu)化后，在1000塊GPU的大規(guī)模集群中

2018-08-02 20:44:09

《C語言深度剖析》【超經(jīng)典書籍】

本帖最后由 zgzzlt 于 2012-8-16 14:23 編輯《C語言深度剖析》【超經(jīng)典書籍】

2012-08-02 08:59:42

【產(chǎn)品活動】阿里云GPU云服務(wù)器年付5折！阿里云異構(gòu)計算助推行業(yè)發(fā)展！

，本周將會推出針對異構(gòu)計算GPU實例GN5年付5折的優(yōu)惠活動，希望能夠打造良好的AI生態(tài)環(huán)境，幫助更多的人工智能企業(yè)以及項目順利上云。隨著深度學(xué)習(xí)對人工智能的巨大推動，深度學(xué)習(xí)所構(gòu)建的多層神經(jīng)網(wǎng)絡(luò)模型

2017-12-26 11:22:09

【技術(shù)雜談】動畫演示各大算法，助力 AI 小白順利入門

的過程中，要留給大家自己體會的。第3章深度學(xué)習(xí)簡史從神經(jīng)網(wǎng)絡(luò)的神經(jīng)元開始介紹感知機(jī)算法，主要是介紹深度學(xué)習(xí)一些主要概念背后的靈感，為深入了解他們的工作原理打下基礎(chǔ)。左圖是人類大腦的神經(jīng)元，右圖是感知器

2019-07-25 16:07:04

【資料分享】C語言深度剖析

C語言深度剖析

2015-10-16 15:16:24

一文看完GPU八大應(yīng)用場景，搶食千億美元市場

2021-12-07 09:59:04

人工智能AI-深度學(xué)習(xí)C#&LabVIEW視覺控制演示效果

不斷變化的，因此深度學(xué)習(xí)是人工智能AI的重要組成部分?？梢哉f人腦視覺系統(tǒng)和神經(jīng)網(wǎng)絡(luò)。2、目標(biāo)檢測、目標(biāo)跟蹤、圖像增強(qiáng)、強(qiáng)化學(xué)習(xí)、模型壓縮、視頻理解、人臉技術(shù)、三維視覺、SLAM、GAN、GNN等。

2020-11-27 11:54:42

人臉識別、語音翻譯、無人駕駛...這些高科技都離不開深度神經(jīng)網(wǎng)絡(luò)了！

了。下面介紹幾種深度學(xué)習(xí)的方法，它們使識別錯誤率極大地降低。卷積神經(jīng)網(wǎng)絡(luò)：AlexNet 在 2012 年，深度學(xué)習(xí)第一次被運用到 ImageNet 比賽中。其效果非常顯著，錯誤率從前一年的 26

2018-05-11 11:43:14

什么是光模塊？光模塊又有著哪些類型和參數(shù)？

什么是光模塊？光模塊又有著哪些類型和參數(shù)？光模塊又應(yīng)用在哪些領(lǐng)域呢？

2021-05-18 06:10:08

什么是深度學(xué)習(xí)？使用FPGA進(jìn)行深度學(xué)習(xí)的好處？

什么是深度學(xué)習(xí)為了解釋深度學(xué)習(xí)，有必要了解神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)是一種模擬人腦的神經(jīng)元和神經(jīng)網(wǎng)絡(luò)的計算模型。作為具體示例，讓我們考慮一個輸入圖像并識別圖像中對象類別的示例。這個例子對應(yīng)機(jī)器學(xué)習(xí)中的分類

2023-02-17 16:56:59

什么是深度殘差收縮網(wǎng)絡(luò)？

　　　深度殘差收縮網(wǎng)絡(luò)是深度殘差網(wǎng)絡(luò)的一種新的升級版本，其實是深度殘差網(wǎng)絡(luò)、注意力機(jī)制（參照Squeeze-and-Excitation Network，SENet）和軟閾值化的深度集成

2020-11-26 06:33:10

什么是CWDM光模塊？CWDM光模塊應(yīng)用在什么地方？

什么是CWDM光模塊？CWDM光模塊有哪些封裝方式？CWDM光模塊應(yīng)用在什么地方？

2021-05-18 06:46:07

什么是SFP光模塊？SFP光模塊由哪些器件構(gòu)成？

什么是SFP光模塊？SFP光模塊由哪些器件構(gòu)成？SFP光模塊有哪些分類？

2021-05-17 06:09:51

從AlexNet到MobileNet，帶你入門深度神經(jīng)網(wǎng)絡(luò)

思維導(dǎo)圖如下：發(fā)展歷程DNN-定義和概念在卷積神經(jīng)網(wǎng)絡(luò)中，卷積操作和池化操作有機(jī)的堆疊在一起，一起組成了CNN的主干。同樣是受到獼猴視網(wǎng)膜與視覺皮層之間多層網(wǎng)絡(luò)的啟發(fā)，深度神經(jīng)網(wǎng)絡(luò)架構(gòu)架構(gòu)應(yīng)運而生，且

2018-05-08 15:57:47

從CPU、GPU再到TPU，Google的AI芯片是如何一步步進(jìn)化過來的？

電腦、智能手機(jī)等）上運行繪圖運算工作的微處理器。因為對于處理圖像數(shù)據(jù)來說，圖像上的每一個像素點都有被處理的需要，這是一個相當(dāng)大的數(shù)據(jù)，所以對于運算加速的需求圖像處理領(lǐng)域最為強(qiáng)烈，GPU也就

2017-03-15 11:40:15

分布式光伏系統(tǒng)解決方案分析

在光伏電站系統(tǒng)設(shè)計中，光伏組件的安裝容量和逆變器的額定容量的比值即為容配比，是一個非常重要的設(shè)計參數(shù)。在2012年發(fā)布的《光伏發(fā)電系統(tǒng)效能標(biāo)準(zhǔn)》中，容配比是按1:1設(shè)計的，但是由于光照條件以及溫度

2022-09-10 12:02:41

單模光模塊和多模光模塊的區(qū)別是什么？

多用于SR等短距離的傳輸中，這類網(wǎng)絡(luò)的節(jié)點和接頭都比較多，使用多模光模塊可以降低成本；單模光模塊多用于傳輸速率相對較高的線路中，如城域網(wǎng)。此外，多模設(shè)備只能在多模光纖上有效運行，而單模設(shè)備在單模

2018-03-13 15:02:23

國產(chǎn)工業(yè)級RK3568核心板-AI人臉識別產(chǎn)品方案

和流暢度。聲音模組：在人臉識別終端產(chǎn)品中，通常需要輸出語音提示信息，以指導(dǎo)用戶操作。因此，可以選擇支持高保真音質(zhì)、多種音頻格式解碼的聲音模組，以提供優(yōu)質(zhì)的語音輸出效果。 網(wǎng)絡(luò)通信模組：為了實現(xiàn)人臉

2023-05-06 14:30:45

如何使用stm32cube.ai部署神經(jīng)網(wǎng)絡(luò)？

如何用stm32cube.ai簡化人工神經(jīng)網(wǎng)絡(luò)映射？如何使用stm32cube.ai部署神經(jīng)網(wǎng)絡(luò)？

2021-10-11 08:05:42

射頻系統(tǒng)的深度學(xué)習(xí)【回映分享】

本文由回映電子整理分享，歡迎工程老獅們參與學(xué)習(xí)與評論內(nèi)容? 射頻系統(tǒng)中的深度學(xué)習(xí)? Deepwave Digital技術(shù)? 信號檢測和分類示例? GPU的實時DSP基準(zhǔn)測試? 總結(jié)回映電子是一家

2022-01-05 10:00:58

嵌入式網(wǎng)絡(luò)那些事LwIP協(xié)議深度剖析與實戰(zhàn)演練

本帖最后由 lee_st 于 2018-4-3 09:43 編輯嵌入式網(wǎng)絡(luò)那些事LwIP協(xié)議深度剖析與實戰(zhàn)演練

2018-04-02 10:44:08

當(dāng)AI遇上FPGA會產(chǎn)生怎樣的反應(yīng)

是人工智能大躍進(jìn)的基礎(chǔ)，在線下模型訓(xùn)練中Xeon-Phi、GPU等發(fā)揮著巨大的作用，而在線上的推理任務(wù)中，浪潮FPGA深度學(xué)習(xí)加速解決方案則能夠?qū)崿F(xiàn)7倍以上的能效比提升。卷積網(wǎng)絡(luò)之父、Facebook

2021-09-17 17:08:32

微型微控制器與強(qiáng)大的人工智能（AI）世界有什么關(guān)系

嵌入式應(yīng)用可能的極限，嵌入式設(shè)計已經(jīng)能夠提高網(wǎng)絡(luò)攻擊的實時響應(yīng)能力和設(shè)備安全性。支持AI的MCU云計算推動了對具有AI功能的MCU的需求；它減少了數(shù)據(jù)傳輸所需的帶寬，并節(jié)省了云服務(wù)器的處理能力，如下圖。配備AI算法的MCU正在應(yīng)用包含對象識別，啟用語音服務(wù)和自然語言處理等功能的應(yīng)用程序..

2021-11-01 08:55:02

智能網(wǎng)卡簡介及其在高性能計算中的作用

最先進(jìn)的人工智能模型在不到五年的時間內(nèi)經(jīng)歷了超過 5，000 倍的規(guī)模擴(kuò)展。這些 AI 模型嚴(yán)重依賴復(fù)雜的計算和大量內(nèi)存來實現(xiàn)高性能深度神經(jīng)網(wǎng)絡(luò) （DNN）。只有使用 CPU、GPU 或?qū)Ｓ眯酒?/div>

2023-07-28 10:10:17

有沒有大神會GPU模塊的使用

最近在看labview中GPU模塊的使用，但是GPU模塊只有3個例子，難懂啊。有木有大神會的

2014-03-12 10:05:14

硬件幫助將AI移動到邊緣

雖然人工智能和機(jī)器學(xué)習(xí)計算通常在數(shù)據(jù)中心中大規(guī)模地執(zhí)行，但是最新的處理設(shè)備使得能夠?qū)?b class="flag-6" style="color: red">AI / ML能力嵌入到網(wǎng)絡(luò)邊緣的IoT設(shè)備中。邊緣的AI可以快速響應(yīng)，無需等待云的響應(yīng)。如果可以在本地完成推理

2019-05-29 10:38:09

請問有誰轉(zhuǎn)讓嵌入式網(wǎng)絡(luò)那些事lwip協(xié)議深度剖析與實戰(zhàn)演練這本書嗎？

有沒有轉(zhuǎn)讓嵌入式網(wǎng)絡(luò)那些事lwip協(xié)議深度剖析與實戰(zhàn)演練這本書的呀？現(xiàn)在除了某寶能買到這本書（八成是盜版），其他網(wǎng)站都買不到了，我特別想看看這本書，求各位大神幫助~~

2019-08-18 21:19:32

資料共享：嵌入式網(wǎng)絡(luò)那些事LwIP協(xié)議深度剖析與實戰(zhàn)演練

嵌入式網(wǎng)絡(luò)那些事LwIP協(xié)議深度剖析與實戰(zhàn)演練

2016-06-12 13:43:17

車輛中的AI應(yīng)用有哪些

自動駕駛車輛中的AI分析車輛中的AI應(yīng)用

2021-03-09 07:53:23

迎5G，國內(nèi)光模塊廠商大盤點

明確了5G網(wǎng)絡(luò)承載需求，明確指出25G/100G/400G光模塊新需求將成為5G時代光通信的主流。那么國內(nèi)有此資質(zhì)的光模塊廠商有哪些呢？公司主營業(yè)務(wù)備注光迅科技光器件國內(nèi)光無源器件生產(chǎn)規(guī)模大，品種多

2020-03-05 14:13:28

阿里云CPFS在人工智能/深度學(xué)習(xí)領(lǐng)域的實踐

拷貝多份占用存儲空間，也給網(wǎng)絡(luò)管理和數(shù)據(jù)管理帶來了復(fù)雜性；并且由于數(shù)據(jù)無法共享，無法支持整個GPU集群同時運行任務(wù)，降低了整個IT系統(tǒng)的使用效率。為了便于數(shù)據(jù)管理和共享，傳統(tǒng)文件存儲在AI系統(tǒng)中得到一定

2018-08-23 17:39:35

陳正沖《C語言深度剖析》

陳正沖編寫的《C語言深度剖析》，挺經(jīng)典，剛來論壇，多多指教~~

2013-08-17 12:06:03

POLA DCDC模塊電源磚電路設(shè)計剖析

考慮到POLA 模塊電源的電路設(shè)計基本相同，本文以PTH03030 POLA 模塊電路為例,對其電路設(shè)計進(jìn)行了深度剖析。

2009-11-24 11:54:39

C語言深度剖析

C語言深度剖析。

2016-05-05 17:40:59

GPU要超越CPU擠身一線主角還得靠AI

GPU應(yīng)用因AI開始有了截然不同的新轉(zhuǎn)變，不只讓一些支援高度平行運算應(yīng)用的高階GPU相繼問世，現(xiàn)在連整套GPU深度學(xué)習(xí)專用服務(wù)器也搶灘登陸，要助企業(yè)加快AI應(yīng)用。

2016-05-03 10:25:22

912

C語言深度剖析

2016-12-20 22:50:25

深度神經(jīng)網(wǎng)絡(luò)的壓縮和正則化剖析

到只有有限硬件資源的嵌入式系統(tǒng)上。為了解決這個限制，可以使用深度壓縮來顯著地減少神經(jīng)網(wǎng)絡(luò)所需要的計算和存儲需求。例如對于具有全連接層的卷積神經(jīng)網(wǎng)絡(luò)(如Alexnet和VGGnet)，深度壓縮可以將模型大小減少35到49倍。

2017-11-16 13:11:35

1630

詳細(xì)剖析神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)的區(qū)別

那么到底多少層算深度呢？這個問題可能沒有一個明確的答案。某種意義上，這個問題類似“有多少粒沙子才能算沙丘”。但是，一般而言，我們把有兩層或兩層以上隱藏層的網(wǎng)絡(luò)叫做深度網(wǎng)絡(luò)。相反，只有一個隱藏層的網(wǎng)絡(luò)

2017-12-27 17:20:05

31000

深度學(xué)習(xí)之GPU硬件選型

本文談了談gpu的一些重要的硬件組成，就深度學(xué)習(xí)而言，我覺得對內(nèi)存的需求還是比較大的，core多也并不是能夠全部用上，但現(xiàn)在開源的庫實在完整，想做卷積運算有cudnn，想做卷積神經(jīng)網(wǎng)絡(luò)caffe

2018-01-06 12:01:09

3517

基于虛擬化的多GPU深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練框架

針對深度神經(jīng)網(wǎng)絡(luò)在分布式多機(jī)多GPU上的加速訓(xùn)練問題，提出一種基于虛擬化的遠(yuǎn)程多GPU調(diào)用的實現(xiàn)方法。利用遠(yuǎn)程GPU調(diào)用部署的分布式GPU集群改進(jìn)傳統(tǒng)一對一的虛擬化技術(shù)，同時改變深度神經(jīng)網(wǎng)絡(luò)在分布式

2018-03-29 16:45:25

GPU和GPP相比誰才是深度學(xué)習(xí)的未來

相比GPU和GPP，F(xiàn)PGA在滿足深度學(xué)習(xí)的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗，F(xiàn)PGA將在一般的深度學(xué)習(xí)應(yīng)用中展現(xiàn)GPU和GPP所沒有的獨特優(yōu)勢。

2019-10-18 15:48:14

1337

NVIDIA GPU加速AI推理洞察，推動跨行業(yè)創(chuàng)新

這些AI模型被運行在裝載了V100Tensor Core GPU的NVIDIADGX系統(tǒng)上的數(shù)據(jù)中心服務(wù)器上，以及裝載了JetsonAGX Xavier模塊的邊緣計算網(wǎng)絡(luò)中。該硬件運行NVIDIA

2020-07-02 15:00:54

1831

深度剖析筆記本散熱模塊的散熱風(fēng)扇技術(shù)

差不多的風(fēng)扇，效率總會因這些因素而出現(xiàn)較大的差異。深度剖析散熱風(fēng)扇在筆記本散熱模塊的三要素中，散熱風(fēng)扇在很大程度上可以彌補(bǔ)熱管和散熱鰭片自身導(dǎo)熱和散熱效率的不足，而這也就是為什么硬件配置相同，散熱風(fēng)扇、熱管

2020-08-27 10:41:30

7383

剖析AI芯片市場：為什么要加強(qiáng)深度學(xué)習(xí)

目前，整個AI芯片市場都圍繞著深度學(xué)習(xí)而展開。深度學(xué)習(xí)（DL），則正是讓AI應(yīng)用程序在現(xiàn)實世界中真正發(fā)揮作用的最成功的機(jī)器學(xué)習(xí)技術(shù)范例。

2020-08-13 10:46:40

2006

面向低功耗AI芯片上的神經(jīng)網(wǎng)絡(luò)設(shè)計介紹

這篇文章為大家介紹了一下面向低功耗AI芯片上的神經(jīng)網(wǎng)絡(luò)設(shè)計，隨著這幾年神經(jīng)網(wǎng)絡(luò)和硬件（CPU,GPU,FPGA,ASIC）的迅猛發(fā)展，深度學(xué)習(xí)在包...

2020-12-14 23:40:08

559

NVIDIA GPU加快深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推斷

深度學(xué)習(xí)是推動當(dāng)前人工智能大趨勢的關(guān)鍵技術(shù)。在 MATLAB 中可以實現(xiàn)深度學(xué)習(xí)的數(shù)據(jù)準(zhǔn)備、網(wǎng)絡(luò)設(shè)計、訓(xùn)練和部署全流程開發(fā)和應(yīng)用。聯(lián)合高性能 NVIDIA GPU 加快深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推斷。

2022-02-18 13:31:44

1762

深度剖析時間復(fù)雜度

相信每一位錄友都接觸過時間復(fù)雜度，但又對時間復(fù)雜度的認(rèn)識處于一種朦朧的狀態(tài)，所以是時候?qū)r間復(fù)雜度來一個深度的剖析了。

2022-03-18 10:18:51

1589

FPGA中GPU深度學(xué)習(xí)面臨的挑戰(zhàn)

三維圖形是 GPU 擁有如此大的內(nèi)存和計算能力的根本原因，它與深度神經(jīng)網(wǎng)絡(luò) 有一個共同之處：都需要進(jìn)行大量矩陣運算。

2022-08-06 15:56:02

649

汽車新熱點：T-BOX系統(tǒng)解決方案深度剖析之接口

2022-11-01 08:26:21

汽車新熱點: T-BOX系統(tǒng)解決方案深度剖析之電源軌

2022-11-01 08:26:22

GPU 引領(lǐng)的深度學(xué)習(xí)

GPU 引領(lǐng)的深度學(xué)習(xí)

2023-01-04 11:17:16

501

稱重模塊工作原理剖析

2022-03-11 13:22:34

1739

AI開發(fā)測試關(guān)于CPU和GPU的資源配比

GPU服務(wù)器相對CPU服務(wù)器來說是非常昂貴的，大約是美金和人民幣匯率的差距（以8卡GPU服務(wù)器為例），而且在芯片緊缺的年代，GPU到貨周期還比較長！面對資源昂貴、算力又是AI的發(fā)動機(jī)、AI業(yè)務(wù)又必須開展之間的矛盾，如何更好的利用和管理GPU資源就變得尤其關(guān)鍵。下面一起來看看這五大典型場景。

2023-06-25 11:31:36

1157

ai芯片和傳統(tǒng)芯片的區(qū)別 GPU與CPU的架構(gòu)對比

AI芯片在處理大規(guī)模數(shù)據(jù)和復(fù)雜計算任務(wù)（例如深度學(xué)習(xí)算法）時具有更高的計算性能。它們通常集成了多個高性能的計算單元，如GPU（圖形處理器）或?qū)ｉT的神經(jīng)網(wǎng)絡(luò)處理器（NPU）。

2023-08-05 16:11:02

4807

ai芯片和gpu芯片有什么區(qū)別？

，AI芯片是專門為人工智能而設(shè)計的，它在處理神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)方面更加高效。而GPU芯片則是為了更好地處理圖像和視頻等方面而略微弱于AI芯片。其次，AI芯片通常采用多核心硬件設(shè)計，這些核心之間可以并行工作，處理復(fù)雜的神經(jīng)網(wǎng)絡(luò)，并且更加靈

2023-08-08 18:02:28

4084

千兆光模塊還能滿足現(xiàn)代網(wǎng)絡(luò)需求嗎？

本文通過分析千兆光模塊的技術(shù)特點和現(xiàn)在的網(wǎng)絡(luò)需求，討論了千兆光模塊是否還能滿足現(xiàn)代網(wǎng)絡(luò)需求的問題。文章提出，在一些特定場合，千兆光模塊仍然是一種可行的選擇，但在面對更高速、更大容量的數(shù)據(jù)傳輸時，就需要選擇更高速率光模塊。

2023-10-09 10:04:26

225

萬兆光模塊是否能夠應(yīng)對未來網(wǎng)絡(luò)的需求？

萬兆光模塊在網(wǎng)絡(luò)傳輸中發(fā)揮著重要的作用，但是隨著未來網(wǎng)絡(luò)需求的不斷提升，它是否能夠應(yīng)對越來越高的需求呢？本文通過對萬兆光模塊與未來網(wǎng)絡(luò)需求來分析。

2023-10-30 11:30:16

227

C語言深度剖析.zip

C語言深度剖析

2022-12-30 09:20:02

深度剖析 IGBT 柵極驅(qū)動注意事項

2023-11-24 14:48:25

299

GPU在深度學(xué)習(xí)中的應(yīng)用與優(yōu)勢

人工智能的飛速發(fā)展，深度學(xué)習(xí)作為其重要分支，正在推動著諸多領(lǐng)域的創(chuàng)新。在這個過程中，GPU扮演著不可或缺的角色。就像超級英雄電影中的主角一樣，GPU在深度學(xué)習(xí)中擁有舉足輕重的地位。那么，GPU在深度

2023-12-06 08:27:37

705

網(wǎng)絡(luò)布局與光模塊配置需求深度解析

以傳統(tǒng)三層架構(gòu)到葉脊架構(gòu)的轉(zhuǎn)變?yōu)槔~脊網(wǎng)絡(luò)架構(gòu)下，光模塊數(shù)量提升最高可達(dá)到數(shù)十倍。

2024-04-01 10:09:47

133

AI算力GPU開始騰飛，背后是電源管理的持續(xù)支持

為AI PC元年。 ? 不僅是AI PC，還包括AI服務(wù)器、AI手機(jī)、AI汽車等，眾多AI實際應(yīng)用讓算力GPU的需求大增，也在不斷追求性能更高的GPU。而隨著GPU性能的提升，其功耗與穩(wěn)定性的難度也隨之增加。這就需要電源管理在背后為其提供穩(wěn)定的電力供應(yīng)，讓GPU提供更好的AI算力支持

2024-03-30 00:12:00

3033

已全部加載完成

搜索歷史

深度剖析AI網(wǎng)絡(luò)中GPU與光模塊配比及需求

評論