遠(yuǎn)程管理功能(包括帶外管理)是 IT 管理員的標(biāo)準(zhǔn)功能。這些功能包括監(jiān)控系統(tǒng)功能、安裝新的更新和補(bǔ)丁以及解決問題,而無需實(shí)際出現(xiàn)在服務(wù)器機(jī)房中。
許多 IT 服務(wù)提供商遠(yuǎn)程訪問客戶的本地服務(wù)器或?qū)⑺鼈兺泄茉谠浦械哪硞€(gè)位置是標(biāo)準(zhǔn)做法。隨著新的 PICMG COM-HPC 接口規(guī)范(圖 1)的到來,支持這種久經(jīng)考驗(yàn)的實(shí)踐的遠(yuǎn)程管理能力將擴(kuò)展到邊緣服務(wù)器和網(wǎng)關(guān)層技術(shù)。實(shí)現(xiàn)數(shù)字化和 IIoT、邊緣服務(wù)器和網(wǎng)關(guān)層技術(shù)需要遠(yuǎn)程管理能力來克服企業(yè)級(jí) IT 和工業(yè)級(jí)運(yùn)營技術(shù) (OT) 之間的差距。COM-HPC 標(biāo)準(zhǔn)是為新的分布式邊緣計(jì)算層設(shè)計(jì)的。因此,這一新 IT 層的服務(wù)提供商需要類似于分布式本地或云設(shè)備的全面遠(yuǎn)程管理功能。
基于計(jì)算機(jī)模塊設(shè)計(jì)邊緣層平臺(tái)的工程師通常希望以可以根據(jù)特定需求定制的方式實(shí)現(xiàn)這些功能。針對(duì)這一需求,PICMG 引入了用于系統(tǒng)管理的 COM-HPC 子規(guī)范。為了不重新發(fā)明輪子,COM-HPC 子規(guī)范的部分內(nèi)容將借鑒智能平臺(tái)管理接口 (IPMI) 規(guī)范。
讓我們深入研究專用于系統(tǒng)管理接口的 COM-HPC 子規(guī)范,以了解它如何使 COM-HPC 設(shè)計(jì)受益。
壽命和穩(wěn)定性很重要
改進(jìn)邊緣服務(wù)器 QoS 的工作落到了 IPMI 身上,因?yàn)樗?1998 年以來一直存在,在 2001 年和 2004 年發(fā)布的附加修訂后達(dá)到了穩(wěn)健的狀態(tài),并得到普遍接受。PICMG 小組委員會(huì)還使用了 Redfish 規(guī)范,該規(guī)范基于 Representational State Transfer (RESTful) API 并繼續(xù)發(fā)布新功能。
IPMI 規(guī)范定義了用于監(jiān)視和管理計(jì)算機(jī)子系統(tǒng)的協(xié)議、接口和體系結(jié)構(gòu)(圖 2)。IPMI 標(biāo)準(zhǔn)化了描述低級(jí)硬件的格式以及從板管理控制器 (BMC) 發(fā)送和接收消息的格式。
圖 2. IPMI 調(diào)用可以通過網(wǎng)絡(luò)發(fā)送到遠(yuǎn)程系統(tǒng)或本地子系統(tǒng)。在大多數(shù)情況下,系統(tǒng)的模塊化是將 IPMI 功能擴(kuò)展到子系統(tǒng)(例如計(jì)算機(jī)模塊)的原因。
IPMI 消息可以通過網(wǎng)絡(luò)發(fā)送到遠(yuǎn)程系統(tǒng)的 BMC,也可以從 BMC 發(fā)送到本地子系統(tǒng),例如電源。這種關(guān)于發(fā)送 IPMI 消息的多功能性使得可以將復(fù)雜的管理任務(wù)劃分為幾個(gè)子區(qū)域。
這些消息可以查詢硬件的當(dāng)前狀態(tài)或指示 BMC 采取行動(dòng)——例如,指示 BMC 增加系統(tǒng)冷卻、告訴系統(tǒng)重新啟動(dòng)或讀取傳感器。將管理任務(wù)卸載到專用的物理硬件組件可以減輕主機(jī)硬件和操作系統(tǒng)的負(fù)擔(dān)。IPMI 規(guī)范還將系統(tǒng)管理與目標(biāo)平臺(tái)分離,以便即使在目標(biāo)平臺(tái)關(guān)閉時(shí)也可以啟動(dòng)系統(tǒng)管理功能。
所有這些功能使 IPMI 規(guī)范成為管理服務(wù)器硬件的事實(shí)標(biāo)準(zhǔn)。規(guī)范的壽命得到了保證,因?yàn)橐?guī)范的開發(fā)者故意使所需的命令非常簡單,不留任何誤解的余地。
IPMI 規(guī)范的靈活框架支持在原始規(guī)范的強(qiáng)制和可選命令之外添加新的網(wǎng)絡(luò)功能 (NetFn) 和指令。各種行業(yè)工作組已經(jīng)從這種自由中受益,并定義了自己的特定網(wǎng)絡(luò)功能和命令來處理規(guī)范創(chuàng)建期間未考慮的技術(shù)和特性。
許多遠(yuǎn)程管理選項(xiàng)
對(duì)于模塊化計(jì)算機(jī)系統(tǒng),靈活的框架簡化了添加遠(yuǎn)程管理所需的調(diào)整。一項(xiàng)調(diào)整涉及 COM-HPC 嵌入式 EEPROM (EEEP)。EEEP 包含有關(guān)供應(yīng)商、內(nèi)存插槽、網(wǎng)絡(luò)功能等的信息。其中大部分信息與存儲(chǔ)在 IPMI 現(xiàn)場可更換單元 (FRU) 中的信息相同。為避免重復(fù)此數(shù)據(jù),COM-HPC 遠(yuǎn)程管理功能包括有關(guān) IPMI 設(shè)備應(yīng)如何使用 EEEP 設(shè)備中包含的信息填充 FRU 的建議。
鑒于 COM-HPC 模塊的市場范圍很廣,包括遠(yuǎn)程數(shù)據(jù)中心、霧/邊緣服務(wù)器和遠(yuǎn)程安裝,擁有靈活的遠(yuǎn)程管理選項(xiàng)范圍很重要。開發(fā)人員還必須考慮到該標(biāo)準(zhǔn)為模塊和載板指定了非常不同的 IPMI 支持成熟度級(jí)別。
模塊的 IPMI 成熟度級(jí)別從非托管模塊 (MU) 和基本托管模塊 (MB) 到完全托管模塊 (MF)。載板級(jí)別范圍從非托管 (CU) 到托管載板 (CM)。規(guī)范中詳細(xì)解釋了這些差異,但在這個(gè)階段最重要的是要知道所有這些模塊和載板仍然可以互操作。
COM-HPC IPMI 規(guī)范允許所有類型的載板與所有類型的模塊一起正確運(yùn)行。
平臺(tái)靈活管控
PICMG COM-HPC IPMI 小組委員會(huì)意識(shí)到,需要基本管理功能的各種場景無法通過一刀切的解決方案提供服務(wù)。因此,多種模塊和載體設(shè)計(jì)組合可用于諸如打開和關(guān)閉系統(tǒng)電源或告訴系統(tǒng)獲取網(wǎng)絡(luò)信息等任務(wù)。
例如,當(dāng)使用最多四個(gè)模塊的單個(gè)載板時(shí),每個(gè)模塊具有獨(dú)立的完整管理能力會(huì)更有效。然而,不同的場景可能會(huì)受益于載板上成熟的 IPMI 實(shí)施,無論模塊是托管還是非托管,都可以針對(duì)特定功能進(jìn)行定制(圖 3)。
圖 3. 模塊和載板可以具有不同的 IPMI 支持成熟度級(jí)別,但仍可相互操作,從而實(shí)現(xiàn)各種系統(tǒng)設(shè)置——從具有四個(gè)托管模塊的單個(gè)非托管載體到具有非托管模塊的托管載體。
總會(huì)有系統(tǒng)設(shè)計(jì)者不想要管理功能。并且總會(huì)有系統(tǒng)設(shè)計(jì)人員需要最少的管理功能。因此,重要的是優(yōu)先考慮所有模塊管理層之間的互操作性。但設(shè)計(jì)師能夠訪問盡可能多的資源也很重要。
授予對(duì)系統(tǒng)資源的訪問權(quán)限越多,IPMI 就越強(qiáng)大。訪問和權(quán)力之間的這種關(guān)系就是為什么新的 COM-HPC 規(guī)范有一些特定的接口來提供最全面的系統(tǒng)管理功能。其中首先是智能平臺(tái)管理總線 (IPMB) 接口,它允許載板 BMC 訪問模塊管理控制器 (MMC)。
但規(guī)范不限于此總線。一種專門用于載板 BMC 的新接口是專用的獨(dú)立 PCI Express 通道,它包括并驅(qū)動(dòng)一個(gè)圖形控制器。
IPMI 專用的其他接口是 I2C 接口、USB 端口和電源按鈕控件。通過這些專用 IPMI 通道(也可通過 BMC 遠(yuǎn)程訪問),系統(tǒng)管理員可以控制幾乎整個(gè)平臺(tái)行為,以實(shí)現(xiàn)最佳 QoS、最短停機(jī)時(shí)間和最有效的遠(yuǎn)程維護(hù)。
舉幾個(gè)例子:
I2C 接口可用于訪問模塊上的 EEEP 數(shù)據(jù)。
USB 端口可用于模擬 USB 設(shè)備,例如鍵盤和鼠標(biāo)或 DVD 驅(qū)動(dòng)器。
電源控制可用于遠(yuǎn)程打開/關(guān)閉系統(tǒng)。
電源控制可用于延遲系統(tǒng)啟動(dòng),同時(shí) BMC 執(zhí)行額外的平臺(tái)初始化。
因此,新的 PICMG COM-HPC 子規(guī)范為全面的 IPMI 平臺(tái)管理功能鋪平了道路。工程師可以開始考慮實(shí)施 IPMI 的硬件設(shè)計(jì)原理圖。同時(shí),模塊供應(yīng)商及其合作伙伴可以開展 BMC 和 MMC 實(shí)施,例如利用 SP-X 和/或 OpenBMC 等開放標(biāo)準(zhǔn)固件(圖 4)。
圖 4. 市場上第一款康佳特 COM-HPC 客戶端模塊配備了 11 種 Intel Xeon、Core 和 Celeron 處理器(代號(hào)為 Tiger Lake U 和 Tiger Lake H)。帶有評(píng)估載板和冷卻解決方案的康佳特入門套件已經(jīng)過功能驗(yàn)證。按需支持客戶特定的 COM-HPC PMI 實(shí)施變體。
OpenBMC 是用于服務(wù)器、架頂式交換機(jī)、RAID 設(shè)備和其他設(shè)備的管理控制器的 Linux 發(fā)行版。OpenBMC 使用 Yocto、OpenEmbedded、systemd 和 D-Bus 來輕松定制平臺(tái)。它完全符合 DCMI 的 IPMI 2.0 標(biāo)準(zhǔn),并具有主機(jī)管理功能,例如電源、冷卻、LED、庫存、事件和看門狗。
OpenBMC 還提供廣泛的界面選擇,從遠(yuǎn)程 KVM、基于 SSH 的 SOL 和基于 Web 的用戶界面,到基于 REST 和 D-Bus 的界面。工程師受益于硬件模擬以及自動(dòng)化測試功能。對(duì)多個(gè) BMC/BIOS 映像的代碼更新支持完善了最近的功能集。
結(jié)論
系統(tǒng)構(gòu)建者的一個(gè)主要好處是,盡管 PICMG COM-HPC 計(jì)算機(jī)模塊規(guī)范是全新的,但它包含了經(jīng)過驗(yàn)證的 IPMI 和 Redfish 管理技術(shù),可以在此基礎(chǔ)上進(jìn)行創(chuàng)新。
作者:Jessica Isquith,Aaron Pop,David Wise
審核編輯:郭婷
-
控制器
+關(guān)注
關(guān)注
112文章
16332瀏覽量
177806 -
Linux
+關(guān)注
關(guān)注
87文章
11292瀏覽量
209327 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9123瀏覽量
85324
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論