可視化節(jié)點(diǎn)
可視化節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)一樣,但它包含一個(gè)或者多個(gè)圖形處理單元(GPU)以渲染3D圖形、計(jì)算機(jī)輔助工程(CAE)設(shè)計(jì)、產(chǎn)品部件動(dòng)態(tài)模擬驗(yàn)證、或者單個(gè)組件上的應(yīng)力分析。每個(gè)GPU是否可以支持多個(gè)并發(fā)的互動(dòng)片段取決于應(yīng)用。
預(yù)處理和后處理應(yīng)用大多是連續(xù)的,因此,這個(gè)節(jié)點(diǎn)中應(yīng)該有足夠的處理器資源來應(yīng)對計(jì)算要求?梢暬(jié)點(diǎn)通常有一些本地磁盤空間用于操作系統(tǒng)和運(yùn)行應(yīng)用的臨時(shí)存儲?梢暬(jié)點(diǎn)還加載NFS或者GPFS文件系統(tǒng)實(shí)現(xiàn)共享存儲。
登錄節(jié)點(diǎn)
登錄節(jié)點(diǎn)的功能是作為到集群的網(wǎng)關(guān)。當(dāng)用戶希望通過公共網(wǎng)絡(luò)訪問集群的時(shí)候,他們必須在可以登錄到其他集群節(jié)點(diǎn)之前首先登錄到登錄節(jié)點(diǎn)。一般情況下,我們建議使用這個(gè)方法作為防止管理節(jié)點(diǎn)未授權(quán)訪問的最佳實(shí)踐。
集群網(wǎng)絡(luò)
PHPC集群中使用了多個(gè)網(wǎng)絡(luò)。每個(gè)集群可能都有一個(gè)專門的網(wǎng)絡(luò),或者與其他集群共享一個(gè)公共網(wǎng)絡(luò)。
公共網(wǎng)絡(luò)
公共網(wǎng)絡(luò)將PHPC集群連接到公司網(wǎng)絡(luò)。
配置網(wǎng)絡(luò)
配置網(wǎng)絡(luò)(專有網(wǎng)絡(luò))是一個(gè)內(nèi)部網(wǎng)絡(luò),配置和管理集群節(jié)點(diǎn)。公共網(wǎng)絡(luò)上的節(jié)點(diǎn)不能訪問配置網(wǎng)絡(luò),配置網(wǎng)絡(luò)通常是千兆以太網(wǎng)。一般情況下,配置網(wǎng)絡(luò)有以下用途:
-集群管理和監(jiān)控
-工作負(fù)載管理和監(jiān)控
-消息傳遞
通常的做法是使用一個(gè)高速低延遲的互連網(wǎng)絡(luò)來傳遞消息。
管理網(wǎng)絡(luò)
管理網(wǎng)絡(luò)(BMC網(wǎng)絡(luò))是一個(gè)提供了帶外部訪問集群節(jié)點(diǎn)以管理硬件的網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)提供了對每個(gè)集群節(jié)點(diǎn)的CMM和IMM的訪問。公共網(wǎng)絡(luò)上的節(jié)點(diǎn)不能訪問管理網(wǎng)絡(luò)。(如果需要公共訪問,可配置切換到公共網(wǎng)絡(luò)以實(shí)現(xiàn)公共網(wǎng)絡(luò)和管理網(wǎng)絡(luò)之間的路由。)
應(yīng)用網(wǎng)絡(luò)
這個(gè)網(wǎng)絡(luò)(計(jì)算網(wǎng)絡(luò))主要是被應(yīng)用(例如MPI應(yīng)用)用來跨多個(gè)節(jié)點(diǎn)的一個(gè)應(yīng)用內(nèi)不同任務(wù)間有效共享數(shù)據(jù)的。這個(gè)網(wǎng)絡(luò)通常用于應(yīng)用訪問共享存儲的一個(gè)數(shù)據(jù)路徑。應(yīng)用網(wǎng)絡(luò)使用了一個(gè)高速互連,例如10Gb/40Gb以太網(wǎng)或者QDR/FDR InfiniBand。
如果PHPC集群包括一個(gè)可視化節(jié)點(diǎn),那就必須有一個(gè)從外部網(wǎng)絡(luò)到計(jì)算網(wǎng)絡(luò)的路由。如果系統(tǒng)是只針對批量工作安裝的話就沒有必要使用這個(gè)路由了(除了管理節(jié)點(diǎn))。可能使用虛擬本地局域網(wǎng)絡(luò)(VLAN)將這些網(wǎng)絡(luò)結(jié)合起來。
這些集群網(wǎng)絡(luò)可以結(jié)合成為一個(gè)或者兩個(gè)物理網(wǎng)絡(luò),在一些配置下最大限度降低網(wǎng)絡(luò)成本和精簡布線。目前PHPC提供了這兩種結(jié)合部署的選擇和支持。
一個(gè)典型的聯(lián)合部署可能是以下示例之一:
- 結(jié)合管理網(wǎng)絡(luò)和配置網(wǎng)絡(luò),外加一個(gè)專用的高速互連用于應(yīng)用。如果高速互連是InfiniBand的話通常是這種情況
- 結(jié)合配置網(wǎng)絡(luò)和應(yīng)用網(wǎng)絡(luò),使用萬兆以太網(wǎng),外加一個(gè)專用的管理網(wǎng)絡(luò)。當(dāng)管理工作在底座上有專門的開關(guān)的話,可以實(shí)現(xiàn)這種網(wǎng)絡(luò)架構(gòu)
IBM Platform HPC極大的減少了高性能計(jì)算的應(yīng)用復(fù)雜性,成為主流的企業(yè)級系統(tǒng)平臺,簡單的實(shí)現(xiàn)“將成千上萬臺計(jì)算機(jī)當(dāng)成一臺來管理和使用”,輕松構(gòu)建和維護(hù)高性能計(jì)算/分析云平臺。