更多虛機重啟優(yōu)先級
當(dāng)故障轉(zhuǎn)移(failover)發(fā)生時,虛機重啟優(yōu)先級決定了虛機重啟的先后順序。需要重啟的虛機被分配給還有空閑資源的服務(wù)器,高優(yōu)先級的虛機被優(yōu)先分配,然后是次一級優(yōu)先級的虛機,直到所有的空閑資源用完。服務(wù)器然后按照優(yōu)先順序啟動虛機,如果資源不夠了,vSphere 會暫停重啟動作,直到有足夠的資源可用(因為有其他的虛機釋放資源了)。
在 vSphere 6.5 中新增了兩個虛機重啟優(yōu)先級(下面標藍色的兩個級別),讓管理員有更多的配置選擇,把虛機的優(yōu)先等級分得更細。
- Highest
- High
- Medium
- Low
- Lowest

虛機重啟順序可控
一個多層應(yīng)用(Multi-Tiered Application)是由多個虛機組成的,如數(shù)據(jù)庫、應(yīng)用服務(wù)器、Web 服務(wù)器等,這些虛機的啟動應(yīng)該有一個先后順序,在一般的情況下,應(yīng)該遵循數(shù)據(jù)庫→應(yīng)用服務(wù)器→Web服務(wù)器的順序。vSphere 用 vApp 把這些虛機組成一組,作為一個整體來進行管理。管理員可以給 vApp 分配資源,把 vApp 作為一個整體來啟動或關(guān)閉等。在 vApp 的配置中,通過指定每一個虛機啟動的延遲時間來調(diào)整各個虛機的啟動順序。
vSphere 6.5 引入了虛機之間的依賴鏈機制來控制多層應(yīng)用的啟動,通過指定虛機之間的依賴關(guān)系來定義它們的啟動順序,這稱之為順序可控的重啟(Orchestrated Restart)。在下圖的例子中,APP 依賴于 DB,WEB 依賴于 APP,所以它們的啟動順序就如數(shù)字標識所示。vSphere 會檢依賴鏈的有效性,避免產(chǎn)生無效的依賴關(guān)系:
- 循環(huán)依賴:例如下圖中 DB 又依賴于 WEB;
- 依賴關(guān)系跟重啟優(yōu)先級相矛盾:例如下圖中 APP 和 WEB 為高優(yōu)先級,但是 DB 卻被定義為低優(yōu)先級。

主動預(yù)防系統(tǒng)故障
傳統(tǒng)的 HA 都是被動的,只有當(dāng)服務(wù)器故障時,才會把受保護的虛機故障轉(zhuǎn)移(failover)到其他的服務(wù)器上去。現(xiàn)在主流的服務(wù)器廠商都提供了硬件系統(tǒng)的監(jiān)控和預(yù)警功能,使得主動預(yù)防成為可能。vSphere 6.5 可以通過插件與以下服務(wù)器廠商的系統(tǒng)管理工具相集成,以實現(xiàn)主動預(yù)防式 HA(Proactive HA):
- Dell Openmanage
- HP Insight Manager
- Cisco UCS Manager
這些系統(tǒng)管理工具會把服務(wù)器的一些異常狀況向 vSphere 告警,例如某個散熱風(fēng)扇發(fā)生故障,某塊硬盤的讀寫故障率超出正常閾值范圍等等。當(dāng)這種告警發(fā)生時,意味著服務(wù)器處于亞健康狀態(tài),這時 vSphere 就會把這臺服務(wù)器處于隔離模式(Quarantine mode),這意味著該服務(wù)器上不會再啟動新的虛機,并且 vSphere 會盡可能地把該服務(wù)器上的虛機 vMotion 到其他健康服務(wù)器上去。
傳統(tǒng)的 HA 是當(dāng)服務(wù)器發(fā)生故障時才起作用,主動預(yù)防式 HA 把故障防患于未然,主動獲取服務(wù)器的故障預(yù)警,在宕機發(fā)生之前就把應(yīng)用負載轉(zhuǎn)移到其他服務(wù)器上去,從而為企業(yè)關(guān)鍵應(yīng)用提供更高等級的可靠性保護。
