給數據中心運維帶來極大挑戰(zhàn)
數據中心云化帶來了資源池化共享、業(yè)務快速發(fā)放、自動化部署等等諸多好處的同時,也給網絡運維帶來巨大的挑戰(zhàn)。據統(tǒng)計,隨著數據中心云化,5年間管理對象已增加10倍,網絡故障數增加了18倍以上,傳統(tǒng)的運維管理方式已經明顯力不從心。
同時,大數據技術的蓬勃發(fā)展也加速了商業(yè)創(chuàng)新,企業(yè)對業(yè)務可用性的要求持續(xù)提高,業(yè)務中斷將為企業(yè)帶來巨大的經濟損失,故障牽一發(fā)而動全身,因此,數據中心網絡急需更先進更高效的運維解決方案。
當前數據中心運維管理普遍最頭疼的問題,就是傳統(tǒng)運維手段只能看到設備的通斷和靜態(tài)指標,實際出現問題,往往反而是業(yè)務部門先于網絡部門感知到,而且傳統(tǒng)問題定位手段欠缺,快速故障根因定位和業(yè)務恢復更是一種奢望。
AI加持的智能運維
為云化中心管理帶來曙光
傳統(tǒng)的運維管理手段,為什么不能滿足云化中心的管理要求?
首先,目前業(yè)界使用的管理平臺基本都是基于SNMP協(xié)議,采用分鐘級輪詢機制來監(jiān)管網絡狀態(tài),通常5分鐘輪詢一次,如果周期過短會對設備CPU造成比較大的壓力,運維人員無法精確掌握現網狀態(tài)。
其次,傳統(tǒng)管理平臺故障定位完全依賴于人工經驗,運維人員每天面對海量告警根本無從下手,被動響應加長了故障定位和修復周期,對于企業(yè)無疑是雪上加霜。
再者,傳統(tǒng)管理平臺只能看到設備通斷和一些離散的指標,運維人員對于網絡整體質量情況不能全盤把握,每天網絡健康巡檢需要花費大量時間,還需手工繪制巡檢報告,增加了企業(yè)的人力成本投入。
面對如上諸多挑戰(zhàn),急需下一代運維解決方案。
華為重磅推出iMaster NCE-FabricInsight(以下簡稱FabricInsight,下同)智能運維分析系統(tǒng),內置強大AI引擎,是專為應對大數據時代數據中心網絡的下一代運維解決方案。
揭秘FabricInsight為何能成為
數據中心網絡運維的必備神器
- FabricInsight完全摒棄了傳統(tǒng)SNMP低效的輪詢機制,采用下一代數據采集技術Telemetry,網絡設備會將所需信息主動秒級上送,以達到全網設備關鍵指標秒級甚至亞秒級監(jiān)管。
- FabricInsight獨家首創(chuàng)網絡健康度AI評估體系,依托設備高性能AI芯片和分析器本地強大的AI分析引擎,實現設備和分析器兩級AI聯(lián)動,分工明確又相輔相成,真正達到邊緣智能。從多維度全面評估整網健康狀況,實時或定期發(fā)送網絡體檢報告,極大提高巡檢效率,降低人力成本。
- FabricInsight獨創(chuàng)網絡故障根因分析和演練學習AI引擎,通過故障演練引擎,將華為30多年、現網500多萬臺設備的數據中心運維經驗,持續(xù)注入到根因分析引擎中進行演練學習,強化根因分析算法,不斷提升故障定位效率,同時更進一步引入AI網絡知識圖譜,以使故障根因分析更加精準。
- FabricInsight擁有業(yè)界唯一的故障自閉環(huán)體系,依靠強大的故障根因分析引擎,典型故障可做到1分鐘識別,3分鐘定位根因,與華為控制器聯(lián)動自閉環(huán)處理,達到5分鐘快速恢復。
- FabricInsight支持單機版部署,只需一臺服務器,提供更強大功能的同時,降低部署成本。同時,對網絡組網解耦,無論是否SDN組網、無論是軟硬SDN組網,都能發(fā)揮價值。