本杰明·富蘭克林曾經說過,這個世界上有兩件事情不可避免,死亡和納稅。但如果這位偉大的政治家和發(fā)明家活在我們的現代世界,也許服務器停機也會進入這個名單。
不管底層技術再怎么好,也不管托管提供商再多么能干,云總是會發(fā)生故障。
以下這個名單恐怕是這些公司不想看到的:CRN的2014年前10大云故障。
Dropbox,2014年1月10日
這家云存儲公司在在1月10日美國東部時間晚上8:30開始出現全球宕機。
事后Dropbox表示,當時他們在對某些設備進行操作系統更新操作,這個系統中保存了圖片集共享和相機上傳功能所使用的數據庫,但并非文件存儲的核心業(yè)務。升級腳本中的一個小錯誤導致操作系統在一臺動態(tài)設備上重新安裝,導致系統失控。
Dropbox的網站返回服務器錯誤信息,臺式機和移動設備無法進行文件同步。
大多數服務器通過備份在3個小時內恢復,但是完整的核心服務用了兩天時間才完全恢復。
三星,4月21日
當天,韓國南部Gwacheo的一座數據中心起火,在接下來的幾個小時內,全球范圍的三星智能手機和平板電腦都無法獲取他們的數據。
第四層的起火還導致了信用卡服務、三星Smart TV和其他采用三星服務器的設備出現故障。
專家提出質疑,為什么這么多的服務器被放置在了同一個地方,而沒有在其他地點提供系統冗余。
Internap,5月16日
在紐約地區(qū)的一次公共電力故障后,Internap位于紐約的一個不間斷供電系統停機了。停機發(fā)生在凌晨三點,對使用托管和IP連接服務的客戶造成了影響。
在接下來的7個小時內,Internap一直處于停機狀態(tài)。
這次停機影響到流視頻平臺Livestream和StackExchange網絡站點。
微軟Lync,6月23日;微軟Exchange,6月24日
Lync是微軟的即時消息和VoIP服務,也是微軟云業(yè)務產品Office 365套件的一部分,該服務于美國東部時間6月23日在北美洲大部分地區(qū)發(fā)生中斷。
微軟稱這次中斷是由“外部網絡故障”所導致,部分用戶受影響長達8個小時。
第二天,Lync繼續(xù)影響Office 365用戶,微軟的托管電子郵件服務Exchange Online也遭遇相同的命運,部分客戶電子郵件服務中斷長達9個小時。
微軟表示這次中斷與Office 365故障無關。
Verizon Wireless,6月27日
Verizon Wireles遭遇了一次廣泛的故障,導致其部分計費系統停機,使客戶無法訪問他們的在線帳戶、支付賬單,在某些情況下無法升級手機。
系統范圍的停機從周五就開始了,持續(xù)了大約一天時間,不僅對使用My Verizon 在線賬戶的客戶造成了影響,還影響到Verizon自己的零售商店客戶。
No-IP.com惡意中斷,6月30日
如果按規(guī)模經濟生產力衡量的話,這并不是一次嚴重的停機時間,但該事件比其他更令人氣憤,因為這是人為造成的停機。
No-IP.com是一家總部在美國內華達州里諾的免費動態(tài)DNS服務提供商。微軟以打擊網絡犯罪為由接管了No-IP.com的23個網域,在此過程中,微軟還造成180萬No-IP.com的合法客戶服務中斷超過2天。
這些客戶中包括SonicWall,一家被戴爾2012年收購的網絡安全廠商,該公司表示其數百家客戶掉線,包括那些安裝了使用No-IP.com動態(tài)DNS服務以中繼視頻輸入的安全監(jiān)控攝像頭的建筑物。
聯邦法院將對于這些網域的DNS權交于微軟,后者稱他們遭受了惡意軟件的攻擊。
微軟Azure,8月18日
Azure云在一次作為每月補丁日發(fā)布的Windows 8.01安全補丁之后導致部分用戶中斷服務長達5個小時,引發(fā)技術問題。
微軟報告稱,Azure服務例如虛擬機網站、自動化、備份和站點恢復都在多個地區(qū)出現中斷。
一些分析師抱怨軟件巨頭微軟事后并未對該事件進行完整檢查。
微軟Azure,11月18日
正如Gartner知名分析師Lydia Leong在11月這次停機時間之后的抱怨稱,“微軟無法讓Azure服務中斷只局限于一個地區(qū),這為很多考慮Azure的企業(yè)亮起了紅燈。”
11月18日的中斷事件影響到全球范圍內使用各種Azure服務的客戶,而這主要是由云存儲服務一次性能升級中出現的小故障所導致。
微軟最終確定人為錯誤是罪魁禍首。
Amazon Web Services CloudFront DNS,11月26日
Amazon Web Services的CloudFront DNS服務器從美國東部時間下午7:15開始持續(xù)了近2個小時。在下午9點之后DNS服務器開始恢復備份。
部分網站和云服務發(fā)生掉線,在這期間內容交付網絡無法完成DNS請求。沒有發(fā)生什么大事,但是值得列入該榜單,因為它涉及到全球最大的也是運行時間最長的云。
Xen漏洞重啟:AWS、Rackspace、IBM SoftLayer,11月下旬
這不是某一次云故障,而是多個公有云[注]被迫進行緊急重啟,這次發(fā)生在11月下旬的故障中斷了很多客戶的運營。
Xen開源管理程序中的一個安全漏洞導致了這次重啟。
AWS、Rackspace和SoftLayer都向客戶發(fā)出了警告——有些情況下僅數個小時——稱將會出現暫時脫機的情況,然后他們需要重新啟動他們的云服務。
所有云提供商完成補丁安裝之后向公眾發(fā)了一則咨詢建議。