科技雲報道丨故障頻發的公有云,還能不能用?

雲計算 微軟 Azure 軟件 科技雲報道 2017-03-26

本月亞馬遜AWS、阿里雲、微軟Azure接連出現大面積故障,造成用戶無法訪問在線服務、不能正常使用數據等問題,嚴重影響了用戶的業務,讓不少正在使用或準備嘗試公有云的企業,信心再次發生動搖。

公有云的故障,能避免嗎?

2月28日,亞馬遜公有云服務AWS出現了較高的錯誤率,影響了數千個在線服務,包括項目管理工具和費用報告工具等。

3月14日,阿里雲華東1地域可用區E部分負載均衡出現訪問失敗。

3月16日,微軟雲服務Azure出現全球性故障,在全部的28個數據中心中,有26個受到影響,導致用戶無法創建、更新和刪除數據資源。

大型廠商公有云在一個月內集中爆發故障,讓大家再次把目光集中在公有云的安全性和可用性上。

其實,類似這種大型的公有云宕機事件,每一年都在發生。早在2013年8月,AWS先後發生兩次宕機;2016年6月,AWS停機長達36個小時。2015年6月,阿里雲香港的機房服務暫停了12個小時。2016年4月,微軟Azure在中國北部的機房出現了故障,停機近4個小時。

科技雲報道丨故障頻發的公有云,還能不能用?

從上述問題可以發現,雖然雲服務商都強調自家雲服務的高可用性和穩定性,但實際上雲服務並不能給予用戶100%有效的保障。

這其中既有電力、網絡、設備、數據中心、軟件、雲計算架構故障等客觀因素,也有運維人員誤操作的原因。同時,還有不確定的外部因素會導致數據中心發生故障,從而致使雲計算服務不可用。

那麼,公有云出現大規模宕機事件,是否就說明公有云並不值得信賴呢?

有資深專業人士在接受採訪時表示,出故障屬於正常的現象,“首先,沒有一個系統是100%可靠的,故障是不可避免的;其次,雲計算其實不會承諾是100%能用的,但基本上會比自己建要會更穩定;再次,即使是使用雲計算也要注意做好‘萬一他出故障了,或者說他一定會出故障’的心態去看待。舉個例子,比如說,我們平時照片都在手機上,就要做好手機會丟的準備,因此照片也要存放在家裡的硬盤裡。”

因此,不能夠簡單“一刀切”來判斷公有云的可用性。企業必須根據自身的情況,以及信息的機密性、所使用的服務商情況,來做具體的考量。

面對不完美的公有云,企業該怎麼用?

對於一個系統來說,漏洞永遠存在。對於公有云的優劣勢,企業需要更加理性地去看待。

作為革命性的IT 技術,雲計算服務具有彈性可擴展、資源利用率高、利於數據分析、成本降低等優點。但公有云服務一旦出現故障,對於沒有任何備份或者做預案的用戶來說,可能就會造成慘痛的損失。

因此,企業需要根據自身的情況來評估如何使用公有云。

首先,企業要區分公有云的使用場景。如果僅僅是對企業內部使用,不存在移動辦公等網絡使用場景,企業和公有云的供應商之間建立起一條VPN或其他專有的數據連接,保證整個數據鏈路的保密性。

其次,評估不同的災備方案,所有的災備方案每年至少一次進行演練,保證整個災備方案是可行的。

在考慮災備方案時,既可以在同一個公有云平臺的不同區裡面互為備份,也可以使用不同的公有云平臺的不同區互為備份,當然也可以考慮混合雲,將某個公有云平臺和自身企業內部的數據中心互為備份。

最後,需要對整個公有云平臺上的數據都進行加密,至少對關鍵的、涉及到隱私的數據來進行加密,對重要的數據進行匿名化管理。

研究機構Gartner表示,中國公共雲市場整體規模將從2016年的112億美元增長至今年的142億美元。

在中國市場,公共雲的整體市場規模正在迅速增。我們相信宕機事件並不會大幅影響市場信心,反而是一次次絕佳的市場教育機會,催化公有云市場走向成熟。

一方面,雲服務商在對事故的處理過程中,將不斷提升系統性能和自身運維管理能力,倒逼整個雲計算產業提升性能;另一方面,隨著企業對雲服務的理解越來越深,必將尋求最優的雲服務解決方案,將風險壓到可控範圍內,而不是單純的依賴某家公有云廠商。

可能再過幾年,這種一邊是受損用戶罵聲不斷,一邊是吃瓜群眾圍觀看熱鬧的情形,都將會趨於平淡。到那時,公有云才真正潤物細無聲地成為了“水電煤”一樣的存在。

The End

【科技雲報道原創】

轉載請註明“科技雲報道”並附本文鏈接

相關推薦

推薦中...