創科瞭望/「藍屏事件」凸顯網絡安全重要性\香港創科發展協會主席 陳迪源

  圖:軟件服務商CrowdStrike出錯導致「藍屏事件」,造成眾多採用Microsoft Windows系統的企業受到衝擊,包括航空公司航班取消和延誤。
  圖:軟件服務商CrowdStrike出錯導致「藍屏事件」,造成眾多採用Microsoft Windows系統的企業受到衝擊,包括航空公司航班取消和延誤。

  上周五(7月19日),微軟旗下部分應用與服務出現「藍屏」問題,造成全球多項公共服務系統陷入癱瘓,被認為是有史以來最大的IT故障事件。起初外界誤以為是微軟的問題,後來證實故障源於軟件服務商CrowdStrike的一次更新出錯。

  信息研究公司Gartner的數據顯示,2023年CrowdStrike在安全軟件市場的份額接近15%,全球排名第二。CrowdStrike自己宣稱客戶包括298家「財富500強企業」、前十大金融服務公司中的八家、前十大製造公司中的七家,以及美國43個州政府等。

  「藍屏事件」造成眾多依賴Microsoft Windows系統營運的企業受到衝擊。譬如,航空公司航班取消和延誤,旅客無法入住酒店;醫療機構的運作中斷,電子醫療紀錄和在線診療服務中斷直接威脅患者健康;金融行業的銀行和金融服務公司業務中斷,金融交易延誤和數據丟失威脅全球市場穩定性。保險公司或需要為此支付高額賠償金,而CrowdStrike也可能要面對一系列訴訟。

  上述問題還只是冰山一角。受此次故障的影響,不少企業迅速啟動災難恢復計劃,將數據從備份中恢復,同時確保業務的最基本運作可以持續。例如,一些企業啟用手工記錄,以確保交易和客戶服務能夠繼續進行。這種回歸到紙筆的操作方式,不僅降低了效率,還增加了出錯的風險。

  這次事件也讓我們意識到依賴電腦系統的脆弱性,社會需要更加透明和有效的安全措施,以確保類似事件不會再次發生。筆者列出以下措施以供參考:

  (1)系統更新需要慎重。這樣可以避免因匆忙部署而導致的潛在問題,並給IT團隊更多時間進行測試和評估。

  (2)加強與網絡安全公司的溝通。定期與合作的網絡安全公司保持聯繫,了解最新的威脅信息和安全建議,從而及時採取相應措施。

  (3)制定和測試災難恢復計劃。定期模擬可能的災難情境,確保所有相關人員了解並能夠迅速啟動應急方案,以最大限度減少損失和恢復時間。

  (4)培訓員工,增強其應對意識和技能。提供定期的安全培訓,讓員工了解最新的網絡威脅和防護措施,提高他們的應對能力。

  (5)考慮採用更高效的系統架構,使用更精簡的系統,或者物聯網(IoT)設備等。

  (6)考慮採用更多元化和去中心化的安全措施,以降低單點故障的風險。例如,分散數據存儲和處理,可以減少因單一故障點導致的全面崩潰。

  (7)提高系統冗餘性,並加強內部流程的監控和審計。確保有足夠的備援系統和監控機制,以便在出現問題時能夠迅速切換和修復,減少對業務運營的影響。

  港宜推進相關立法

  「藍屏事件」凸顯了網絡安全立法的必要性。香港特區政府已建議制定《保障關鍵基礎設施(電腦系統)條例草案》,旨在提升關鍵基礎設施營運者的網絡安全水平。但僅僅依賴營運者在預防和報告方面的措施並不足夠,我們還需要制定指引讓營運者如何處理事故和進行恢復。藉此確保在類似網絡安全事件發生時,營運者能夠快速有效地應對,減少損失和影響。

  香港作為國際創科中心及全球金融中心,擁有海量高價值數據,推進關鍵基礎設施保護法案是刻不容緩的。相關法案可以確保企業和公共機構採取必要的安全措施,減少網絡的安全風險,從而保障社會的穩定和發展。

  「藍屏事件」事件主要是由CrowdStrike的一次軟件更新引發,但對全球各行各業的廣泛影響令人深思。

  首先,即使是全球領先的安全公司也可能犯錯,任何網絡系統都不是百分之百安全的。也因此,企業與政府需要採取更加嚴格的預防措施,制定詳細的應急計劃,以應對潛在的災難性故障。

  其次,全球化與數字化互聯衍生出的風險不可不察。全球企業之間的高度互聯意味着一個區域的問題很可能會迅速蔓延並產生廣泛影響。這種互聯性雖然帶來了效率和協作的好處,但也意味着風險的蔓延速度和影響範圍比以往任何時候都更大。因此,企業應該考慮採取更加分散的安全措施,以減少單點故障的風險。

  再次,該事件還揭示出現代社會對科技依賴的程度之深。幾乎每個行業都依賴於電腦系統的運行,一旦系統出現故障,整個社會的正常運作都會受到嚴重影響。我們需要更加全面和靈活的應對措施,以確保在面臨類似挑戰時能夠迅速恢復和持續運營。