Top
首頁 > 正文

數據中心危城抗“疫”——中金武漢超算中心紀實

武漢微鄰里、長江網武漢城市留言板-在線問診平臺、武漢紅十字會網站、武漢市新冠肺炎疫情防控指揮平臺、市公安局視頻統一應用云平臺、市智慧城管的智慧橋梁和智慧燃氣等系統和應用連接成武漢抗擊疫情的大動脈。
發布時間:2020-02-20 08:54        來源:網絡安全和信息化        作者:

武漢,一座正在與新型冠狀病毒肺炎做殊死搏斗的“危城”。

中金武漢超算中心身處“危城”之中,其建設并運營的武漢市電子政務云為武漢市40多個委辦局的140多個業務系統提供了云計算服務,其中,武漢微鄰里、長江網武漢城市留言板-在線問診平臺、武漢紅十字會網站、武漢市新冠肺炎疫情防控指揮平臺、市公安局視頻統一應用云平臺、市智慧城管的智慧橋梁和智慧燃氣等系統和應用連接成武漢抗擊疫情的大動脈。

“危城”中的數據中心,它如何堅強挺立,它又如何為抗擊疫情提供持續、穩定、可靠、安全的后臺支撐?

數據中心的真正考驗來了

科技戰“疫”,即利用云計算、大數據、人工智能、5G等技術抗“疫”,取得了非常積極的效果,從相關疫情信息的統計、分析和披露,到醫院的建設和對病人病情的發現與治療,再到疫苗和藥物的研發等,無不滲透著科技的智慧和力量。而作為這些技術應用的底層基礎支撐,數據中心發揮著中流砥柱的作用,為科技戰“疫”保駕護航。

高力國際近日對105位數據中心資深專業人士進行了一項調研,受訪者的普遍共識是,此次疫情對數據中心的長遠發展來說是利好的。在抗擊疫情的過程中,大數據的助力使得防控措施的實施更精準、更有效,比如數據支撐和輔助決策為國家切實有效地控制疫情蔓延發揮了積極作用;再比如,專業病理大數據分析、促進新冠疫苗研發的大數據云平臺等需求激增,這些都對數據中心的平穩安全運行提出了更高的要求。

但同時,高力國際通過調研也發現了一些數據中心不得不面對的新挑戰,比如疫情可能會導致供應鏈短缺,一線人員勞動力不足,這意味著數據中心建設周期會更長,總體投資以及運營成本會變高等;另外,復工慢將增加數據中心運維難度,加之需要更加嚴格的消毒措施,設備的調試與更換也會面臨挑戰等。

除了高力國際的調研所述,筆者認為,此次疫情的發生對數據中心的重大考驗還有一項應該引起特別重視,那就是應急響應,以及BCM(業務連續性管理)、BCP(業務連續性計劃)的制定與落地執行。以前,我們談到數據中心業務連續性面臨的主要挑戰,更多是講地震、水災、火災等自然災害。但是,從十幾年前的SARS到今天的新型冠狀病毒肺炎,面對突出其來的疫情,數據中心要如何快速、有效地應對是一個值得深入探討的新課題。疫情有其特殊性,特別是一些特殊政策和手段的使用可能給數據中心的運維帶來很大困難。舉例來說,在武漢封城后,公共交通中斷,數據中心運維人員如何及時到位并保證7×24小時在線和響應就是一個現實問題。中金武漢超算中心從上到下的快速響應,以及應對之策經受住了考驗,值得分享與借鑒。

打好防疫第一仗,確保人員安全

此次疫情襲來,首要的工作就是確保人員的健康和生命安全。中金數谷公司和武漢超算公司在第一時間分別成立了疫情防控領導小組,統一建立了疫情防控應急領導工作微信群,加強溝通協調,統籌部署公司疫情防控工作,做到了“準確預判,提前防控”。舉例來說,在武漢地區口罩和消殺物品開始稀缺的情況下,公司緊急購置口罩、消毒液,并安排對位于武漢的數谷、超算、臺商、工地等四個辦公地點進行消毒。從1月20日開始,執行全員每日安全健康狀況跟蹤統計和統一報備制度。公司領導直接指揮,針對疫情期間出現的問題,組織相關負責人每日會商研究,高效決策,及時處置,堅決不留隱患。

疫情就是命令。1月21日,中金武漢超算中心成立了應急組,包括保障、支援、技術支持等多個小組,許多員工主動報名加入,中金武漢超算基礎設施運維弱電工程師夏昕就是其中之一,他主要負責數據中心內設備的監控和運維,以保證數據中心的穩定運行。

從1月23日開始,中金武漢超算中心的9名人員三班倒,負責數據中心的整體運維。從1月25日開始,由于武漢封城,很多小區封閉,人員不能隨意進出,且公共交通中斷,導致原有的9名運維人員減至6人,但大強度的三班倒一直在堅持。聽了夏昕的講述,那種緊迫感,以及在疫情面前的眾志成城,讓人猶如身臨其境,備受感動和鼓舞。

零疑似,零確診,近一個月過去了,中金武漢超算中心仍在延續這一紀錄。在保證健康和安全的前提下,執行更嚴格、更高頻次的巡檢,保證數據中心的穩定安全運行,這就是一直堅守在崗位上的夏昕和他的同事們做的最有意義的工作。

“面對新型冠狀病毒肺炎這樣低頻、高危的‘災難’,從數據中心運營的角度看,首先要保障人員安全和有效的防護,測量體溫、場所消毒等這些基本措施是應急處置預案中的常規內容。我們平時有預案、日常有演練,所以在疫情發生時可以迅速啟動預案,并根據疫情變化隨時調整,從容應對。”中金數谷投資合作部總監徐飛表示,“另外,應急響應還包括管理流程、應用保障等多個環節的內容,核心是保證人員到位、各司其職、統一協調,現場指揮得當,快速響應,以及適時的人員心理干預和疏導。”

簡言之,面對突發的疫情,數據中心首先要做好人員自身的防護;其次要想方設法減輕對業務的沖擊,保證數據中心穩定持續運行。

招之能來,來之能戰,戰之能勝

武漢超算中心是武漢國家網安基地的先導項目和首個建成項目,項目一期數據中心占地4000平方米,采用集裝箱數據中心技術建設,是國內已建成的最大集裝箱數據中心項目。

武漢超算中心承載的最重頭的應用就是武漢市電子政務云,目前為武漢市40多個委辦局的140多個業務系統提供了云計算服務,包括市長熱線、市線上人大、市公安局視頻統一云平臺、市公安治安局危險品管控平臺和積分入戶云平臺、武漢城市景觀智能照明管控平臺、市農委肉類蔬菜質量安全追溯體系政務云平臺、市法制辦執法平臺、市質監局智慧電梯、市智慧城管的智慧橋梁和智慧燃氣等,涵蓋武漢全市委辦局和區新增系統的70%,數據量高達60PB。據悉,武漢超算中心目前已處于滿負荷運行狀態。

武漢超算中心不僅要全力保障政務云的高效暢通與7×24小時運維響應,更要隨時隨地響應武漢市政府有關部門對云、網絡帶寬、網絡安全的開通、擴容、調優、網絡安全防護、配合新應用部署和故障處置等方面的需求。在這次抗擊疫情的過程中,武漢超算中心的快速響應能力、靈活擴容能力、安全保障能力等經受了一次大考。

“武漢微鄰里”公眾號可自動定位到所屬的社區,并可以取得對應社區的聯系方式,市民還可以通過公眾號進行肺炎自查上報、在線問診等事項。1月25日晚,因疫情防控措施的加強,“武漢微鄰里”系統的訪問并發量由平日的幾千突增至十幾萬,云服務器和網絡帶寬負載巨大,需要緊急擴容服務器及網絡帶寬資源。

中金武漢超算中心的技術工程師按要求對應用服務器配置,包括CPU、內存、磁盤、網絡帶寬等進行擴容和調優,同時又連夜與各方溝通并制定應用集群負載解決方案,協助應用開發商完成負載均衡部署、應用集群改造和系統測試工作等,確保改造后的應用系統在1月27日正式上線對外提供服務。中金武漢超算中心將帶寬從平時的200M擴容到400M,武漢微鄰里的最高峰值帶寬達到300M,帶寬資源游刃有余。

市民通過武漢紅十字會網站可查看武漢紅十字會的捐贈情況和使用情況。疫情期間,武漢紅十字會受到了極大關注,從1月31日開始,其業務流量暴增。通過實時監控,中金武漢超算中心的工程師發現,武漢紅十字會網站帶寬不足,網頁無法打開,且在一定程度上面臨安全攻擊的威脅。中金武漢超算中心為此挑燈夜戰,一方面快速新增所需云主機,擴容的同時增加帶寬;另一方面,重新設置網絡安全策略,對流量進行監控,封堵攻擊,確保武漢紅十字官網的正常運行。

新增云主機、增加帶寬資源,這些在平時做來得心應手的工作在疫情中卻難度陡增。一個最簡單的例子,擴容需要電信運營商的支持,但在封城的情況下,需要用到的材料、工人此時都成了“稀缺”,無法及時到位。就是在這種情況下,中金武漢超算中心在大年初二的晚上,通過種種努力,從武昌調來了材料,只用一晚便完成了擴容。

另一個爭分奪秒的事件發生在2月10日。這一天,中金武漢超算中心接到武漢市政務服務與大數據管理局的指示,“武漢市社區疫情排查指揮平臺”要部署有關疫情數據系統和數據可視化平臺,以便協同武漢微鄰里平臺展開社區數據收集采集工作。中金武漢超算中心立即協調安排系統、網絡和安全方面的工程師加班加點,又是一夜未眠,于00:30交付一批云主機及相關安全服務部署需求,確保武漢市社區疫情排查指揮平臺早日投產。

從1月底開始至今,中金武漢超算中心處置了大大小小多次“戰疫”的緊急情況,除了上文介紹的那些案例以外,還有長江網武漢城市留言板上推出的“戰疫·在線問診平臺”與微鄰里平臺對接,部署并上線武漢肺炎疫情實時動態追蹤服務,武漢客廳(方艙醫院)視頻對接東西湖區公安局視頻網,武漢橋梁在疫情期間24小時不間斷專業“看護”,武漢市新冠肺炎疫情防控指揮平臺開通云主機和政務外網,部署疫情防控大數據指揮平臺等。這些應用的統一特點是,在最短的時間內上線,同時要保證安全穩定運行。

面對這些挑戰,中金武漢超算中心做到了及時擴容、快速安全開通云主機,提供切實有效的安全保護策略和措施。徐飛介紹說:“我們成立了應急小組,通過各種平臺和渠道與當地政府保持密切溝通,根據相關指示和要求,隨時調整部署,溝通效率非常高。接到任務后,通過電話、微信、郵件等方式快速下發,技術人員加班加點,保障所有需求可以在最快的時間得到響應和解決。”

功夫在平時 防疫、生產兩不誤

在疫情面前,中金武漢超算中心可以做到協調統一、果斷處置,確保員工的人身安全;在接到客戶的各種應用需求后,能夠及時、高效、安全地響應,并保障數據中心基礎設施安全穩定運行。“我們之所以能夠從容應對,關鍵是功夫在平時。”徐飛一語中的。

中金數據是一家經驗豐富的專業數據中心服務提供商,十余年來服務了政府、金融、央企、互聯網等眾多各行業客戶。數據中心服務的一項核心內容就是為客戶提供7×24×365的全天候快速響應及穩定的運行支持。在一切影響業務連續性的情況發生時,比如各類自然災害、疫情乃至人為誤操作,一家專業的數據中心服務商都應該有能力通過各種預案的及時啟動,借助專業的技術、人力以及流程和制度,盡量避免給客戶的業務和應用帶來中斷和損失。

只有日常的保護工作到位,在面對突發事件時才能泰然處之,應對得當。中金數據就是從日常工作的一點一滴做起,從工作機制、業務流程到數據中心基礎,都有全面的安全保護措施,能夠保證數據中心的全天候不中斷運行。中金數據位于北京、昆山、煙臺和武漢四地的數據中心,資源互通、技術與經驗共享、人員協同,并且擁有大量處置突發事情的成功經驗,所以在此次戰“疫”中做到了有備而來,應需而動。

通過這幾十天的戰“疫”,徐飛歸納說,作為專業的數據中心服務商,首先要建立良好的應急機制和儲備,應急演練要常態化,制度、流程、人員要規范化。說到底,這需要依靠多年的積累和時刻準備著的態度。其次,平時要不斷強化人員及企業的危機意識,訓練有素,這樣在災難來臨時才能不手忙腳亂。最后考驗的是企業的應急響應能力,針對不同問題,靈活應變,同時積極配合政府、客戶,進行高效地溝通與協作,才能事半功倍。

從目前情況看,這次的抗疫阻擊戰還要再持續一段時間。當前,中金武漢超算中心6人三班倒的情況要調整和改善,以保證人員身體和心理的健康。徐飛表示:“接下來,我們會對員工進行心理疏導,保證他們以一個健康的心態更好地在高壓狀態下完成工作。另外,我們還要籌措更多應急物資,并根據上級領導的要求,調整現有的防疫部署,做到防疫、生產兩不誤。”

640.webp (1)

專題訪談

合作站點
stat
河南泳坛夺金奖金 秒速快3下注平台 辽宁福彩35选7暂停 百盛期货配资 体彩上海11选5手机版 广西快乐十分最新开奖结果 今日甘肃快三开奖结果 股票开户流程当选金多多策略 黑龙江快乐十分怎么玩 广东11选5开奖历史结果 浙江11选五走势图开奖号码 炒股票怎么玩可以赚钱 今日股市实时点评 秒速快三规律 大乐透杀号专家最准确 浙江11选5预测下载 黑龙江体彩11选五5遗漏