科 技 人 文


台北熊好券上線日效能異常檢討報告
【記者魏雲日/台北報導】2021-10-21
       台北熊好券活動於9月22日開放民眾在台北通APP意願登記,從中午12時至18時因大量人潮湧入,導致台北通系統出現異常,北市府資訊局於當日中午立即成立緊急應變小組處理系統異常一事,後續亦針對本事件啟動根本原因(RCA)分析,提出有效之改善方案。
 
  資訊局局長呂新科說明,在系統發現異常後資訊局立即召開應變小組,啟動資料分級分流規劃,提昇負載能量;在解決問題後,秉持北市府一貫「遇到問題、面對問題、解決問題」的態度,進行根本原因(RCA)分析,召開專家學者檢討會議,最終找出本次熊好券登記導致系統異常原因如下:
  1. 集中式系統資料庫架構耗盡資源:台北通沿用台北卡3.0的集中式資料庫架構,對於短時間內大量資料交換與熊好券系統交互作用,耗盡CPU運算資源。加上單一服務驗證,系統交互繁複造成高負載。
  2. 新應用模式及壓力測試不充分:熊好券系統結合台北通單一服務驗證,係整合高流量的新應用模式,參考數值不足,雖個別系統皆有壓力測試,但未實施整合壓力測試。
  3. 硬體資源擴充不及:原規劃之硬體擴充計畫雖然已於今年9月1日完成採購決標作業,但因全球晶片缺貨,國內並無現貨,國外設備需於年底到貨。
 
  呂新科表示,9月22日當天成立緊急應變小組,依現有架構及系統資源挪撥,進行第一階段擴容,待採購設備到貨,將進行第二階段擴增作業。後續團隊進行系統異常的根因分析及檢討,並召開外部專家學者會議,共同檢視問題,並提出後續解決方案,歸納如下:
  1. 認證分級與服務分流:釐清台北通的服務項目所需個資與個資使用的高低度建立等級,降低資料的交換必要性與次數。另外,以不同認證等級區別台北通服務項目所需資料交換次數,藉此降低資料庫的效能使用。
  2. 資料庫架構重整:透過後端資料庫調整,將資料庫的讀寫功能分離,提升資料庫效能,增加台北通的反應速度。
  3. 系統硬體擴容:調用市府現有資料庫資源,擴增資料庫的可用量,確保熊好券使用穩定,後續設備預計於年底到貨,將進行第二波資料庫擴充作業。
  4. 落實開發及測試SOP:納入本次經驗,整合壓力測試為系統上線前必要項目。
 
  本次熊好券意願登記於當天修復後,正常支援登記作業,截至10月14日總登記份數約466萬份,目前台北通APP會員人數已成長至166萬人,感謝民眾的參與。此外,9月22日熊好券效能異常造成民眾困擾一事,資訊局將會引以為鑑,後續各項服務上線前,將會完成相關必要之檢核作業,確保民眾順利使用,並提升民眾對於本府市政服務的參與度。