GitHub、全サービスがデータベースの設定変更ミスでアクセス不能に。設定を元に戻して30分後に復旧

今回は「GitHub、全サービスがデータベースの設定変更ミスでアクセス不能に。設定を元に戻して30分後に復旧」についてご紹介します。

関連ワード (体制強化、調査中、障害発生等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


GitHubは日本時間8月15日午前8時2分(世界協定時8月14日23時2分)から8時38分までの約30分のあいだ、全てのサービスがアクセス不能となる障害が発生していたことを報告しました。

障害の原因はデータベースの設定変更ミスでした。設定変更に間違いがありGitHub内の重要なサービスがデータベースに接続できなくなったことで障害が発生。設定を元に戻すことで復旧されました。

データベースの設定変更ミスでGitHubサービスに障害

GitHub.comの全データベースに誤った設定変更

報告の内容を時系列で見ていきましょう。

障害発生の3分前。日本時間8月15日午7時59分に、GitHub.comの全データベースに対して誤った設定変更が行われ、ルーティングサービスから送出されるヘルスチェック用のPingに応答する機能に影響がでました。

その結果、ルーティングサービスはアプリケーショントラフィックのルーティング先とすべき稼働中のデータベースが検出できなくなります。

これにより8時2分からGitHub.comの広範なサービスが影響を受け、利用できなくなりました。

設定をロールバックして復旧へ

サービス停止から14分後の8時16分に、障害を受けて調査中との報告を「https://www.githubstatus.com/」にて公開。

続いて8時29分には、データベースに問題があるとして設定をロールバックしているところだと報告。

データベースの設定を元に戻すことで原因を解決。8時38分にトラフィックが再開し、サービスが復旧されます。

8時45分には完全に復旧したことと継続してモニタリング中であることを報告しています。

データベースの変更管理に安全措置を追加

GitHubは今回の障害を受けて、データベースの変更管理プロセスに追加の安全措置(ガードレール)を導入するとし、またロールバックの高速化、依存関係による障害への体制強化などにも優先順位を付けて取り組むとしています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
NEC、サイバーセキュリティ事業を再編
IT関連
2024-04-03 12:45
「Windows 10 22H2」がリリースプレビューに移行、一般提供を前に
IT関連
2022-07-30 09:42
国際金融サービスのAirwallexがシリーズDで約110億円調達、評価額は約2800億円に
フィンテック
2021-03-25 18:49
無駄な会議を避けるには–5人のリーダーに聞く有益な会議参加のヒント
IT関連
2023-07-01 22:12
CISA、「Windows LSA」の脆弱性を「既知の悪用された脆弱性カタログ」から一時的に除外
IT関連
2022-05-19 22:36
GNOMEとMonoとXamarinの開発者Miguel de Icaza(ミゲル・デ・イカザ)氏がマイクロソフト退職を発表
Microsoft
2022-03-07 00:24
「Google Meet」、「挙手する」機能を改善–より目立ちやすく
IT関連
2021-06-21 15:54
Alphabet傘下の気球ネット企業Loon、解散
企業・業界動向
2021-01-23 03:01
世界最大規模の中国卸売市場にAI企業が殺到、その理由は
IT関連
2024-11-13 00:38
Apple、屋内マップに羽田空港を追加
IT関連
2021-07-08 14:43
熊本県山江村の小中学校、学習プラットフォーム「Monoxer」を活用–記憶定着をサポート
IT関連
2024-04-13 01:04
インテル、次世代の半導体製造機器を他社に先駆けて発注–ASMLのEUV露光装置
IT関連
2022-01-22 12:58
「Windows 11 24H2」、最新パッチで複数の問題を修正
IT関連
2024-11-15 04:26
「iOS 15」発表、FaceTimeの“共同視聴”や「集中モード」などを搭載–iPhone 6s以上
IT関連
2021-06-08 12:59