SREがより発展していくために

今回は「SREがより発展していくために」についてご紹介します。

関連ワード (ようこそSREの世界、特集・解説等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 前回の記事では、Site Reliability Engineering(SRE)におけるデータを測定する重要さ、データの種類と収集方法、システムの運用での活用についてお話しました。

 本連載最終の今回は、SREが抱える悩みである「割り込みタスク」の管理方法、そして、SREがスケールしていくための実装パターンとSRE人材の育成について紹介します。

継続的な運用負荷

 システムが稼働する状態を維持するための作業を、「SRE サイト リライアビリティ エンジニアリング」では、運用負荷と定義しています(※1)。運用負荷は、「ページ」「チケット」の2つがあり、ページはオンコールに当たります。チケットはシステムの利用者(顧客)の要求が関係するもので、即時対応が求められる場合もあります。

※1:「SRE サイトリライアビリティエンジニアリング」Chapter 29 – Dealing with Interrupts

 運用負荷の内訳はこの2点に加え、前回の記事で紹介したトイル(労苦)も含まれます。これらの運用負荷は予測しづらいものであり、チームの作業を妨げる可能性があります。Google SREチームは、目標として「運用作業(トイル)を各SREの時間の50%未満に保つ」を掲げています。これは残りの50%を、将来に向けた「トイルの改善(ソフトウェアによる自動化など)」「サービス機能追加」に充てるためです。

 運用負荷のような割り込みが、残りの50%に該当する生産的作業にどのような影響を与えるのか、どう向き合っていくべきかも同章にて言及されています。人間は、フロー状態(集中している)である時に創造的で積極的に仕事に向き合うことができますが、割り込みが発生するとフロー状態から脱してしまう可能性があります。そこで、目の前のタスクに長時間集中することができるよう、チームで割り込みを管理する方法について提案しています。

 それは、ワークスタイルを二極化することです。例えば、複数のタスクをアサインされている場合は、作業時間の割合を「午前と午後」「日にち単位」で区切るなどが挙げられます。切り替えを最小限に抑えることで、対応すべきタスクに長時間集中することが可能になります。

 また、割り込みのアサインについては、チーム全体に負荷を分散するのではなく、規則性を持った構成にすることが推奨されています。例えば、ローテーションで割り込みが可能なメンバーをアサインし、負荷を局所化します。割り込み対応メンバーの負荷軽減のためにも、ローテーションの間隔、引き継ぎの有無やそのルールの整備も必要です。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
三菱UFJニコス、債権回収の問い合わせにAIで自動応答
IT関連
2021-07-13 13:34
LINE起点CRMを構築するマーケティングSaaS「MicoCloud」のMicoworksが12億円調達、新規プロダクト開発注力
IT関連
2022-02-10 09:22
オンラインカジノのボーナスとは?ボーナスの種類・入金不要ボーナスについて徹底解説!
オンラインカジノ
2022-08-19 13:00
AIの普及はローコード/ノーコード開発にどのような影響を与えるのか
IT関連
2024-02-29 20:06
グーグル、「Gemini」の大規模言語モデル(LLM)をアップデート
IT関連
2024-07-27 14:54
Limeがニューヨーク市に電動モペッド100台導入、デブラシオ市長による7月1日の完全解禁宣言を受けて
モビリティ
2021-05-01 07:48
「Windows 11 2023 Update」(23H2)リリース–Teamsがタスクバーに固定
IT関連
2023-11-02 02:06
AlmaLinux、今後はRed Hat Enterprise LinuxのABI互換を目指すと発表。これまでの「バグまでRHEL互換」の路線を変更
Linux
2023-07-18 03:16
生成AIは「過度な期待」のピーク期–ガートナー「先進テクノロジのハイプサイクル」
IT関連
2023-08-18 04:55
日本生協連、全国の地域生協の共通データ基盤を構築–データ活用の促進でDX推進を加速
IT関連
2023-03-08 20:42
既存防犯カメラで来店客の店内行動を解析可能なエッジAI端末を提供する「AWL」が20億円調達
IoT
2021-06-03 12:19
香川県のゲーム規制条例、効果はあったのか? 施行から間もなく1年
IT関連
2021-03-26 05:18
グーグル、機械学習を利用してDDoS攻撃をブロックするCloud Armorの適応型保護機能をプレビュー
IT関連
2021-07-22 19:04
富士通Japan、金沢工業大学とウェブ3技術を活用したNFT発行の取り組みを実施
IT関連
2023-10-05 12:39