オブザーバビリティの活用と「SREの民主化」への挑戦–ワンキャリアに聞く

今回は「オブザーバビリティの活用と「SREの民主化」への挑戦–ワンキャリアに聞く」についてご紹介します。

関連ワード (クラウド等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 キャリア開発などの人材サービスを手掛けるワンキャリアは、サービス全体の品質を高めるべくオブザーバビリティ(可観測性)ソリューションの活用を進めている。同社のSRE(サイト信頼性エンジニアリング)チームとして活動する技術開発部 エンジニアの宮川倫瑠氏とSRE エンジニアの渡邉美希パウラ氏に取り組みを聞いた。

 同社は、「人の数だけ、キャリアを作る。」をミッションに掲げ、新卒学生向けの就職活動支援サービス「ONE CAREER」、ONE CAREER上で求人やスカウトなどを行う企業向けの「ONE CAREER CLOUD」、転職者向けの「ONE CAREER PLUS」、エンジニア職に特化した「ONE CAREER for Engineer」の4つのサービスを提供している。SREチームは、これらサービスを支えるITインフラ基盤をプロダクト横断の形で担当している。

 オブザーバビリティの導入は2022年になる。宮川氏によると、SREチームを組成したのは2021年。当時は複数の新サービス(ONE CAREER CLOUDやONE CAREER PLUS)を立ち上げたタイミングで、複数サービスをまたいで利用するユーザーも急増したことから、ITインフラを統合的にモニタリングすることでサービスの稼働やパフォーマンスを可視化する必要性が生じた。

 また当時は、アプリケーションのパフォーマンスを適切にモニタリングできていないという課題も抱えていたという。「2021年3月に大きな障害が発生しました。新卒向けサービスのONE CAREERは、季節によってトラフィックが変動し、一般的に就職活動が解禁される3月はトラフィックが急増するタイミングでした。アプリケーションに負荷がかかったんですが、原因の特定に2~3時間を要してしまいした。このためアプリケーションパフォーマンスモニタリング(APM)を導入して障害の検知や原因の特定を迅速にしなければ、障害復旧に長い時間がかかってしまうと考えました」(宮川氏)

 同社では、サービス横断型でインフラの状態を監視・可視化するオブザーバビリティの複数のソリューションを検討し、使い勝手の良さや分かりやすさ、要件に合致するライセンス体系などからDatadogを選定した。「障害復旧の観点では、メトリクスやアプリケーションのパフォーマンスなどを複合的に見た場合に、どこに問題があるのか、異常の検知でもDatadogではシームレスにあらゆるところを横断的に把握でき、体感としても瞬時で分かりやすいものでした」(宮川氏)

 また、Datadogのライセンス体系は、ユーザーが利用する機能を基本としている。「ユーザー単位のライセンス体系を持つ他のソリューションでは、どうしてもユーザー当たりの監視対象を狭めなくてなりませんでした。現在SREチームは3人体制ですが、将来に人数や業務が変動しても複数のメンバーできちんとモニタリング体制を維持できる点も決め手になりました」(宮川氏)

 Datadogの導入は2022年6~7月の約1カ月間で、ほとんどの実装をSREチームで行ったという。Datadogが用意するスプレッドシートを使って簡単な疑問や相談事を記入すれば、Datadogの担当者が回答して導入作業をサポートした。また、ドキュメンテーションも充実していたため、「カスタマイズ方法なども分かりやすく、基本的に私たちだけで実装することができました」(渡邉氏)

COMMENTS


Recommended

TITLE
CATEGORY
DATE
杉並区、被虐待児の出欠確認アプリをノーコード開発 早期発見に活用
企業・業界動向
2021-06-16 08:13
デジタル化などを背景にしたコア業務への集中とBPOの動向
IT関連
2024-03-20 03:39
第3回:企業は持続的な健康経営の取り組みとして何をすればいいのか
IT関連
2024-04-18 05:15
熊谷組、クラウド型ネットワーク対策を導入–通信品質の改善も
IT関連
2024-02-29 04:57
BLEスキャンでバスの混雑度を計測 専用サイトにリアルタイム表示 ナビタイムが実験
企業・業界動向
2021-01-13 15:58
日本IBM、全社的なDXを推進する「次世代型BPOサービス」を発表
IT関連
2022-11-11 18:04
AWSの主要サービスをローカルでエミュレート、「LocalStack」が1.0に到達
AWS
2022-07-25 13:27
「+メッセージ」に首相官邸の公式アカウント 内閣の政策など発信
社会とIT
2021-05-11 14:44
eBPFプログラムを手軽にコーディング、ビルドし、コンテナ形式にパッケージングしてシェアできる「Bumblebee」オープンソースで登場
eBPF
2022-01-17 01:16
マネックス証券でシステム不具合 「口座残高0円」など表示に異常
企業・業界動向
2021-04-17 13:16
マイクロソフト、「Exchange Server」狙う攻撃の影響を緩和するワンクリックのツール公開
IT関連
2021-03-17 07:54
インドのアマゾンではショッピングページで新聞や雑誌記事を読める
ネットサービス
2021-05-30 18:58
AIモデルの「ロングコンテキストウィンドウ」とは?
IT関連
2024-05-17 20:23
稼げるセキュリティ資格–資格試験勉強の注意点と複数資格を取得する際の考え方
IT関連
2023-11-21 18:17