日本を代表する大手クラウド運用の裏側はどうなっている? 運用をクリエティブに改善する方法とは。Cloud Operator Days Tokyo 2022[PR]
今回は「日本を代表する大手クラウド運用の裏側はどうなっている? 運用をクリエティブに改善する方法とは。Cloud Operator Days Tokyo 2022[PR]」についてご紹介します。
関連ワード (時代、登場、課題等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
クラウドの運用者にフォーカスするというユニークなイベント「Cloud Operator Days Tokyo 2022」が開催中です。
クラウドの時代が到来し、ソフトウェアプロダクトの形態がパッケージからサービスへと大きく変わろうとしているなかで、ソフトウェアをクラウドで確実かつ効率的に運用し、改善していくことの重要性は飛躍的に高まっています。
「Cloud Operator Days Tokyo 2022」は、そのサービスを支えるクラウドのインフラからアプリケーションまで、あらゆる運用に関わる人たちが情報発信をし、経験や技術を共有する貴重なイベントです。
そしてこのイベントでは現在、70を超えるオンデマンドセッションが公開されており、誰でも無料で登録して見ることができます。
この記事はその中から、多くの読者にとって見所となりそうなセッションを10個とりあげて紹介していきます。興味のありそうなセッションが見つかったら、ぜひ「Cloud Operator Days Tokyo 2022」に登録してセッションをご覧ください。
日本を代表するサービス企業の舞台裏を知る
Cloud Operator Days Tokyo 2022の大きな魅力の1つが、ヤフーや楽天、NTTドコモ、KDDI、NTTコミュニケーションズ、LINE、DMMなど、日本を代表する大手企業のサービスの裏側を垣間見ることができるセッションがずらりと並んでいるところです。
クラウドやサービス運用の歴史上、まだ誰も経験したことのない規模と課題に対して、それぞれの企業がどのように取り組み、解決しようとしているのか、普段使ったことのあるサービスの裏側でどんな苦労があるのかを知るだけでも、セッションを楽しく見るきかっけになるのではないでしょうか。
「楽天市場を支える大規模なシステムのリアルタイム監視 ~ ゼロからデファクトスタンダードまで ~」では、Kubernetesが登場する前に構築されたためKubernetesに対応していなかった監視システムを、どのようにPrometheusを用いたモダンな監視システムへと再構築したのかが語られます。
ヤフーにおける監視基盤を Kubernetes上のPrometheusへ移行したプロセスについて解説したのが「2万台規模のIaaSを監視するPrometheusが安定稼働するまでの道のり」。
「クレジットカード会社のGameday、あるいはKubernetesに”Gremlin”を解き放った話」では、クレジットカード会社がカオスエンジニアリングツールを使って大規模障害の訓練を行う話。この手の話を聞く機会は貴重なはず。
クリエイティブな運用の仕事にもフォーカス
現在の運用とは、監視業務と発生したトラブルへの対応といった受け身の仕事だけではなく、アプリケーションの基盤を絶え間なく改善していくというクリエイティブな仕事の側面が強くなってきています。
「エンタープライズ向けクラウドサービス 仮想サーバ基盤開発のリリースサイクル改善」では、NTTコミュニケーションズにおいてエンタープライズ向けIaaS基盤を支える仮想サーバの開発サイクルを改善するという、滅多に語られることがないであろうクラウドを支える技術者の仕事を覗くことができるはずです。
「楽天モバイルの仮想化基盤開発に”本格”Agileを取り入れた話」は、基盤の構築や運用に使用する自動化ツールの開発で抱えていた課題をアジャイルで解決しようとする取り組み。
「インフラ部門に配属された新卒社員がAWS,SSMとか色々使ってテスト環境の構築時間を爆速にした件」ではサービスのリリースサイクル改善などをめざし、手作業で毎回作っていたテスト環境の構築を自動化する話です。
「OpenStack NFV基盤のバージョンアップと運用改善を内製対応した話(KDDI編)」は、従来SIerに頼って開発を進めていた組織が、内製によってインフラを改善していく取り組みについて。
もちろん運用エンジニアが自分たちの業務をよくするための取り組みも紹介しています。「信頼性を落とさず効果的にオンコールを減らす取り組みを目指して エンジニアの睡眠時間を守ろう」は、多くの運用エンジニアにとって身近な問題を解決する取り組みとして注目されるセッションになるでしょう。
情報とノウハウを共有するための新たなツールとCCoE
クラウドの運用は多くの手順やノウハウやの塊でもあります。「そのシステム、ちゃんと理解できてます? – Jupyter Notebookを用いた運用のススメ」は、情報共有にJupyter Notebookを使うという新しいアイデアを提供してくれるセッション。
そしてクラウド業界で新たに注目されているのが、組織内でクラウド活用を推進する組織という位置づけの「Cloud Center of Excellence」(CCoE)の立ち上げと推進です。
その取り組みを日本の伝統的な大企業の中で取り組み始めた経験を語ったのが「たった3名でCloud CoEを立ち上げてみた」のセッション。これからCCoEを立ち上げようとしている多くの組織で参考になるでしょう。
そのほかにも大規模システム運用、運用苦労話、運用自動化、技術トレンドなど、さまざまな話題を暑かったセッションが目白押しです。ぜひ「Cloud Operator Days Tokyo 2022」に登録してオンデマンドセッションをご覧ください。
≫Cloud Operator Days Tokyo 2022
(本記事はCloud Operator Days Tokyo実行委員会提供のタイアップ記事です)