米Uber、1エクサバイト超のデータ量を持つ世界最大規模のHadoopシステムを、オンプレミスからGoogle Cloudへ移行すると発表

今回は「米Uber、1エクサバイト超のデータ量を持つ世界最大規模のHadoopシステムを、オンプレミスからGoogle Cloudへ移行すると発表」についてご紹介します。

関連ワード (世界最大級、区別、提携等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


米Uberは、オンプレミス上に構築した数万台ものサーバによる1エクサバイト超のデータ容量を持つ世界最大級のHadoopエコシステムを、Google Cloudへ移行すると発表しました。

UberはGoogle Cloudへの移行のメリットを次のように説明しています。

Modernizing with GCP will enable big gains in user productivity, engineering velocity, improved cost efficiency, access to new innovation, and expanded data governance.

GCPによるシステムのモダナイズで、ユーザーの生産性、エンジニアリングのスピード、コスト効率の改善、新しいイノベーションへのアクセス、データガバナンスの拡大などが可能になるでしょう。

fig

Uberは世界中で同社が提供しているライドシェアやフードデリバリーのサービスの背後で、ドライバーと利用者のマッチングや価格設定などの自動化および最適化などの処理を機械学習で行っており、最近ではAIを用いた自動運転や自動配達にも進出しています。

そのデータ処理基盤となっているのが、今回Google Cloudへ移行することになったオンプレミス上に構築されたHadoopエコシステムです。

HDFSをオブジェクトストアへ移行

下記の図が同社が説明する移行前(左)と移行後(右)のシステム概要です。

fig

HDFSをGoogle Cloudのオブジェクトストアに移行し、それ以外の部分はGoogle CloudをIaaSとして用い、オンプレミスのシステムをほぼそのままGoogle Cloud上に再構築します。

その上で、Google Cloudのオブジェクトストレージの上にHDFS互換のインターフェイスを実装することで、既存のデータ処理システムはそのまま利用可能にすると説明しています。

同社のコンピュートプラットフォーム、コンテナ環境、デプロイメントツールなどはオンプレミスとクラウドを区別しないように作られているため、オンプレミス上のサービス群をクラウドのIaaS上に簡単に拡張できるようになっているとのことです。

移行にあたりUberが想定する課題とは

UberはオンプレミスからGoogle Cloudへの移行に当たって、以下の課題に取り組むと説明しています。

パフォーマンス
HDFSとオブジェクトストアには機能や性能特性の違いがあるため、オープンソースのHadoopコネクタを活用し、パフォーマンスを最大化するための進化を支援する。

ガバナンス
クラウド関連の利用コストは、効果的かつプロアクティブに管理しなければ膨れ上がる可能性がある。社内のキャパシティ・エンジニアリングチームと提携し、より細かいメカニズムとトラッキングを構築する。

非分析用途でのHDFSの使用
ここ数年、一般的なファイルストアとしてHDFSを使い始めるケースもあるため、これらのユースケースにたいしては、他のサービスに積極的に移行させるためのパスを提供する。

未知の課題
オンプレミス上のシステムは7年前から構築されてきており、クラウドへの移行には予期せぬ課題に直面することは確実だ。レガシーなユースケースは積極的に非推奨とするなど、こうした課題に先手を打っていく。

移行の目的はコスト削減よりもモダナイズ

これらのUberの説明を見ていくと、オンプレミスからクラウドへの移行はコスト削減よりも、システム全体を見直しつつ再構築することによるモダナイズと、古いユースケースや本来の使い方から外れた利用法などを廃止することによる効率化や最適化にあるのではいかと考えられます。

Uberは今後も移行に関する進捗や教訓を共有していくとしています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
トヨタカローラネッツ岐阜、法人支出管理サービス「バクラク」を導入–立替経費のキャッシュレス化を促進
IT関連
2024-07-09 20:21
量子技術とAIのSandbox AQ、Alphabetからスピンオフ–シュミット氏ら出資
IT関連
2022-03-24 12:08
KADOKAWA子会社、「貢献」で得られたポイントを自社サービスのコインと交換
IT関連
2022-05-27 06:27
書く瞑想アプリ「muute」がAppStoreのヘルスケア/フィットネス領域で1位獲得、新機能も発表
ヘルステック
2021-01-30 18:24
セゾン情報、クラウド型データ連携基盤「HULFT Square」を提供
IT関連
2023-02-11 05:08
住友ゴム工業、「Dataiku」導入で製造工程の効率化とデータドリブンな文化を推進
IT関連
2024-07-19 19:08
重要インフラ保護とサイバーレジリエンスの向上–不可欠な「指標」
IT関連
2024-09-10 15:39
マイクロソフト、Azure OpenAI Serviceを東日本リージョンで提供開始(ほぼ確実に)
Microsoft
2023-07-19 13:57
庵野秀明と松本人志の初対談、アマプラで配信 初対面で「どうなるんでしょうね」「すぐに滞ると……」
くらテク
2021-08-21 17:14
コロナワクチン普及後はハイブリッドワーク–日米企業の意識調査
IT関連
2021-07-06 19:34
茨城県五霞町、メール無害化サービスを導入–添付ファイル確認作業を年間約2万5000時間削減
IT関連
2023-02-18 14:50
流出騒ぎのTrello、運営元が声明 「初期設定は『非公開』」「意図しない情報漏えいを止めるためサポート」
セキュリティ
2021-04-07 21:57
茨城県結城市、小・中学校に「tomoLinks」を導入–生徒が相談しやすい体制つくる
IT関連
2024-03-31 06:47
複雑なサイト利用規約の要約を求める法案、米議員らが提出
IT関連
2022-01-19 23:47