AWS、データ活用のボトルネックに対処する新サービスを多数発表
今回は「AWS、データ活用のボトルネックに対処する新サービスを多数発表」についてご紹介します。
関連ワード (クラウド等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
Amazon Web Services(AWS)は、年次イベント「re:Invent 2022」を米国時間11月28日~12月2日に米国ラスベガスで開催している。会期2日目となる11月29日の基調講演には、最高経営責任者(CEO)のAdam Selipsky氏が登壇。あらゆる領域で進むデータ活用で生じているさまざまな課題に対応するための多数の新サービスを発表した。
2022年のre:Inventは、3年ぶりにリアル会場を中心として、一部オンライン視聴も可能な通常の開催形態に戻っている。講演の冒頭でSelipsky氏は、会期中に5万人以上が来場あり、全世界で30万人以上がオンライン視聴をしていると明かした。
会期2日目の基調講演でSelipsky氏が挙げた主題は「探究」になる。現在のクラウドは、オンプレミスで稼働するITシステム基盤の移行先あるいは新規システムの稼働基盤といったインフラにとどまらず、データ活用に必須の環境という姿も帯びている。
Selipsky氏は、コロナ禍がもたらした世界的な混乱、そして、2022年に発生したウクライナ紛争や世界的な物価高などの情勢に触れつつ、先行きの不透明さや不確実性が急激に高まる中でも、人々がデータから得た知見や洞察によって、変革や新世界への歩みを止めることなく進んでいると説いた。また、「脱炭素」などのサステナビリティー(持続可能性)が世界中の組織に共通する課題になり、AWSは2025年までに再資源可能エネルギーを100%利用すること、2030年までに水資源を創出する「ウォーターポジティブ」の実現などを目標に掲げる。それらの道標もデータから得らえる知見や洞察が大きく関係する。
データ活用で新たな世界を知る「探究」は、人間の本質的な営みでもある。しかし、データ活用の道程には幾多の課題が存在し、それは探究の歩みのボトルネックになる。Selipsky氏は、データ活用の「適切なツール」「データの統合」「データのガバナンス」「洞察」というデータ活用の流れを示して、ボトルネックを解消させるための新サービスを紹介していった。
まずデータ活用での「適切なツール」では、AWSはさまざまなデータベースやアナリティクス、人工知能(AI)/機械学習のサービスを提供して、ユーザーのデータ活用を支えているとする。ここでは、ウェブサイトの稼働状態といった業務オペレーションにまつわるデータをリアルタイムに検索、分析することができる「Amazon OpenSearch Service」のサーバーレスオプション(プレビュー)を発表した。対象データの規模の変化などに自動的にリソースなどを拡張するため、ユーザーはそこを気にせず大規模データのりあるタイム活用に専念できるという。
次の「データの統合」は、ある意味でデータ活用の“一丁目”であり、Selipsky氏はデータ活用の前準備として多くのユーザーが直面するETL(データの抽出、変換、格納)を取り上げた。「多くの顧客がデータ統合は『ブラックホールのようなものだ』と言われる。データを簡単に準備して分析に着手できるよう『Zero ETL』(ゼロETL)を実現したい」(Selipsky氏)
ここでは、リレーショナルデータベースサービスの「Amazon Aurora」とデータウェアハウスサービス「Amazon Redshift」の「Zero ETLインテグレーション」と、Redshiftと「Apache Spark」の統合を発表した。Zero ETLインテグレーションでは、AuroraにあるデータをETL処理することなくRedshiftに複製して、すぐに分析を開始できるとする。後者では、RedshiftのデータをApache Sparkの環境から直接扱えるようになり、「Amazon SageMaker」などのAWSのサービスを利用できるとしている。これがゼロETL実現への大きなステップになると、Selipsky氏は強調して見せた。
データガバナンスは一見してデータ活用の対極のようだが、企業や組織ではセキュリティを含めてその両立が必須だ。Selipsky氏は「コントロールとアクセスのバランスだ。厳しい制御はデータ活用を妨げ、寛容なアクセスは情報漏えいなどを招く」と述べる。ただ、データガバナンスは、自組織に関係する法規制などの順守はもちろん、データ活用の観点では部門間あるいは従業員間の“壁”が支障になる。
ここでは「Amazon DataZone」を発表した。組織のデータ責任者が用意するデータカタログやポリシーになど基づいて部門間の垣根を超えた全社的なデータの共有、分析、活用を支援するサービスになる。AWSにある自社のデータ環境だけでなく、Salesforce TableauやDataBricks、Snowflakeなどと連携するAPIも用意される。
また、非常に機密性の高いデータを開示することなく外部組織とのプライベートなデータの共有や活用を可能にするという「AWS Clean Rooms」も発表した。広告キャンペーンにおける個人情報あるいは投資分析での詳細な財務データといったものの秘匿性を担保した状態でクラウド上のコラボレーションが可能になるという。AWSによれば、Amazon DataZoneは社内用途、AWS Clean Roomsは対外用途といった違いになる。
最後の「データ活用」では、ビジネスインテリジェンスにおける分析作業の効率化や高度化を図るという「Amazon QuickSight」の機能拡充を紹介。レポート作成時にページレイアウトの崩れなどを防ぐ「Operational Paginated Reports」や、過去のデータパターンを基に予測を行う「ML powered forecasting with Q」、予測に対する根拠を問うと回答する「Why questions with Q」を加えた。
Selipsky氏は、こうした取り組みで拡大する一方のデータ活用に対応し、「『データの旅路』をエンドツーエンドのパイプラインでAWSが支援する」と表明した。