オラクル、「MySQL HeatWave Lakehouse」の一般提供を開始
今回は「オラクル、「MySQL HeatWave Lakehouse」の一般提供を開始」についてご紹介します。
関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
日本オラクルは7月26日、「MySQL HeatWave Lakehouse」の一般提供を開始したことを発表した。CSVやParquetなどのさまざまなオブジェクトストレージの数百テラバイト(TB)規模のデータを高速分析できるようになるとしている。
MySQL HeatWaveは、同社のクラウドサービス「Oracle Cloud Infrastructure」(OCI)で提供する「MySQL Database Service」でのインメモリークエリー高速化機能。今回のMySQL HeatWave Lakehouseの「Lakehouse(レイクハウス)」は、データウェアハウス(DWH)とデータレイクを掛け合わせた言葉で、多種多様で膨大なデータであってもパフォーマンスが劣化することなくインメモリー環境でクエリーを高速に実行できるとする。
同日の記者説明会で日本オラクル MySQLグローバルビジネスユニット アジア太平洋・日本地域担当 MySQLソリューション・エンジニアリング・ディレクターの梶山隆輔氏は、現在の企業ではデータをビジネスに活用することが追求され、特にオブジェクトストレージへと格納し続けている膨大な非構造化データをいかに効率良く分析できるようにするかが課題になっていると指摘した。
例えば、気象データと商品販売データの相関性を分析して売上増につながる要因などを探るといったものがあるという。これらのデータは量や種類などが極めて膨大であり、分析環境に取り込むだけでも長い時間がかかる。そこからクエリーを実行して分析結果を得るには、さらに長い時間を要する。これを大幅に短くするのが、今回のMySQL HeatWave Lakehouseになるという。
具体的には、MySQL HeatWave Lakehouseでは最大512ノードとして、ノードの拡張と縮小を必要に応じて柔軟に変えることができる。機械学習を用いてユーザーが行いたいクエリーの実行内容などを自動化する運用支援機能の「MySQL Autopilot」を活用して、オブジェクトストレージからMySQL HeatWaveへのデータの取り込を自動的に実行できるほか、ファイルにメタデータが無い場合でも自動でスキーマを予測したり、自動プロビジョニングでオブジェクトストレージからのデータの取り込みに必要なクラスターサイズや所要時間などの予想を算出したりできるようになっている。同社試算で512ノードのクラスターへのプロビジョニングに要する時間は15.6分とする。
梶山氏によれば、各種処理の高速性や柔軟性は「HeatWave クラスター」と呼ぶ並列処理型のアーキテクチャーで実現されているとする。HeatWaveは、同社の研究開発において膨大なデータを効率的に分析するための前処理工程の技術開発がベースになっているとし、急激なリソースの拡張にもパフォーマンスを低下させないことや、機械学習を生かした運用自動化などを容易に組み込める柔軟性を持つという。
また、同社の設定条件という前提で、競合サービスに対する性能比がオブジェクトストレージからデータを取り込む場合だと数倍速く、クエリー実行時間では30倍以上の差になるとアピールする。他方で、サービス利用料は競合との性能差ほどには割高としない設定にしているとも説明している。
MySQL HeatWave Lakehouseは、OCIの全ての商用リージョンおよび「Oracle Dedicated Region」で利用できるようになっている。