オラクル、インメモリDBのMySQL HeatWaveに機械学習機能を追加。SQL文だけで学習、推論、説明の取得を実現

今回は「オラクル、インメモリDBのMySQL HeatWaveに機械学習機能を追加。SQL文だけで学習、推論、説明の取得を実現」についてご紹介します。

関連ワード (処理、利便性、実現等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


オラクルは、MySQLにインメモリデータベースエンジンを搭載することで高速なOLAP機能を提供する「MySQL HeatWave」の新機能として、機械学習機能を提供する「MySQL HeatWave ML」を発表しました。

同時に、無停止でのHeatWaveのノード拡張と、ノードあたりのデータ格納量の倍増も発表されました。

[プレスリリース抄訳] オラクル、MySQL HeatWave MLを発表 – 開発者が簡単、迅速、経済的に利用可能なMySQL アプリケーション向けの強力な機械学習機能を提供 – Oracle Cloud Infrastructure(OCI)の東京と大阪を含む37のリージョンでご利用可能です https://t.co/ly7qGP8CZ5 #mysql_jp #機械学習 pic.twitter.com/AwQ0zVGFeT

— MySQL_Jp (@mysql_jp) March 30, 2022

オラクルはOracle Cloudで提供しているMySQLデータベースのマネージドサービス上に、スケールアウト可能なインメモリデータベースエンジンによって高速なOLAPを実現した「MySQL HeatWave」を追加しています。今回発表されたのは、このMySQL HeatWaveにおいてOLAPだけでなく機械学習による推論などを可能にした「MySQL HeatWave ML」です。

これでオラクルはOracle Cloud上のMySQLデータベースサービスにおいて、InnoDBによるOLTP、HeatWaveによるOLAP、HeatWave MLによる機械学習を統合したことになります。

fig

ユーザーはこの3つの処理の切り替えをほとんど意識することなく、1つのデータベースに対してSQL文を投げるだけで望む処理が可能になります。

一般的にはOLTPとOLAPと機械学習はそれぞれ別々のサービスに分かれており、OLTPで蓄積したデータを別のデータウェアハウスなどに転送してOLAPによる分析などを行い、さらにそのデータを機械学習サービスに読み込ませることで学習と推論を行うことになります。

この場合、対象となるデータの数倍のストレージ容量が必要となり、大規模なデータ転送には時間がかかるためタイムリーな分析などが難しく、またデータが転送されるたびにセキュリティを保つのが難しくなるなどの課題がありました。

これに対して、MySQL、HeatWave、HeatWave MLは1つのサービス上で統合されています。またHeatWaveはインメモリデータベースとはいえ数十テラバイトものデータを分析可能で、これがデータ転送することなくそのまま機械学習のデータセットとして利用可能な点は、従来の課題を解決する即時性や利便性を実現できる大きな特徴とされています。

アルゴリズムは自動選択、SQLだけで学習、推論が可能

HeatWave MLでは、Oracle Autonomous Data Warehouseの機械学習機能にも搭載されている「AutoML」を搭載しているため、機械学習処理においては適切なアルゴリズムなどが自動的に選択されます。

ユーザーは機械学習に関する専門的な知識やプログラミング能力を持たなくとも、SQL文により学習対象を指定し、同じくSQL文で推論結果を取得するなど、簡単に使い始めることができます。

また推論結果に対してどの特徴量が重視されたのかもSQL文で取得できることがHeatWave MLの大きな特徴とされています。これにより、なぜその推論結果が得られたのか、その理由を知ることが可能です。

今回、HeatWaveそのものも強化されました。1つは無停止でのノード拡張、そしてもう1つはノードあたりのデータ格納量の倍増です。

HeatWaveはスケールアウト可能なアーキテクチャを備えていますが、ノード数を増やすには一度クラスタを停止する必要がありました。今回の新機能で、クラスタを停止することなくノードを追加することが可能になりました。

また、HeatWaveのノードあたりのデータ格納量が倍増となりました。

HeatWaveはインメモリデータベースであり、各ノードごとにデータがメモリに格納され、処理されます。従来このノードごとに格納できるデータは410GB程度でしたが、効率的なジョインを実現するブルーム・フィルタの導入と、圧縮率の高いアルゴリズムの採用によって、1ノードあたりに格納できるデータが2倍の820GBとなりました。

fig

これにより従来のノード数の半分で同じ量のデータを格納できることになります。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
文字ではなく“声“で人間味のある交流を Clubhouseが生まれたワケ
企業・業界動向
2021-02-02 16:36
兼松、CO2排出量を可視化する「アスゼロ」導入–コンサルティングサービスを評価
IT関連
2023-02-07 22:07
サーバサイドを含むWordPressのフルスタックをWebAssembly化した「In-Browser WordPress」、WordPressのコア開発チームとGoogle Chromeの開発チームが紹介
PHP
2023-04-14 07:11
話した言葉を透明パネルに字幕表示 筑波大、「See-Through Captions」開発 :Innovative Tech
イラスト・デザイン
2021-03-23 04:42
「オープンサイエンス」の拡大がイノベーションの促進につながる–NIIが目指す先
IT関連
2023-08-02 05:20
「かもめーる」終了 21年度から発行せず 日本郵便が発表
くらテク
2021-03-31 11:26
コクヨの紙とペン「PERPANEP」で改めて考えた、「書き心地が良い」とはどういうことだろう :新連載「分かりにくいけれど面白いモノたち」(1/5 ページ)
くらテク
2021-04-14 23:17
NEC、多数のカメラ映像をリアルタイム・高精度に分析する技術–デジタルツインの実現見据え
IT関連
2023-03-04 14:42
アドビ、AI駆使のビデオ新機能–動画内の“言いよどみ”を自動検出
IT関連
2023-09-15 04:12
熊本市、アマゾンを利用した地域コミュニケーション基盤を実証
IT関連
2023-12-06 23:15
ローコードでサードパーティサービスを統合するプラットフォームDigibeeがシリーズAで約28.7億円調達
IT関連
2022-02-05 05:26
クラリス、「FileMaker 2023」を国内提供–リリース番号が発売年をベースに
IT関連
2023-05-24 21:01
アップルが最新iOS 15のベータ版をすべての人に公開、開発者アカウント不要
ソフトウェア
2021-07-02 20:30
銀行のさまざまな場面に導入されるAI、付き合い方はいかに変わっていくか
IT関連
2024-07-17 04:53