東芝デジタルソリューションズ、ビッグデータ・IoT向けデータベースを提供
今回は「東芝デジタルソリューションズ、ビッグデータ・IoT向けデータベースを提供」についてご紹介します。
関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
東芝デジタルソリューションズは、高頻度で大量に発生するIoTデータやビッグデータの管理に適した「GridDB」の新バージョンとして、アーキテクチャーを大幅に刷新した「GridDB 5.0 Enterprise Edition」(GridDB 5 EE)の提供を開始した。
GridDB 5 EEでは、単一のデータベース管理システム(DBMS)でありながら複数のデータモデルを扱うことを可能とした、プラガブルデータストアを搭載。これまでGridDBが提供してきた高頻度で大量なデータ登録に適したデータストアに加え、複雑な分析を高速に行うことができるデータストアや、ログなどの文章を蓄積することが得意なデータストアを組み込める。
近年、IoTで扱われるデータやその活用方法が多様化しており、その結果、データモデルも多様化している。このため新たなデータモデルを扱う際、複数のDBMSを用意したり、無理やり単一のDBMSで対応したりしているのが現状だ。しかしそのような対応方法では、システムの煩雑化、構築/運用コストの上昇、リアルタイム性の損失などの問題が生じる。
GridDB 5 EEは、独自の高効率チェックポイントアルゴリズム技術 HCAL(Highly efficient Checkpoint Algorithm for Large-scale data)による新チェックポイント方式を導入し、チェックポイント時のファイルへのログ書き込み量を削減し、ディスクI/O負荷を低減させた。
チェックポイントとはDBMSで、データベースへの変更をストレージ(外部記憶装置)上のファイルに書き込む処理のこと。データベースの内容の変更はまずメインメモリー(RAM)上で行い、ストレージへの反映は変更内容がある程度溜まってからまとめて行う。
新チェックポイント方式により頻繁にデータの追加・更新を行うシステムでは、システムの負荷が下がり、その結果より多くのデータベース処理を実行できるようになる。また、テーブルごとに固有のブロックを割り当てることで、テーブル単位のスキャンや削除を高速化できる機能を追加した。テーブルスキャンが多用されるデータ分析クエリーなどで有効となる。さらに削除予定のテーブルを指定しておけばテーブル削除が高速になる。
これらの性能改善を行うことで、データベースの性能比較するためのベンチマークテスト(TPC-H)で、17〜46%(平均26%)改善した。