dotData、「dotData Ops 1.4」を発表–Pythonとの連携を強化
今回は「dotData、「dotData Ops 1.4」を発表–Pythonとの連携を強化」についてご紹介します。
関連ワード (データマネジメント等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
dotDataは9月18日、「dotData Ops」のバージョン1.4を発表した。新バージョンでは、SQLでのデータ加工や特徴量生成、Pythonで開発された機械学習モデルを含むパイプラインの運用を一元管理できるようサポートが強化された。
最高経営責任者(CEO)で創業者の藤巻遼平氏は、「今回のアップデートは、データエンジニアやデータサイエンティストとの連携を強化するための重要なステップだ。SQLやPythonで独自に構築されたパイプラインと、『dotData Feature Factory』によるデータ主導の特徴量設計を組み合わせることで、モデル構築から運用まで、チーム全体のワークフローをスムーズにサポートできるようになる」と声明で述べる。
dotData Ops 1.4の主要な機能強化は次の通り。
SQLで記述されたデータ前処理や特徴量生成をdotData Opsで運用できるようになった。これにより、ユーザーはドメイン知識に基づく独自の特徴量と、dotDataのAIが自動で抽出する特徴量の両方を、機械学習パイプラインに組み込むことが可能となった。
また、Pythonで開発された機械学習モデルがサポートされた。これにより、ユーザーは独自に作成した特徴量と、dotDataの特徴量を組み合わせ、任意のPython機械学習ライブラリーを活用してモデルを学習させることができる。学習されたモデルはONNX形式に変換され、dotData Ops上で運用可能になった。
さらに、データサイエンティストの生産性向上を目的に、「Python SDK」が導入された。このSDKを使って、ユーザーはPythonから直接dotData OpsのAPIにアクセスし、データの前処理、特徴量生成、予測までの機械学習ライフサイクルを自動化できる。これにより、ワークフローの効率化と迅速化が図られる。また、ユーザーは数行のコードでdotData Feature Factoryのデータと特徴量パイプラインをdotData Ops上で展開することが可能だ。