dotData、データサイエンス自動化ソフトの最新版をリリース
今回は「dotData、データサイエンス自動化ソフトの最新版をリリース」についてご紹介します。
関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
dotDataは7月13日、データサイエンスのプロセスを自動化するソフトウェアの最新版「dotData Enterprise 3.2」をリリースした。モデルと特徴量の品質向上、ワークフローの自動化強化、大規模データの可視化、ビジネスインテリジェンス(BI)とのシームレスな連携などが図られている。
dotData Enterprise 3.2では、dotDataのAI自動化が生成するモデルと特徴量から、より高度な予測や深い洞察を導き出すために、新たなデータ可視化機能が追加された。企業の大規模なデータに対応できるのが最大の利点になる。
例えば、回帰誤差分析チャートでは、数百万件ものデータサンプルをスムーズに可視化し、またターゲットエンコーディングのマッピング機能では、何十万のカテゴリー値をサポートする。これによって対話的にデータや結果を詳細なレベルで分析できるようになる。
また、特徴量と予測に対する透明性と説明性をさらに強化するために、サンプル単位で予測値や特徴量の説明する新機能を導入した。ユーザーは個々の予測に影響を与える主な要因を理解し、モデルの全体的な動きを把握するだけでなく、特定の予測値に対するビジネス戦略を実行可能になる。
JDBCによるエクスポートを標準サポートし、特徴量テーブルや予測結果など、dotDataの導き出すさまざまな分析結果をBIツールへとシームレスに連携可能となった。これによって、BIユーザーやデータ分析官は、ビジネスに有益なデータからの洞察を生み出すダッシュボードをより柔軟に作成できる。
モデルや特徴量の品質向上のために、「特徴量リーク」の自動検出機能も導入された。各特徴量におけるリークの可能性を評価し、リークが疑われる場合には、グラフィカルユーザーインターフェース(GUI)上でユーザーに表示する。これにより、潜在的なリークを事前に特定し、特徴量やモデルの品質を保つ。
加えて、エンドツーエンドでのAI開発の自動化をさらに強化するため、特徴量自動設計と機械学習自動化を含む、新たなAPIを導入する。開発ワークフローのさらなる自動化によって、データのクレンジングからモデル開発までの機械学習ライフサイクルを加速する。