オラクル、本物のようなテストデータ群を生成AIが自動生成してくれる「Select AI for Synthetic Data Generation」発表。Oracle CloudWorld 2024

今回は「オラクル、本物のようなテストデータ群を生成AIが自動生成してくれる「Select AI for Synthetic Data Generation」発表。Oracle CloudWorld 2024」についてご紹介します。

関連ワード (機能、自然言語、設計時等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


米オラクルは、生成AIがテスト用に実データのような特徴を備えたデータ群を自動的に生成してくれるOracle Autonomous Databaseの新機能「Select AI for Synthetic Data Generation」を発表しました。

「Select AI for Synthetic Data Generation」を発表

ソフトウェアの開発において、ユーザーインターフェイスの設計時やテスト時、コードのテスト時、性能テストや負荷テストなど、さまざまな場面で適切なテストデータを用意する必要があります。

このとき、理想的には本番環境で使われる実データ全体もしくは一部をテストデータとして利用できることが望ましいといえますが、現実的には開発時にはそのようなデータは入手困難であることが一般的です。

もしも入手可能であったとしても、情報漏洩のリスクやプライバシーポリシーなどの面で、実データを開発環境やテスト環境で使うことはほとんどの場合において許されないことが想定されます。

そのため、できるだけ実データに似せたダミーデータを開発者自身が用意することになりますが、手作業で実データのような内容やデータの分布を備えたダミーデータを大量に作成するのは非常に面倒な作業です。

生成AIがスキーマやプロンプトを元にダミーデータを生成

これを解決するのが、今回発表された「Select AI for Synthetic Data Generation」です。

Oracle Autonomous Databaseには、自然言語を用いてデータベースへ問い合わせなどができる生成AI機能として「Select AI」が用意されています。

「Select AI for Synthetic Data Generation」はそのSelect AIの新機能であり、生成AIがスキーマとメタデータ、自然言語の指示などを元に、ダミーデータを自動生成してくれます。

具体的には、データベーススキーマを定義する際に「generate_synthetic_data()」関数を呼び出すことで、生成されるテーブル内にダミーデータが生成されます。テーブルのスキーマを指定する際に、自然言語でどのようなデータかを指示することも可能です。

例えば、映画データを格納するテーブルに「all movies are released in 2009」(全ての映画は2009年に公開された)や「the value for state should either be CA, WA, or TX」(州の名前はCAかWA、TXのいずれか)といった制約を付けてデータを生成させる例が示されています。

生成AIがダミーデータを生成するには一定の時間がかかりますが、時間短縮のためにタスクを分割して並列実行していると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
データ量の多い科学の再現をサポートし科学者たちのコラボを容易にするCode Ocean
ネットサービス
2021-06-02 15:40
セキュリティライブラリーwolfSSLが耐量子計算機暗号(PQC)に対応、組み込み機器で通信が可能に
IT関連
2022-03-19 14:01
静岡銀行、データ活用の高度化でりそな銀行らと連携
IT関連
2024-05-02 08:48
マイクロソフト、小売業界向けクラウド「Cloud for Retail」のプレビュー版を公開
IT関連
2021-01-15 08:55
外食産業向け業務支援DXおよび店舗・エンドユーザーの接点を一元管理可能なSaaSのイデア・レコードが5億円調達
フードテック
2021-08-05 13:20
AWSで世界的なクラウドインテグレーターに–クラスメソッド横田代表
IT関連
2022-12-16 09:18
「マネーフォワード クラウド請求書」、「カード決済機能」を追加
IT関連
2023-12-28 08:41
InstagramとWhatsAppにシステム障害発生
ネットサービス
2021-03-21 06:21
[速報]WindowsにチャットAIを搭載「Windows Copilot」発表、サイドバーから利用可能。6月にプレビュー版が登場予定。Build 2023
Microsoft
2023-05-24 02:59
アドビ、事業戦略を発表–“2つの力”を備えるデジタル人材の育成へ
IT関連
2022-07-02 16:46
新型コロナの新規陽性者数、2月6日に1万人超えか Googleが予測データを更新
ロボット・AI
2021-01-13 03:54
ソニー銀行、住宅ローン審査の書類管理にクラウド活用
IT関連
2022-02-09 22:48
MAIAとSAPジャパン、女性デジタル人材の育成・就労を支援する基盤を構築
IT関連
2023-07-26 18:56
Rust製のオープンソースエディタ「Zed」のLinux安定版が公開
開発ツール
2024-07-12 20:15