オラクル、本物のようなテストデータ群を生成AIが自動生成してくれる「Select AI for Synthetic Data Generation」発表。Oracle CloudWorld 2024

今回は「オラクル、本物のようなテストデータ群を生成AIが自動生成してくれる「Select AI for Synthetic Data Generation」発表。Oracle CloudWorld 2024」についてご紹介します。

関連ワード (機能、自然言語、設計時等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


米オラクルは、生成AIがテスト用に実データのような特徴を備えたデータ群を自動的に生成してくれるOracle Autonomous Databaseの新機能「Select AI for Synthetic Data Generation」を発表しました。

「Select AI for Synthetic Data Generation」を発表

ソフトウェアの開発において、ユーザーインターフェイスの設計時やテスト時、コードのテスト時、性能テストや負荷テストなど、さまざまな場面で適切なテストデータを用意する必要があります。

このとき、理想的には本番環境で使われる実データ全体もしくは一部をテストデータとして利用できることが望ましいといえますが、現実的には開発時にはそのようなデータは入手困難であることが一般的です。

もしも入手可能であったとしても、情報漏洩のリスクやプライバシーポリシーなどの面で、実データを開発環境やテスト環境で使うことはほとんどの場合において許されないことが想定されます。

そのため、できるだけ実データに似せたダミーデータを開発者自身が用意することになりますが、手作業で実データのような内容やデータの分布を備えたダミーデータを大量に作成するのは非常に面倒な作業です。

生成AIがスキーマやプロンプトを元にダミーデータを生成

これを解決するのが、今回発表された「Select AI for Synthetic Data Generation」です。

Oracle Autonomous Databaseには、自然言語を用いてデータベースへ問い合わせなどができる生成AI機能として「Select AI」が用意されています。

「Select AI for Synthetic Data Generation」はそのSelect AIの新機能であり、生成AIがスキーマとメタデータ、自然言語の指示などを元に、ダミーデータを自動生成してくれます。

具体的には、データベーススキーマを定義する際に「generate_synthetic_data()」関数を呼び出すことで、生成されるテーブル内にダミーデータが生成されます。テーブルのスキーマを指定する際に、自然言語でどのようなデータかを指示することも可能です。

例えば、映画データを格納するテーブルに「all movies are released in 2009」(全ての映画は2009年に公開された)や「the value for state should either be CA, WA, or TX」(州の名前はCAかWA、TXのいずれか)といった制約を付けてデータを生成させる例が示されています。

生成AIがダミーデータを生成するには一定の時間がかかりますが、時間短縮のためにタスクを分割して並列実行していると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
「Python」の登録商標、米Python Software Foundationが再出願。アーク社の登録商標に対しては不使用取消審判を請求
Python
2021-07-16 15:47
米国防総省、「数日先」の異変検知にAI活用へ–テスト実施
IT関連
2021-08-05 19:20
サーバラック3つで自分のOracle Cloudリージョンが持てる「Oracle Dedicated Region 25」発表
Oracle
2024-09-13 06:47
急速充電が可能なKiaの電動クロスオーバーEV6が2022年初頭に米国に登場
モビリティ
2021-06-06 01:22
独立系VCのSixty8 Capitalが社会的地位の低い創業者を対象とした22億円規模のファンドを設立
VC / エンジェル
2021-07-20 21:54
DX専門組織の推進事例と成功のポイント
IT関連
2022-01-19 02:09
楽天グループ、物流センターを東京都八王子市に新設 2023年稼働へ
企業・業界動向
2021-06-24 21:06
約8割が社内システムの定着化の実施、状況を把握していない–TMJ調査
IT関連
2023-05-03 22:22
「Google Workspace」、「スマートキャンバス」機能を拡張
IT関連
2022-02-18 10:24
Amazon Alexaの頭脳構築に貢献したチームを擁する住宅関連サービスのHomeXが約98億円調達
ネットサービス
2021-04-20 16:05
「これだ!」をまとめ上げる–アクティブインテリジェンスが組織に潜む「多数の力」を解き放つ
IT関連
2021-08-20 07:02
KDDIテクノロジー、スマートグラスを用いた同時通訳システムの有用性を実証
IT関連
2023-12-23 20:03
大腸がんをAIで検出 25万枚の症例画像を学習 国立がん研究センターとNECが開発
企業・業界動向
2021-01-13 07:27
三菱地所プロパティマネジメント、クラウド請求書サービスで月2000時間を削減
IT関連
2023-10-13 02:44