オラクル、本物のようなテストデータ群を生成AIが自動生成してくれる「Select AI for Synthetic Data Generation」発表。Oracle CloudWorld 2024

今回は「オラクル、本物のようなテストデータ群を生成AIが自動生成してくれる「Select AI for Synthetic Data Generation」発表。Oracle CloudWorld 2024」についてご紹介します。

関連ワード (機能、自然言語、設計時等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


米オラクルは、生成AIがテスト用に実データのような特徴を備えたデータ群を自動的に生成してくれるOracle Autonomous Databaseの新機能「Select AI for Synthetic Data Generation」を発表しました。

「Select AI for Synthetic Data Generation」を発表

ソフトウェアの開発において、ユーザーインターフェイスの設計時やテスト時、コードのテスト時、性能テストや負荷テストなど、さまざまな場面で適切なテストデータを用意する必要があります。

このとき、理想的には本番環境で使われる実データ全体もしくは一部をテストデータとして利用できることが望ましいといえますが、現実的には開発時にはそのようなデータは入手困難であることが一般的です。

もしも入手可能であったとしても、情報漏洩のリスクやプライバシーポリシーなどの面で、実データを開発環境やテスト環境で使うことはほとんどの場合において許されないことが想定されます。

そのため、できるだけ実データに似せたダミーデータを開発者自身が用意することになりますが、手作業で実データのような内容やデータの分布を備えたダミーデータを大量に作成するのは非常に面倒な作業です。

生成AIがスキーマやプロンプトを元にダミーデータを生成

これを解決するのが、今回発表された「Select AI for Synthetic Data Generation」です。

Oracle Autonomous Databaseには、自然言語を用いてデータベースへ問い合わせなどができる生成AI機能として「Select AI」が用意されています。

「Select AI for Synthetic Data Generation」はそのSelect AIの新機能であり、生成AIがスキーマとメタデータ、自然言語の指示などを元に、ダミーデータを自動生成してくれます。

具体的には、データベーススキーマを定義する際に「generate_synthetic_data()」関数を呼び出すことで、生成されるテーブル内にダミーデータが生成されます。テーブルのスキーマを指定する際に、自然言語でどのようなデータかを指示することも可能です。

例えば、映画データを格納するテーブルに「all movies are released in 2009」(全ての映画は2009年に公開された)や「the value for state should either be CA, WA, or TX」(州の名前はCAかWA、TXのいずれか)といった制約を付けてデータを生成させる例が示されています。

生成AIがダミーデータを生成するには一定の時間がかかりますが、時間短縮のためにタスクを分割して並列実行していると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
国民的アニメのリメイクは「デマ」 カラー、庵野監督次回作についての一部報道を否定
くらテク
2021-05-18 22:14
再編を迫られるスマホ業界を牽引する見本市MWCは、また同じことの繰り返しになるのか?
IT関連
2022-02-28 19:10
チューリング賞、スパコン高速化に貢献したジャック・ドンガラ氏に
IT関連
2022-04-01 10:43
スペースXがStarlink衛星60基を追加打ち上げ、予約注文は50万件以上
宇宙
2021-05-06 08:06
【レビュー】電動自転車VanMoof X3、ハイテクだが手頃な値段であらゆる人を信奉者にしてしまう
モビリティ
2021-07-28 19:29
2023年は「経理DX元年」–SBIビジネス・ソリューションズが考える地方企業のDX推進
IT関連
2022-06-30 02:40
最高2500円のカプセルトイも バンダイが新型自販機で「プレミアムガシャポン」展開 第1弾は「鬼滅の刃」
くらテク
2021-01-16 08:34
在宅勤務で人気のドキュメントスキャナーScanSnapに新モデルiX1600登場、有線接続で安価なiX1400もラインアップ
ハードウェア
2021-01-20 08:56
生成AIの推進組織や十分なガイドが企業の成果に影響–ガートナーが展望
IT関連
2024-03-16 13:42
Canonical、「Ubuntu 22.10」をリリース–IoT開発者向けの機能強化など
IT関連
2022-10-27 07:09
サイバートラスト、「AlmaLinux」に参画–「MIRACLE LINUX」も合流へ
IT関連
2023-05-24 20:19
Palantir、新興企業向け「Foundry for Builders」を立ち上げ
IT関連
2021-07-22 16:11
AGCとテラスカイ、CRMの大規模社内展開でCoEの利用など連携
IT関連
2021-02-18 17:37
マイクロソフト、古い「Office」の稼働状況を把握するパッチの詳細を説明
IT関連
2023-02-08 05:54