オラクル、本物のようなテストデータ群を生成AIが自動生成してくれる「Select AI for Synthetic Data Generation」発表。Oracle CloudWorld 2024

今回は「オラクル、本物のようなテストデータ群を生成AIが自動生成してくれる「Select AI for Synthetic Data Generation」発表。Oracle CloudWorld 2024」についてご紹介します。

関連ワード (機能、自然言語、設計時等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


米オラクルは、生成AIがテスト用に実データのような特徴を備えたデータ群を自動的に生成してくれるOracle Autonomous Databaseの新機能「Select AI for Synthetic Data Generation」を発表しました。

「Select AI for Synthetic Data Generation」を発表

ソフトウェアの開発において、ユーザーインターフェイスの設計時やテスト時、コードのテスト時、性能テストや負荷テストなど、さまざまな場面で適切なテストデータを用意する必要があります。

このとき、理想的には本番環境で使われる実データ全体もしくは一部をテストデータとして利用できることが望ましいといえますが、現実的には開発時にはそのようなデータは入手困難であることが一般的です。

もしも入手可能であったとしても、情報漏洩のリスクやプライバシーポリシーなどの面で、実データを開発環境やテスト環境で使うことはほとんどの場合において許されないことが想定されます。

そのため、できるだけ実データに似せたダミーデータを開発者自身が用意することになりますが、手作業で実データのような内容やデータの分布を備えたダミーデータを大量に作成するのは非常に面倒な作業です。

生成AIがスキーマやプロンプトを元にダミーデータを生成

これを解決するのが、今回発表された「Select AI for Synthetic Data Generation」です。

Oracle Autonomous Databaseには、自然言語を用いてデータベースへ問い合わせなどができる生成AI機能として「Select AI」が用意されています。

「Select AI for Synthetic Data Generation」はそのSelect AIの新機能であり、生成AIがスキーマとメタデータ、自然言語の指示などを元に、ダミーデータを自動生成してくれます。

具体的には、データベーススキーマを定義する際に「generate_synthetic_data()」関数を呼び出すことで、生成されるテーブル内にダミーデータが生成されます。テーブルのスキーマを指定する際に、自然言語でどのようなデータかを指示することも可能です。

例えば、映画データを格納するテーブルに「all movies are released in 2009」(全ての映画は2009年に公開された)や「the value for state should either be CA, WA, or TX」(州の名前はCAかWA、TXのいずれか)といった制約を付けてデータを生成させる例が示されています。

生成AIがダミーデータを生成するには一定の時間がかかりますが、時間短縮のためにタスクを分割して並列実行していると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
「GIF」生みの親、スティーブ・ウィルハイト氏が死去
IT関連
2022-03-26 21:13
「Windows 11」について今知っておきたいすべてのこと
IT関連
2021-07-21 16:51
沈黙の巨人、「写研」が動いた “愛のあるユニークで豊かな書体”がわれらの手に届くまでの100年を考える (1/3)
イラスト・デザイン
2021-01-22 02:07
子供に5000円分の電子地域通貨を配布 群馬県みなかみ町
IT関連
2021-08-11 16:25
規制上のハードルをすべてクリアし、マイクロソフトが2.3兆円のNuance買収完了へ
IT関連
2022-03-06 16:53
ツイッターが「TweetDeck」のリニューアルをテスト、将来のサブスクリプション化を目指す
ネットサービス
2021-07-27 11:08
真のキャッシュレス社会実現のために必要な5つの改革
フィンテック
2021-01-12 17:08
メールがなくなってしまえば脅威はなくなる? インシデントはメールとWebから、というけれど :サイバーセキュリティ2029(1/2 ページ)
セキュリティ
2021-07-31 04:16
日立、アセット活用でシステム開発を効率化–「Lumada Solution Hub」のノウハウを集約
IT関連
2023-08-25 11:14
IT系上場企業の平均年収を業種別にみてみた 2021年版[前編] ~ ネットベンチャー、ゲーム、メディア系
働き方
2021-07-12 00:57
感染研、新型コロナの記事や投稿への不適切な引用に苦言 「健全な社会の議論をゆがめる」
ネットトピック
2021-08-06 00:49
これからの企業のセキュリティは「IT環境全体の保護」として捉えよ
IT関連
2023-12-16 10:36
いびきも計測してくれる新Nest Hubを試してみた :Googleさん
トップニュース
2021-05-04 09:49
ドコモ、触れずに“サバ”の体長測れる水中超音波技術を開発 
社会とIT
2021-03-09 09:55