生成型AIの意図的なウソを見抜く方法とは?オックスフォード大らの共同研究

今回は「生成型AIの意図的なウソを見抜く方法とは?オックスフォード大らの共同研究」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成型の人工知能(AI)が抱える大きな課題の1つとして、こうしたAIがOpenAIなどの企業によってクローズド環境で開発されている場合、その機能を直接検証できず、ブラックボックスのようになってしまうということが挙げられる。

 「GPT-4」といったチャットプログラムの動作を詳細を調べられない場合、真っ赤なウソを吐き出していないという確証を得るにはどうすればよいだろうか。

 オックスフォード大学とイェール大学の研究者らはこうした脅威に立ち向かうために、大規模言語モデル(LLM)の出力に含まれている虚偽を洗い出せる、ウソ発見器とでも呼べるものを作り上げたという。このウソ発見器は、チャットプログラムの内部にアクセスしなくても、各対話に引き続いてイエス/ノーで答えられる一連の無関係な質問を投げかけるだけで目的を達成できるとされている。

 この研究者らの論文によると、作成したウソ発見器は当初の対象ではないLLMにも適用でき、初めて出会うプロンプトや、数学の質問のような今までに遭遇したことのないトピックのデータベースにも対応できるという。

 このウソ発見器について説明する論文、「How to catch an AI liar: lie detection in black box LLMs by asking unrelated questions」(ウソつきAIを捕まえるには:ブラックボックス化されているLLMに無関係の質問を投げかけることでウソを見抜く方法)には、プレプリントの論文を発表するサーバー「arXiv」からアクセスできる。その論文の中で、主執筆者であるオックスフォード大学のLorenzo Pacchiardi氏と、ケンブリッジ大学やイェール大学の協力者は「このウソ発見器は、シンプルであるにもかかわらず、極めて精度に優れており、汎用性も驚くほど高い」と記している。

 AI用のウソ発見器とはどのようなものだろうか。Pacchiardi氏率いる研究者らは、チャットプログラムが「知っている」と考えられる事実があるにもかかわらず、それとは異なった出力を生成するケースに焦点を当てている。ここでのチャットプログラムが「知っている」という言葉の意味は、当然ながら明確に定義されているわけではなく、単なる概念にすぎない。

 同論文は「われわれの定義において、誤った回答をウソと呼んでよいのは、話者が正しい回答を知っている場合のみだ」と記している。そういう意味で、Pacchiardi氏率いる研究者らは、オックスフォード大学が設立した人類の未来研究所(FHI:Future of Humanity Institute)のOwain Evans氏をはじめとする研究者らによる2021年の論文に記されている定義、すなわちAIのウソを「積極的に選択された誤り」とする考え方を踏襲している。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
セキュリティ体制とランサムウェア対応を強化する新たなデータ管理の必要性
IT関連
2022-04-26 16:23
「プログラマー35歳定年説」が残る中国で開発者が生き残る道
IT関連
2022-10-01 15:53
2023年はデータ活用が主役の「クラウド応用期」–グーグル・クラウド平手代表
IT関連
2023-01-06 22:38
91歳のラストサムライ、「ネットサムライ」に転身しコロナ禍乗り切る
IT関連
2021-01-14 16:26
Google Forms APIが正式リリース。Googleフォームの作成や編集、集計などをプログラミングで制御可能に
Google
2022-03-22 14:08
富士ソフト、TOTOの「設備管理サポートサービス」事業化を支援–AWSでIoTシステムを構築
IT関連
2023-07-30 07:27
凸版印刷、マーケティングへの本格的なAI導入と運用の自動化を支援
IT関連
2023-02-11 19:25
人と間違えるほど自然な合成音声を高速で作成するツールをWellSaid Labsが開発
ソフトウェア
2021-07-09 21:53
日本の行政や企業は「AIのガバナンス欠如」に目を配れ
IT関連
2024-01-19 13:33
睡眠時無呼吸症候群(SAS)解決ソリューション開発のマリが3億円のシリーズA調達、開発中の治療機器の薬事承認化を加速
IT関連
2022-01-21 16:51
マイクロソフト、「Office LTSC」のコマーシャルプレビュー提供
IT関連
2021-04-23 05:02
“事件”以来3年ぶり コインチェック、テレビCM再開
企業・業界動向
2021-01-14 00:26
インフラのGitOpsを可能にする「Pulumi Deployments」登場。コードをGit Pushするだけでインフラの構成変更を実行
DevOps
2022-11-09 03:24
モバイルSuica、リニューアル後に不具合 定期券登録などでエラー、原因はアクセス集中
企業・業界動向
2021-03-23 21:41