生成型AIの意図的なウソを見抜く方法とは?オックスフォード大らの共同研究

今回は「生成型AIの意図的なウソを見抜く方法とは?オックスフォード大らの共同研究」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成型の人工知能(AI)が抱える大きな課題の1つとして、こうしたAIがOpenAIなどの企業によってクローズド環境で開発されている場合、その機能を直接検証できず、ブラックボックスのようになってしまうということが挙げられる。

 「GPT-4」といったチャットプログラムの動作を詳細を調べられない場合、真っ赤なウソを吐き出していないという確証を得るにはどうすればよいだろうか。

 オックスフォード大学とイェール大学の研究者らはこうした脅威に立ち向かうために、大規模言語モデル(LLM)の出力に含まれている虚偽を洗い出せる、ウソ発見器とでも呼べるものを作り上げたという。このウソ発見器は、チャットプログラムの内部にアクセスしなくても、各対話に引き続いてイエス/ノーで答えられる一連の無関係な質問を投げかけるだけで目的を達成できるとされている。

 この研究者らの論文によると、作成したウソ発見器は当初の対象ではないLLMにも適用でき、初めて出会うプロンプトや、数学の質問のような今までに遭遇したことのないトピックのデータベースにも対応できるという。

 このウソ発見器について説明する論文、「How to catch an AI liar: lie detection in black box LLMs by asking unrelated questions」(ウソつきAIを捕まえるには:ブラックボックス化されているLLMに無関係の質問を投げかけることでウソを見抜く方法)には、プレプリントの論文を発表するサーバー「arXiv」からアクセスできる。その論文の中で、主執筆者であるオックスフォード大学のLorenzo Pacchiardi氏と、ケンブリッジ大学やイェール大学の協力者は「このウソ発見器は、シンプルであるにもかかわらず、極めて精度に優れており、汎用性も驚くほど高い」と記している。

 AI用のウソ発見器とはどのようなものだろうか。Pacchiardi氏率いる研究者らは、チャットプログラムが「知っている」と考えられる事実があるにもかかわらず、それとは異なった出力を生成するケースに焦点を当てている。ここでのチャットプログラムが「知っている」という言葉の意味は、当然ながら明確に定義されているわけではなく、単なる概念にすぎない。

 同論文は「われわれの定義において、誤った回答をウソと呼んでよいのは、話者が正しい回答を知っている場合のみだ」と記している。そういう意味で、Pacchiardi氏率いる研究者らは、オックスフォード大学が設立した人類の未来研究所(FHI:Future of Humanity Institute)のOwain Evans氏をはじめとする研究者らによる2021年の論文に記されている定義、すなわちAIのウソを「積極的に選択された誤り」とする考え方を踏襲している。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ウィズセキュアとMend.io、アプリケーションセキュリティプラットフォームの脆弱性に対処
IT関連
2023-09-09 21:34
「薄い本」効果で観客が10倍に 映画「シン・エヴァ」、興収90億円超え
くらテク
2021-06-16 10:32
PelotonのCEOが是正措置は認めるもバイクとトレッドミルの「全生産停止」を否定
IT関連
2022-01-24 08:48
「Kerberoasting攻撃」が583%増、RMMツールの不正利用が3倍増–クラウドストライク調査
IT関連
2023-09-15 15:59
HashiCorp、全製品のライセンスを商用利用に制限があるBSLライセンスに変更すると発表
HashiCorp
2023-08-16 20:10
栗田工業と日立、製鉄所など原料ヤード管理のDXで協業
IT関連
2022-09-30 15:53
AIをDevSecOpsプラットフォームに“編み込む”–GitLabのCSOが語るビジネス戦略
IT関連
2024-02-17 17:14
JF全漁連とNTT Com、ライブコマースで水産物の実証販売–低遅延の配信基盤活用
IT関連
2023-01-12 03:33
ヒカキンがVTuberデビュー チャンネル登録者数1000万人目指す
企業・業界動向
2021-08-04 15:36
クラウドコンピューティング、今後も成長の見通し–課題は人材不足やセキュリティ
IT関連
2022-11-11 22:43
みずほ銀のシステム障害が復旧 きょう午後にも会見へ
社会とIT
2021-08-21 12:54
SAP、世界最大のビジネスネットワーク「SAP Business Network」などを発表
IT関連
2021-06-04 06:53
国内5G市場、産業分野はローカル5Gの価格低価やメタバースなどへの活用拡大–IDC Japan
IT関連
2022-05-18 00:21
カーナビアプリ「ドコモ ドライブネット」終了へ
企業・業界動向
2021-05-14 18:40