生成型AIの意図的なウソを見抜く方法とは?オックスフォード大らの共同研究

今回は「生成型AIの意図的なウソを見抜く方法とは?オックスフォード大らの共同研究」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成型の人工知能(AI)が抱える大きな課題の1つとして、こうしたAIがOpenAIなどの企業によってクローズド環境で開発されている場合、その機能を直接検証できず、ブラックボックスのようになってしまうということが挙げられる。

 「GPT-4」といったチャットプログラムの動作を詳細を調べられない場合、真っ赤なウソを吐き出していないという確証を得るにはどうすればよいだろうか。

 オックスフォード大学とイェール大学の研究者らはこうした脅威に立ち向かうために、大規模言語モデル(LLM)の出力に含まれている虚偽を洗い出せる、ウソ発見器とでも呼べるものを作り上げたという。このウソ発見器は、チャットプログラムの内部にアクセスしなくても、各対話に引き続いてイエス/ノーで答えられる一連の無関係な質問を投げかけるだけで目的を達成できるとされている。

 この研究者らの論文によると、作成したウソ発見器は当初の対象ではないLLMにも適用でき、初めて出会うプロンプトや、数学の質問のような今までに遭遇したことのないトピックのデータベースにも対応できるという。

 このウソ発見器について説明する論文、「How to catch an AI liar: lie detection in black box LLMs by asking unrelated questions」(ウソつきAIを捕まえるには:ブラックボックス化されているLLMに無関係の質問を投げかけることでウソを見抜く方法)には、プレプリントの論文を発表するサーバー「arXiv」からアクセスできる。その論文の中で、主執筆者であるオックスフォード大学のLorenzo Pacchiardi氏と、ケンブリッジ大学やイェール大学の協力者は「このウソ発見器は、シンプルであるにもかかわらず、極めて精度に優れており、汎用性も驚くほど高い」と記している。

 AI用のウソ発見器とはどのようなものだろうか。Pacchiardi氏率いる研究者らは、チャットプログラムが「知っている」と考えられる事実があるにもかかわらず、それとは異なった出力を生成するケースに焦点を当てている。ここでのチャットプログラムが「知っている」という言葉の意味は、当然ながら明確に定義されているわけではなく、単なる概念にすぎない。

 同論文は「われわれの定義において、誤った回答をウソと呼んでよいのは、話者が正しい回答を知っている場合のみだ」と記している。そういう意味で、Pacchiardi氏率いる研究者らは、オックスフォード大学が設立した人類の未来研究所(FHI:Future of Humanity Institute)のOwain Evans氏をはじめとする研究者らによる2021年の論文に記されている定義、すなわちAIのウソを「積極的に選択された誤り」とする考え方を踏襲している。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
反トラスト法に阻まれてVisaがPlaid買収中止、フィンテック関係者に落胆の声が広がる
フィンテック
2021-01-15 17:37
「LegalForceキャビネ」、電子帳簿保存法の要件に対応する機能を追加
IT関連
2023-08-09 18:00
マイクロソフト、フルマネージドな負荷テストサービス「Azure Load Testing」正式サービスとして提供開始
Microsoft Azure
2023-02-15 07:59
AIの中心に人間を据える新しいアプローチのVianai SystemsをSoftBank Vision Fund 2が支援
人工知能・AI
2021-06-21 23:15
小田急電鉄、データ分析基盤の構築パートナーにジールを選定
IT関連
2022-12-21 06:59
いすみ鉄道、「LINE WORKS」で観光案内サービスを強化–ペーパーレス化も促進
IT関連
2021-07-29 02:39
日米の中堅中小企業でデジタル投資額に大きな差–ひとり情シス協会が「デジタルエンゲル係数」を算出
IT関連
2023-03-18 07:55
「おそ松さん」実写映画化、ジャニーズ「Snow Man」主演で ネット上では双方のファンが互いに気づかう状況に
くらテク
2021-08-04 16:47
ロボティクスキットとZoom授業による自宅学習で子どもたちにSTEMスキルを教えるThimble
EdTech
2021-01-16 11:41
大規模接種センターのワクチン接種予約スタート 専用サイトとLINEのみで受け付け
企業・業界動向
2021-05-18 09:26
SCSK、ブレインズテクノロジーと協業–製造現場向けソリューションの強化図る
IT関連
2024-10-02 13:00
LIXIL、Google Cloud上に内製主体でSAP連携のデータ基盤を構築
IT関連
2021-05-14 00:21
アフラックが入社プロセスを刷新–内定者一人当たりの受け入れ業務が約半分に
IT関連
2022-07-28 22:15
BPM実践ガイド:段階的モデリングで推進する業務改革
IT関連
2024-09-14 16:33