グーグルの医療AI「Med-PaLM」開発に見るプロンプトエンジニアリングの重要性

今回は「グーグルの医療AI「Med-PaLM」開発に見るプロンプトエンジニアリングの重要性」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 医療分野における人工知能(AI)の応用事例では、多くの場合、言語をうまく使えていないようだ。米国時間7月17日、GoogleのAI部門であるDeepMindの論文が、極めて権威のある学術誌であるNatureに掲載された。

 同社は、さまざまな医療関係のデータセットに含まれている質問に回答できるようにチューニングされた、「ChatGPT」で使われているのと同じような大規模言語モデル(LLM)である「Med-PaLM」を開発した。使われたデータセットの中には、Googleが新たに考案した、一般の消費者がインターネットでよく尋ねている質問を反映したデータセットも含まれている。この「HealthSearchQA」と呼ばれるデータセットは、検索エンジンによって生成された「消費者からよく検索されている3173件の質問」(例えば「心房細動はどのくらい深刻な問題か」といった質問)から構成されている。

 同論文の著者らは、最近AI研究において重要性を増している研究分野である「プロンプトエンジニアリング」に注目した。プロンプトエンジニアリングは、望ましい出力の例を厳選してAIに示すことによって、AIの回答を改善する技法だ。

 ちなみに、AIの分野ではモデルの詳細な情報を開示することが一般的な慣行になっているが、最近ではGoogleやOpenAIが技術情報を隠すようになっており、Med-PaLMもその例に倣っている。

 人間の臨床医から構成された評価者グループによって評価したところ、HealthSearchQAに含まれている質問に対するMed-PaLMの回答は非常に優れたものだった。回答が医学界のコンセンサスに沿ったものであるかどうかを基準として評価した結果、Med-PaLMは92.6%のスコアを獲得し、GoogleのLLM「PaLM」の派生モデルが上げた61.9%を大幅に上回っただけでなく、人間の臨床医の平均スコアである92.9%に迫る結果を残した。

 ただし、医学に関する専門知識を持っていない一般人のグループが、「(一般消費者が)その回答から結論を導き出せるか」という観点から回答を評価したところ、有用だったと評価されたMed-PaLMの回答は80.3%だった。これに対して、人間の医師の回答は、91.1%の割合で有用だと評価された。論文では、この結果は「(Med-PaLMの回答を)人間の臨床医が提供したアウトプットの品質に近づけるためには、まだかなりの努力が必要」であることを示していると述べている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
GMがシボレー・ボルトEVに3度目のリコール、欠陥バッテリーから火災のおそれ
IT関連
2021-08-22 22:44
量子コンピューティング時代に向け、今始めるべきこと
IT関連
2022-02-05 21:56
ソフトバンク、メイン・サブブランド間の乗り換え手続きを簡素化 SIMロック解除も自動で
企業・業界動向
2021-08-11 20:51
アップルを介さずにモバイルゲームを配布しようとするArtieが10.6億円調達
ゲーム / eSports
2021-02-19 09:59
ツイッター、クリエイターが収益を管理・分析するための新ツールをリリース
IT関連
2022-03-10 18:46
重要インフラへの攻撃は依然として重大な脅威–著名ジャーナリストが警告
IT関連
2022-08-16 01:38
つくば市、新型コロナワクチンの配送システム推進–106の医療機関全てに導入
IT関連
2022-10-29 16:25
BroadcomによるVMware買収が明日完了することが確実に。企業としてのVMwareはなくなり、Broadcom傘下のブランドに
Broadcom
2023-11-22 17:12
モバイルアプリ用テスト自動化ツール「Appium 2.0」まもなく登場。ドライバーの分離、プラグインによる拡張対応など、新機能を開発者Jonathan Lipps氏が解説
JavaScript
2021-05-11 03:17
エクサウィザーズ、認識AIモデルの作成支援サービスを提供–検出精度を向上
IT関連
2022-09-07 22:13
女性のコーディング学習–男性中心の業界でスキルを磨くためのヒント
IT関連
2022-06-08 03:30
Intel × HPの最新の成果 新世代ビジネスモバイルPCの実力を探る
PR
2021-04-24 08:07
フェイスブックとInstagramで「いいね!」の数を非表示可能に、徐々に展開中
ネットサービス
2021-06-06 18:13
保育施設で紙おむつが使い放題になるサブスク「手ぶら登園」を手がけるBABY JOBが約5億円の資金調達
ヘルステック
2021-07-31 20:35