グーグルの医療AI「Med-PaLM」開発に見るプロンプトエンジニアリングの重要性

今回は「グーグルの医療AI「Med-PaLM」開発に見るプロンプトエンジニアリングの重要性」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 医療分野における人工知能(AI)の応用事例では、多くの場合、言語をうまく使えていないようだ。米国時間7月17日、GoogleのAI部門であるDeepMindの論文が、極めて権威のある学術誌であるNatureに掲載された。

 同社は、さまざまな医療関係のデータセットに含まれている質問に回答できるようにチューニングされた、「ChatGPT」で使われているのと同じような大規模言語モデル(LLM)である「Med-PaLM」を開発した。使われたデータセットの中には、Googleが新たに考案した、一般の消費者がインターネットでよく尋ねている質問を反映したデータセットも含まれている。この「HealthSearchQA」と呼ばれるデータセットは、検索エンジンによって生成された「消費者からよく検索されている3173件の質問」(例えば「心房細動はどのくらい深刻な問題か」といった質問)から構成されている。

 同論文の著者らは、最近AI研究において重要性を増している研究分野である「プロンプトエンジニアリング」に注目した。プロンプトエンジニアリングは、望ましい出力の例を厳選してAIに示すことによって、AIの回答を改善する技法だ。

 ちなみに、AIの分野ではモデルの詳細な情報を開示することが一般的な慣行になっているが、最近ではGoogleやOpenAIが技術情報を隠すようになっており、Med-PaLMもその例に倣っている。

 人間の臨床医から構成された評価者グループによって評価したところ、HealthSearchQAに含まれている質問に対するMed-PaLMの回答は非常に優れたものだった。回答が医学界のコンセンサスに沿ったものであるかどうかを基準として評価した結果、Med-PaLMは92.6%のスコアを獲得し、GoogleのLLM「PaLM」の派生モデルが上げた61.9%を大幅に上回っただけでなく、人間の臨床医の平均スコアである92.9%に迫る結果を残した。

 ただし、医学に関する専門知識を持っていない一般人のグループが、「(一般消費者が)その回答から結論を導き出せるか」という観点から回答を評価したところ、有用だったと評価されたMed-PaLMの回答は80.3%だった。これに対して、人間の医師の回答は、91.1%の割合で有用だと評価された。論文では、この結果は「(Med-PaLMの回答を)人間の臨床医が提供したアウトプットの品質に近づけるためには、まだかなりの努力が必要」であることを示していると述べている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
静的サイトジェネレータ「Astro 2.1」リリース。画像の最適化、Markdocのサポート、ファイル変更検知し型チェックなど新機能
JavaScript
2023-03-16 17:14
プログラミングのためのBGMや環境音など。仕事や勉強の邪魔にならない無料で使えそうな音源集。2024年版
おもしろ
2024-06-17 21:56
生成AIツール「Adobe Firefly」、一般提供開始–商用利用が可能に
IT関連
2023-09-15 05:45
1回のスキャンで顔の「シワから毛穴まで」再現 リアルな皮膚の動きも自動生成 :Innovative Tech
イラスト・デザイン
2021-03-19 16:03
「NIPPON ITチャリティ駅伝実行委員会」、体験管理プラットフォームで感染対策を構築
IT関連
2022-11-10 02:36
「Linux」で過去に実行したコマンドを見つけるには–historyコマンドを使用した手順
IT関連
2023-04-07 21:15
ノーコードツールAppSheet、Google Workspace有償プランで追加料金なく利用可能に
Google
2023-07-20 20:42
米国家安全保障局、CやC++からメモリー安全性の高いJavaなどへの移行を推奨
IT関連
2022-11-15 22:01
Evernote創業者によるWeb会議ツール「mmhmm」、ソフトバンクGなどから1億ドルのBラウンド増資
企業・業界動向
2021-07-09 09:41
セガサミーHD、総合的SIEM基盤をSplunkで構築
IT関連
2024-10-11 12:17
秋葉原などのメイドカフェ、ビデオ通話でリモート接客 約60店舗でスタート
社会とIT
2021-01-26 18:06
【コラム】「良心に基づく」診療拒否を許すアーカンソー州法案は患者を危機にさらしヘルステックの基本的価値に反する
パブリック / ダイバーシティ
2021-04-23 22:51
「Nutanix Clusters on Azure」正式リリース。これでAWSとAzureとオンプレミスのマルチクラウド/ハイブリッドクラウド対応に
Microsoft Azure
2022-10-18 12:20
「Proton Pass」が新機能を追加–詳細な個人情報の保存と生体認証が可能に
IT関連
2024-08-10 11:02