グーグルの医療AI「Med-PaLM」開発に見るプロンプトエンジニアリングの重要性

今回は「グーグルの医療AI「Med-PaLM」開発に見るプロンプトエンジニアリングの重要性」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 医療分野における人工知能(AI)の応用事例では、多くの場合、言語をうまく使えていないようだ。米国時間7月17日、GoogleのAI部門であるDeepMindの論文が、極めて権威のある学術誌であるNatureに掲載された。

 同社は、さまざまな医療関係のデータセットに含まれている質問に回答できるようにチューニングされた、「ChatGPT」で使われているのと同じような大規模言語モデル(LLM)である「Med-PaLM」を開発した。使われたデータセットの中には、Googleが新たに考案した、一般の消費者がインターネットでよく尋ねている質問を反映したデータセットも含まれている。この「HealthSearchQA」と呼ばれるデータセットは、検索エンジンによって生成された「消費者からよく検索されている3173件の質問」(例えば「心房細動はどのくらい深刻な問題か」といった質問)から構成されている。

 同論文の著者らは、最近AI研究において重要性を増している研究分野である「プロンプトエンジニアリング」に注目した。プロンプトエンジニアリングは、望ましい出力の例を厳選してAIに示すことによって、AIの回答を改善する技法だ。

 ちなみに、AIの分野ではモデルの詳細な情報を開示することが一般的な慣行になっているが、最近ではGoogleやOpenAIが技術情報を隠すようになっており、Med-PaLMもその例に倣っている。

 人間の臨床医から構成された評価者グループによって評価したところ、HealthSearchQAに含まれている質問に対するMed-PaLMの回答は非常に優れたものだった。回答が医学界のコンセンサスに沿ったものであるかどうかを基準として評価した結果、Med-PaLMは92.6%のスコアを獲得し、GoogleのLLM「PaLM」の派生モデルが上げた61.9%を大幅に上回っただけでなく、人間の臨床医の平均スコアである92.9%に迫る結果を残した。

 ただし、医学に関する専門知識を持っていない一般人のグループが、「(一般消費者が)その回答から結論を導き出せるか」という観点から回答を評価したところ、有用だったと評価されたMed-PaLMの回答は80.3%だった。これに対して、人間の医師の回答は、91.1%の割合で有用だと評価された。論文では、この結果は「(Med-PaLMの回答を)人間の臨床医が提供したアウトプットの品質に近づけるためには、まだかなりの努力が必要」であることを示していると述べている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
Meta、AI翻訳モデル「SeamlessM4T」を発表–約100言語の音声とテキストに対応
IT関連
2023-08-24 06:50
パーソルP&T、「人事DX推進サービス」提供–システム導入やデータ基盤を支援
IT関連
2022-08-06 12:11
NRI、物流デジタルツインツール活用の物流DXコンサルサービスを提供
IT関連
2024-03-01 10:30
「Exchange Server」のゼロデイ脆弱性を突く攻撃、マイクロソフトが警告
IT関連
2022-10-05 17:29
NTT Com、製造設備のアナログメーター目視点検を自動化する新サービス
IT関連
2022-10-29 19:22
ChatGPTがGoogleドライブを始めとする社内データソースを読み取って回答可能に、企業向けのChatGPT Teamsでベータ提供を開始
クラウド
2025-04-02 20:35
「ゆるキャン△」林野庁とコラボ 国有林の魅力伝えるガイドブックに
くらテク
2021-07-17 07:17
日立製作所、ニューノーマル時代の働き方の実験場に–日立ビルシステムの本社オフィスを刷新
IT関連
2021-07-31 04:59
Orbがデジタル通貨決済システムの基盤にNewSQLのTiDBを採用。ETLをなくし、トランザクション処理とデータ分析を統合可能に[PR]
MySQL
2024-11-05 06:30
DNP、OpenXと協業–環境負荷の低いデジタル広告設計を提案
IT関連
2023-06-03 04:47
マイナンバーカード活用のデジタルIDソリューション「xID」がセブン銀行アクセラレータープログラムで採択
フィンテック
2021-04-13 16:32
スペクティ、「函館災害情報」と連携–函館市内および北海道での災害情報の配信を強化
IT関連
2022-11-22 10:32
需要高まる自律型移動ロボット(AMR)、新たな相互運用標準で現場の運用を効率化へ
IT関連
2021-07-24 17:51
Google Cloud、動的にブロックストレージのIOPSとスループット性能をそれぞれ設定できる「Hyperdisk」など発表
Google
2022-09-13 06:44