グーグルの医療AI「Med-PaLM」開発に見るプロンプトエンジニアリングの重要性

今回は「グーグルの医療AI「Med-PaLM」開発に見るプロンプトエンジニアリングの重要性」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 医療分野における人工知能(AI)の応用事例では、多くの場合、言語をうまく使えていないようだ。米国時間7月17日、GoogleのAI部門であるDeepMindの論文が、極めて権威のある学術誌であるNatureに掲載された。

 同社は、さまざまな医療関係のデータセットに含まれている質問に回答できるようにチューニングされた、「ChatGPT」で使われているのと同じような大規模言語モデル(LLM)である「Med-PaLM」を開発した。使われたデータセットの中には、Googleが新たに考案した、一般の消費者がインターネットでよく尋ねている質問を反映したデータセットも含まれている。この「HealthSearchQA」と呼ばれるデータセットは、検索エンジンによって生成された「消費者からよく検索されている3173件の質問」(例えば「心房細動はどのくらい深刻な問題か」といった質問)から構成されている。

 同論文の著者らは、最近AI研究において重要性を増している研究分野である「プロンプトエンジニアリング」に注目した。プロンプトエンジニアリングは、望ましい出力の例を厳選してAIに示すことによって、AIの回答を改善する技法だ。

 ちなみに、AIの分野ではモデルの詳細な情報を開示することが一般的な慣行になっているが、最近ではGoogleやOpenAIが技術情報を隠すようになっており、Med-PaLMもその例に倣っている。

 人間の臨床医から構成された評価者グループによって評価したところ、HealthSearchQAに含まれている質問に対するMed-PaLMの回答は非常に優れたものだった。回答が医学界のコンセンサスに沿ったものであるかどうかを基準として評価した結果、Med-PaLMは92.6%のスコアを獲得し、GoogleのLLM「PaLM」の派生モデルが上げた61.9%を大幅に上回っただけでなく、人間の臨床医の平均スコアである92.9%に迫る結果を残した。

 ただし、医学に関する専門知識を持っていない一般人のグループが、「(一般消費者が)その回答から結論を導き出せるか」という観点から回答を評価したところ、有用だったと評価されたMed-PaLMの回答は80.3%だった。これに対して、人間の医師の回答は、91.1%の割合で有用だと評価された。論文では、この結果は「(Med-PaLMの回答を)人間の臨床医が提供したアウトプットの品質に近づけるためには、まだかなりの努力が必要」であることを示していると述べている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
北朝鮮ハッカー、偽企業を立ち上げセキュリティ研究者を攻撃–グーグルが指摘
IT関連
2021-04-02 05:42
防災ソリューションにおける具体的なセキュリティ対策
IT関連
2021-02-03 20:33
T-Mobileがハッキング被害、3700万人の顧客情報が流出
IT関連
2023-01-24 12:24
USJ、初の「鬼滅の刃」アトラクション “水の呼吸”全身で体感
くらテク
2021-06-29 16:43
Apple Watchで心疾患発見を目指す、慶應医学部 木村雄弘先生に訊く(WWDC 2021)
ヘルステック
2021-06-05 07:04
“締め切りに追われる人”向けテレワーク個室が登場 14時間4620円
企業・業界動向
2021-08-11 09:35
NEC、新周波数チャネルとVLAN対応のプライベートLTEシステムを発売
IT関連
2021-05-07 05:09
「Bard」対「ChatGPT」–Bardはコーディングに役立つか?
IT関連
2023-04-05 18:04
企業が主導で対話型AIの業務利用を積極的に推進せよ
IT関連
2023-03-17 05:10
2023年のテクノロジー業界–アナリストの予測と調査結果が示すトレンド
IT関連
2022-11-22 12:53
北朝鮮を後ろ盾とするハッカーがブロックチェーン企業など狙う–FBIらが注意喚起
IT関連
2022-04-23 22:24
「Brave」、IPFSプロトコルをサポートする初の主要ブラウザーに
IT関連
2021-01-20 04:38
マイクロソフト、自律型航空機のシミュレーションを「Project AirSim」で提供へ
IT関連
2022-07-21 11:24
キリンビールとブレインパッド、「デジタルの力」と「人間の力」でSCM業務のDXを推進
IT関連
2022-10-04 14:46