「マインクラフト」を自動でプレイする、GPT-4搭載の生涯学習エージェント「Voyager」
今回は「「マインクラフト」を自動でプレイする、GPT-4搭載の生涯学習エージェント「Voyager」」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
人工知能(AI)は、チェスで対戦相手を追い詰めるのと同じように、「マインクラフト」でダイヤモンドの道具をあつらえることも(これはマインクラフトで非常に困難な作業の1つだ)当たり前にこなせるようになってきた。
また、この新しく発表された、マインクラフトをプレイするAIは「記憶を持つ」能力も身に付けている。
人間の介入なしでマインクラフトをプレイできるAIはすでにいくつも開発されており、さまざまなアプローチに莫大な投資が行われている。例えば、「ChatGPT」を開発した企業であるOpenAIは、多額の資金を投じて人間を雇ってマインクラフトをプレイさせ、その様子を動画に記録し、人間の動きを真似てゲームをプレイできるAI開発に役立てている。
また北京大学のZihao Wang氏が率いるチームは2月に、同氏らが「70種類以上のマインクラフトのタスクを確実に達成できる、初めてのマルチタスクエージェント」と説明するAIを発表している。
しかし、技術の進歩は早い。NVIDIAのチームは5月、マインクラフトでさまざまなテクニックを試して、その成果をライブラリーに保存していくことによってアプローチを洗練させていく「生涯学習エージェント」を生み出したと発表した。
ほかの自動システムと比較したところ、この技術は、一貫してマインクラフトで目標を早く達成することができたという。
この「Voyager」と呼ばれるAIシステムは、NVIDIAにインターンとして参加し、カリフォルニア工科大学に所属するGuanzhi Wang氏が、テキサス大学オースティン校、スタンフォード大学、アリゾナ州立大学の仲間と一緒に執筆し、プレプリントサーバーである「arXiv」に投稿した論文で発表されたものだ。同研究チームのアドバイザーは、NVIDIAの機械学習研究ディレクターであるAnima Anandkumar氏が務めている。(NVIDIAは、この論文と関連資料を本研究に関する専用サイトにも掲載している)
Voyagerには、ChatGPTを開発したOpenAIの最新の大規模言語モデル(LLM)である「GPT-4」が使用されている。GPT-4は3月に公開されたモデルだが、OpenAIはこのモデルの技術的な詳細について説明することを拒んでいる。同社によれば、GPT-4は以前のバージョンよりも優れており、ChatGPTが使用されている多くのタスク(自然言語の質問に答える、コードを書くなど)に関して、ほかの多くのLLMよりも優れているという。
Voyagerは、GPT-4を3つの用途で利用している。そのひとつは、「マインクラフト」内の現在の持ち物リストをもとに、次の課題を考えることだ。Voyagerは、GPT-4の自然言語での入力が可能なプロンプトに、構文解析しやすいフォーマットで現在の持ち物の状況を説明するようになっている。例えば次のような形だ。
GPT-4はそれに対して、次の適切な課題の説明(例えば石のツルハシを作るなど)を出力し、なぜそれが適切な課題なのかを説明する。例えば次のような説明が出力される。