グーグル、次世代AIモデル「Gemini 1.5」を発表–コンテキストウィンドウが大幅に拡大
今回は「グーグル、次世代AIモデル「Gemini 1.5」を発表–コンテキストウィンドウが大幅に拡大」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
Googleは先週、大きなニュースを発表した。具体的には、対話型生成AI「Bard」を「Gemini」に改称したほか、より高度な「Gemini Advanced」を発表し、新しい有料の「Google One AI Premium Plan」として提供開始した。そして、同社は今回、さらなるAI関連の重要なニュースを発表した。
Googleは米国時間2月15日、次世代AIモデル「Gemini 1.5」を発表した。「Gemini 1.0」が2023年12月に発表されたばかりだが、Gemini 1.5には、コンテキストウィンドウの拡大、理解力の向上、全体的なパフォーマンスの向上など、複数の大規模なアップグレードが加えられている。
Googleの最高経営責任者(CEO)であるSundar Pichai氏によると、このモデルは非常に先進的で、同社が初期テスト用にリリースする最初のGemini 1.5モデルである「Gemini 1.5 Pro」は、先週発表された同社の最も先進的な大規模言語モデル(LLM)「Gemini 1.0 Ultra」に匹敵する品質を、より少ない計算量で実現できるという。
「コンテキストウィンドウの拡大により、実行できることの可能性が広がった」とPichai氏。「全く新しい機能が実現可能になるだけでなく、開発者がより有用なモデルやアプリケーションを構築するのにも役立つ」
プレスリリースによると、そうした高度なパフォーマンスを達成するために、Gemini 1.5は新しいバージョンのMixture-of-Experts(MoE)アーキテクチャーに基づいて構築されているという。また、そのおかげで、Gemini 1.5がニューラルネットワーク内の最も関連性の高い経路を学習して選択的に有効化することが可能になり、効率が向上するという。
Googleによると、Gemini 1.5 Proは本番環境で最大100万トークンを処理できるという。Gemini 1.0は3万2000トークンが上限だったので、大幅な増加だ。モデルのコンテキストウィンドウ(入力できる情報量)はトークンで構成されているため、トークン数の増加は注目に値する。モデルに入力できるトークン数が多ければ多いほど、より適切で、より多くの情報に基づいた応答が返ってくる可能性が高くなる。
GoogleはGemini 1.5 Proについて、「1時間の動画、11時間の音声、3万行以上のコードまたは70万字以上のコードベース」など、膨大な量の情報を一度に処理できるとしている。
Googleは「AI Studio」と「Vertex AI」を通じて、最大100万トークンのコンテキストウィンドウを有するGemini 1.5 Proを、開発者と法人顧客向けに限定プレビューとして公開した。今後、標準で12万8000トークン、最大100万トークンの価格体系で広く提供する予定だ。