グーグル、最も賢いAIモデル「Gemini 2.5 Pro」の実験版を発表
今回は「グーグル、最も賢いAIモデル「Gemini 2.5 Pro」の実験版を発表」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
DeepSeekが最新モデルをリリースした直後に、別の人工知能(AI)大手企業が早くも注目を取り戻した。
Googleは米国時間3月25日、「最も賢いモデル」とされる「Gemini 2.5」を発表した。Googleによれば、今回の初期リリースは「『Gemini 2.5 Pro』の実験的バージョンだが、さまざまなベンチマークで最先端を走っており、(評価プラットフォームの)『LMArena』で初登場ながら大差をつけて1位を獲得した」という。
応答を通じて推論する思考モデルのファミリーとして、Gemini 2.5は2024年12月にリリースされたGoogleの「Gemini 2.0 Flash Thinking」に続くものとなる。
とりわけ注目されるのは、Gemini 2.5 Proの実験的バージョンが、「Humanity’s Last Exam」(HLE)で、OpenAIの「OpenAI o3-mini」やAnthropicの「Claude 3.7 Sonnet」を上回っている点だ。HLEは、急速に進化するモデルにとって業界テストの問題が簡単になりすぎている「ベンチマークの飽和」に対処するために最近策定されたベンチマークテストだ。そのため、優れた成績を収めるのが比較的難しいテストだが、Gemini 2.5のスコアは18.8%と、o3-miniの14%(評価対象はテキストのみで画像は含まず)やClaude 3.7 Sonnetの8.9%を上回っていた。
「Chatbot Arena」のリーダーボードですでに首位を獲得しているGemini 2.5は、科学、数学、コーディングの一般的なベンチマークでも競合モデルを上回っている。もっとも、その差は概して小さいが、新しいモデルの進化のスピードを考えれば、予想の範囲内と言えるだろう。Googleの報告によれば、Gemini 2.5 Proの実験的バージョンは、「1行のプロンプト」しかない場合でも、推論機能、マルチモーダル機能、およびエージェント機能に改善が見られるという。
Googleによると、Gemini 2.5 Proは現時点で100万トークンのコンテキストウィンドウを備えており、25日から「Google AI Studio」と「Gemini」アプリで「Gemini Advanced」のユーザーに提供されるほか、「『Vertex AI』でも間もなく提供を開始する」という。また、今後数週間以内に価格情報を公開する予定だと、Googleは付け加えた。