グーグル、「Gemini」の大規模言語モデル(LLM)をアップデート
今回は「グーグル、「Gemini」の大規模言語モデル(LLM)をアップデート」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
Googleは米国時間7月25日、チャットボット「Gemini」に使用される大規模言語モデル(LLM)が「Gemini 1.5 Flash」にアップグレードされたと発表した。Googleの公式ブログ記事によると、Gemini 1.5 Flashはユーザーへの応答の高速化と高品質化が進み、特に推論と画像の理解に関わる能力が向上したという。
また、無料版Geminiのコンテキストウィンドウが、これまでの4倍の3万2000トークンに拡大した。これが重要なアップデートと言えるのは、コンテキストウィンドウが大きくなることで、チャットボットが一度に覚えていられる情報量が増え、より情報を把握した上での回答につながるからだ。
また、コンテキストウィンドウが拡大すると、テキストの文字や、書類や写真のようなマルチモーダル入力など、会話内で処理するためにチャットボットが受け取る情報を増やすことができる。実際、Googleは「Google Drive」のアカウントやデバイスからファイルをアップロードする機能を「まもなく」追加する計画を明らかにしていて、これが実現すれば拡大したコンテキストウィンドウを最大限に活用できるようになるはずだ。
書類のアップロード機能は、AIチャットボットが提供できる機能の中でも最大級に有用なものの1つと言って差し支えないだろう。なぜなら、ユーザーが日々取り扱っている書類に関する質問に答えたり、要約を作成したりするのに役立つからだ。OpenAIの「ChatGPT」、そしてAnthropicの「Claude」も、すでにこの機能を無料で提供している。Geminiはさらに、ChatGPTに追いつくためのもう1つの試みとして、データファイルを分析してそれに関するインサイトを提供する機能や、表とグラフで視覚化する機能も「まもなく」提供する予定だ。
Gemini 1.5 Flashへのアップグレードだけでなく、GoogleはGeminiのさらなる性能向上につながる、他のアップデートも追加している。ユーザーがGeminiの返答をファクトチェックする際に役立つよう、関連するコンテンツの横にGoogleへのリンクを表示する機能もその1つだ。このGoogleリンクの表示は、筆者がGeminiに関して、特に大きな問題と感じていた点に対処するものだ。今回のアップデートまでは、応答をダブルチェックするには、リンクを入手するのに再度待つ必要があり、チャットボットが提供すべきシームレスで迅速な体験が阻害されていた。
Googleはまた、今後1週間のうちに、Geminiへのアクセス可能な年齢を、全世界でGoogleアカウントを自身で管理できる最低年齢条件を満たした10代の若者(欧州の一部地域を除き原則として13歳以上)まで拡大することを計画している。ただし、若年層の生成AIテクノロジー利用への懸念に対処するため、Googleは10代の若者に特化したオンボーディングプロセスをはじめとする安全対策を追加している。