「Opera」、グーグルのAIモデル「Gemini」を統合

今回は「「Opera」、グーグルのAIモデル「Gemini」を統合」についてご紹介します。

関連ワード（ソフトウェア等）についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。

　筆者のお気に入りのブラウザー「Opera」に「Aria」というAI機能が搭載されてしばらく経つ。（調査や検索のため）まれにAIの力を借りる必要が生じると、いつもAriaに頼る。そのような目的には、OperaのAriaが素晴らしかった。

　そこに先日、Operaの開発元であるOpera SoftwareがGoogleのAIモデル「Gemini」を追加してAriaを強化すると発表した。これはAriaが現在採用している大規模言語モデル（LLM）を置き換えようというものではない。実のところ、Ariaは複数のAIモデルを使ってクエリに対応する（与えられたクエリにいちばん適すると思われるモデルを選ぶ）。そのAriaが今回、「Gemini Nano」や「Gemini Ultra」など複数のモデルで構成されるGoogleのGeminiも利用できるようになったというわけだ。

　Geminiの統合のポイントは、クエリへの回答がスピードアップして正確になることだけではない。読み上げなどの新機能がOperaのAIであるAriaに追加される。「Vertex AI」のモデル「Imagen 2」のおかげで、クエリに応えて画像を描くこともできるようになった。

　また、Operaは「AI Feature Drops」というプログラムを発表した。Operaのエグゼクティブバイスプレジデントを務めるKrystian Kolondra氏は次のように述べている。「AIに関する動きは速く、われわれも速く動く。『Opera One』の正式版に採用されるものもそうでないものも含めて、AIに関するわれわれの最新の研究を試してもらえるAI Feature Dropsプログラムをスタートさせた。熱心なユーザーにテストしてもらい、フィードバックや提案を寄せてもらうことを楽しみにしている」

　1つ注意しておかなければいけないのは、読み上げ機能も画像生成機能も、Operaの開発者向けのデスクトップ版では4月末から利用できるようになっている点だ。違いは、どちらの機能もGeminiの追加により信頼性が高まり大幅に高速化したところだ。加えて、GoogleのAIモデルを採用する前、Ariaのテキスト読み上げ機能は会話といえるほどのものではなかった。

　筆者はまずテキスト読み上げ機能を試した。使うには、Ariaでクエリを実行する。回答が返ってきたら、回答の右上あたりにカーソルをあわせると、メニューが現れ、その中に小さいスピーカーのアイコンがある。そのアイコンをクリックすると、AI音声による回答の読み上げが始まる。驚いたことにかなり本物に近い声だった。あまり一般的ではない名前など、AIだと分かる部分も時折あったが、声のピッチ、響き、調子は自然だった（Googleのアシスタントの声よりもはるかによかった）。

　（Geminiを採用してから）Ariaの画像生成機能で変わった点はスピードと信頼性だけだ。Gemini以前に画像機能を試した時は、クエリに対応できずエラーを返してくることがあった。今同じことをやらせてみるとうまくいくかもしれない。Vertex AIのImagen 2のおかげで、画像生成は失敗しなくなっている。

元記事： https://japan.zdnet.com/article/35219465/

IT関連 #ソフトウェア