「Opera」、グーグルのAIモデル「Gemini」を統合

今回は「「Opera」、グーグルのAIモデル「Gemini」を統合」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 筆者のお気に入りのブラウザー「Opera」に「Aria」というAI機能が搭載されてしばらく経つ。(調査や検索のため)まれにAIの力を借りる必要が生じると、いつもAriaに頼る。そのような目的には、OperaのAriaが素晴らしかった。

 そこに先日、Operaの開発元であるOpera SoftwareがGoogleのAIモデル「Gemini」を追加してAriaを強化すると発表した。これはAriaが現在採用している大規模言語モデル(LLM)を置き換えようというものではない。実のところ、Ariaは複数のAIモデルを使ってクエリに対応する(与えられたクエリにいちばん適すると思われるモデルを選ぶ)。そのAriaが今回、「Gemini Nano」や「Gemini Ultra」など複数のモデルで構成されるGoogleのGeminiも利用できるようになったというわけだ。

 Geminiの統合のポイントは、クエリへの回答がスピードアップして正確になることだけではない。読み上げなどの新機能がOperaのAIであるAriaに追加される。「Vertex AI」のモデル「Imagen 2」のおかげで、クエリに応えて画像を描くこともできるようになった。

 また、Operaは「AI Feature Drops」というプログラムを発表した。Operaのエグゼクティブバイスプレジデントを務めるKrystian Kolondra氏は次のように述べている。「AIに関する動きは速く、われわれも速く動く。『Opera One』の正式版に採用されるものもそうでないものも含めて、AIに関するわれわれの最新の研究を試してもらえるAI Feature Dropsプログラムをスタートさせた。熱心なユーザーにテストしてもらい、フィードバックや提案を寄せてもらうことを楽しみにしている」

 1つ注意しておかなければいけないのは、読み上げ機能も画像生成機能も、Operaの開発者向けのデスクトップ版では4月末から利用できるようになっている点だ。違いは、どちらの機能もGeminiの追加により信頼性が高まり大幅に高速化したところだ。加えて、GoogleのAIモデルを採用する前、Ariaのテキスト読み上げ機能は会話といえるほどのものではなかった。

 筆者はまずテキスト読み上げ機能を試した。使うには、Ariaでクエリを実行する。回答が返ってきたら、回答の右上あたりにカーソルをあわせると、メニューが現れ、その中に小さいスピーカーのアイコンがある。そのアイコンをクリックすると、AI音声による回答の読み上げが始まる。驚いたことにかなり本物に近い声だった。あまり一般的ではない名前など、AIだと分かる部分も時折あったが、声のピッチ、響き、調子は自然だった(Googleのアシスタントの声よりもはるかによかった)。

 (Geminiを採用してから)Ariaの画像生成機能で変わった点はスピードと信頼性だけだ。Gemini以前に画像機能を試した時は、クエリに対応できずエラーを返してくることがあった。今同じことをやらせてみるとうまくいくかもしれない。Vertex AIのImagen 2のおかげで、画像生成は失敗しなくなっている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
Snapが動画で使える音楽の拡充でユニバーサルミュージックと提携
ネットサービス
2021-06-26 18:28
3兆6420億円の新エネルギー政策を含む2020年末の米国景気刺激法案
パブリック / ダイバーシティ
2021-01-19 10:54
アマゾン4Q決算、クラウドは40%増収–北米では「プライム」料金を値上げへ
IT関連
2022-02-05 17:55
パスワードレスを実現するFIDO/WebAuthのさらなる普及へ、新提案を公開。デバイス間でのクレデンシャル同期、Bluetooth経由でのローミング認証器など
FIDO/WebAuthn
2022-04-05 06:25
ファブリック調の「ルンバ i3+」発売 自動ごみ収集機付きで10万円切る
くらテク
2021-02-18 06:51
第4回:ブロックチェーンを活用した電子署名サービス
IT関連
2022-11-30 07:52
工場のセキュリティ対策が急務に–経済産業省が最新ガイドラインを解説
IT関連
2022-04-05 20:32
ドローン「レベル4」解禁で「有人地帯での目視外飛行」へ–広がる産業活用の可能性
IT関連
2023-07-11 10:03
長距離量子暗号通信の事業化を目指すLQUOMが資金調達、量子中継機の事業化に向けたプロトタイプ開発
セキュリティ
2021-04-21 21:45
次なる成長の弾は何か?–デルの幹部は何と答えたか
IT関連
2023-03-18 21:31
ウクライナ、ベラルーシのハッカーが同国防衛軍をターゲットにしていると発表
IT関連
2022-02-27 02:18
BIPLOGY、データ分析と人材育成の支援サービスを提供
IT関連
2023-09-05 11:18
「強靭で活力のある社会」に向けDX/GX/CXの価値を提供–NTT Com・丸岡社長
IT関連
2023-01-06 19:20
“オタ活”のスケジュール作りを半自動化するアプリ「シカロ」登場 「呪術廻戦」「刀剣乱舞」など13作品に対応
くらテク
2021-08-18 13:10