オペラ、AIエージェント「Browser Operator」発表–ブラウザー内でタスクを実行可能
今回は「オペラ、AIエージェント「Browser Operator」発表–ブラウザー内でタスクを実行可能」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
ウェブブラウザー「Opera」の開発チームは、ブラウザー上でユーザーのタスクを実行する新しいAIエージェント「Browser Operator」を発表した。これは、ウェブブラウザーの次なる進化を示すパラダイムシフトとなる可能性がある。
OperaのエグゼクティブバイスプレジデントであるKrystian Kolondra氏は、「30年以上にわたり、ブラウザーはウェブへのアクセスを提供してきたが、ユーザーのために何かを成し遂げることはできなかった。しかし、今やそれが可能になった。これは、われわれがこれまで見てきた、あるいは出荷してきたものとは全く異なる」と述べている。さらに同氏は、「本日発表するBrowser Operatorは、ブラウザーの役割をディスプレーエンジンから、エージェントとしてユーザーのためにタスクを実行するアプリケーションへと移行させる第一歩となる」と続ける。
AIエージェントを通じて、Browser Operatorはユーザーに大幅な効率向上をもたらすように設計されている。これは、ユーザーが自然言語で実行する必要があることを説明すると、ブラウザーが必要なタスクを実行することで実現される。例えば、Browser OperatorにNikeのピンク色のランニングシューズをサイズ8.5で購入するように依頼する。すると、Browser Operatorはそのタスクを実行する。その間、ユーザーはプロセスの任意の時点で何が起こっているかを確認できるため、常に制御下に置くことができる。
Operaは、ブラウザーをよりユーザー中心のエコシステムに変えようとしている。Browser Operatorは、DOMツリーとブラウザーのレイアウトデータを使用してコンテキストを取得する。Operaによると、ブラウザーがピクセルから画面上のものを「見て」理解したり、マウスカーソルでナビゲートしたりする必要がないという。Browser Operatorは、スクロールする必要なく、ページ全体に一度にアクセスできるため、余分な処理と必要な時間を削減する。そして、全てがブラウザー内でネイティブに実行されるため、Browser Operatorは仮想マシンやクラウドサーバーを必要としない。
Browser Operatorは現在、機能プレビューの段階にあり、「Opera Feature Drop」プログラムの一部として間もなく利用可能になるだろう。筆者は最新バージョンの「Opera Developer」を確認したが、まだ実装されていなかった。Browser Operatorの動作は、Operaの公式YouTubeチャンネルで視聴できる。