「ChatGPT」の「高度な音声モード」、ウェブ版でも利用可能に

今回は「「ChatGPT」の「高度な音声モード」、ウェブ版でも利用可能に」についてご紹介します。

関連ワード（ソフトウェア等）についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。

　日々のワークフローに「ChatGPT」を活用している人は、デスクトップにChatGPTのタブを常に開いておくのが当たり前になっているかもしれない。今回、デスクトップからOpenAIの高度な音声モード「Advanced Voice Mode」をウェブ版ChatGPTで利用できるようになった。これは使うべきだ。

　OpenAIは米国時間11月19日、Advanced Voice Modeのウェブへの導入を順次開始して、デスクトップアプリとモバイルアプリ以外でも音声アシスタント機能を使えるようにすることを、「X」（旧Twitter）への投稿で発表した。アプリのダウンロードという利用のハードルが取り除かれ、Advanced Voice Modeがこれまで以上に利用しやすくなる。

　Advanced Voice Modeとは、OpenAIのAIを駆使した音声アシスタント機能のことだ。さらに自然で有益な会話を目指しており、アシスタントが話している途中でも口を挟むことができるほか、マルチターンの会話をしたり、ユーザーの気分に合わせて反応したりできる。音声アシスタントにありがちな、言われたことを理解するのにもたついてしまうという問題に対処している。

　できすぎた話に聞こえるかもしれないが、筆者が試した範囲では、Advanced Voice Modeは長い会話に堪能で、筆者の思考が一直線に進まなくても、言わんとしているところをうまく理解してくれる。日々の出来事に関するおしゃべり、雑学クイズ、自分語りなどに気軽に使える。もちろん、通常の音声アシスタントのように、実用的な使い方も可能だ。

　残念ながら、利用できる環境は拡大したものの、使うには従来通り月額20ドル（約3100円）の「ChatGPT Plus」に登録する必要がある。ChatGPTをよく使うのであれば、ChatGPT Plusにアップグレードする価値はあるだろう。「o1-preview」をはじめとするOpenAIの最新モデルをすべて利用できる、「GPT-4o」で送信できるメッセージの量が5倍になる、画像を生成できるといった特典があるからだ。

　Advanced Voice Modeのマルチモーダル機能はまだ利用できず、画面に表示された内容に対応したり、スマートフォンのカメラからコンテキストを判断して返答したりといったことはできない。マルチモーダル機能について、OpenAIは公開日をまだ明らかにしていない。

元記事： https://japan.zdnet.com/article/35226380/

IT関連 #ソフトウェア