OpenAI、待望の強化された「Voice Mode」のアルファ版を提供開始

今回は「OpenAI、待望の強化された「Voice Mode」のアルファ版を提供開始」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 OpenAIが「Spring Update」というイベントを5月に開催したとき、大きな注目を集めたものの1つが、「GPT-4o」の新しい動画機能と音声機能で大幅に強化された「ChatGPT」の「Voice Mode」のデモだった。そして、この待望の新しいVoice Modeが(不完全ではあるが)ようやく登場した。

 OpenAIは米国時間7月30日、強化されたVoice Modeを「ChatGPT Plus」の一部ユーザーにアルファ版として順次提供していくことを「X」(旧Twitter)への投稿で明らかにした。この高度な音声アシスタントにより、ユーザーはアシスタントの会話に割り込んだり、自分の感情に即した応答を得たりできるようになる。

 アルファ版へのアクセスが許可されたユーザーには、手順が記載されたメールが送られるほか、上の動画にあるように、モバイルアプリにメッセージが表示される。また、通知が一切届いていなくても心配はいらない。OpenAIによれば、同社は今後もユーザーを順次追加し、秋にはすべてのChatGPT Plusユーザーがアルファ版にアクセスできるようにする計画だという。

 下の動画にあるように、OpenAIはSpring Updateイベントで行った初めてのデモで、Voice Modeのマルチモーダル機能を披露した。このマルチモーダル機能には、ユーザーのスマートフォンの画面に表示されている内容に基づいてアドバイスをしたり、ユーザーがスマートフォンのカメラで撮影している内容に即した応答をしたりするといった機能もある。

 だが、Voice Modeのアルファ版にはこれらの機能がない。OpenAIによれば、「動画と画面の共有機能は後日リリースされる」という。また、初めてのデモ以降、音声会話の品質と安全性の向上を図ってきたと同社は述べている。

 Xのスレッドによれば、OpenAIは音声機能のテストにあたって、45の言語にまたがる100人以上で構成された外部のレッドチームを活用したという。また、あらかじめ設定された4種類の音声のみで会話するようにモデルをトレーニングし、それ以外の音声での応答をブロックしたほか、暴力的なコンテンツや著作権で保護されたコンテンツを求めるリクエストをブロックするガードレールを実装した。

 さらに同社は、ユーザーからのフィードバックに基づいてモデルの改良を重ね、制限や安全性評価など、GPT-4oのパフォーマンスに関する詳細なレポートを8月に公開する予定だとしている。

 ChatGPT Plusに加入するには、月額20ドル(約3000円)が必要だ。加入すれば、高度なデータ分析機能や画像生成機能を使ったり、GPT-4oへの優先アクセス権を得たりできるといったメリットもある。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
インテル新社長に大野誠氏が就任、鈴木国正氏は会長に
IT関連
2024-05-23 06:29
パスワードの保管方法トップは「紙に書き残す」–Dropbox Japan調査
IT関連
2021-07-30 02:42
IPAの「情報セキュリティ10大脅威」2023年版–少しずつ変化する脅威の姿
IT関連
2023-03-08 02:02
Kubernetesの利用が拡大、エッジなど最先端の用途で高い活用率
IT関連
2022-02-17 13:03
売りたい人と“売れる人”をマッチング フリマ出品代行「マカセル」アプリ公開
ネットトピック
2021-05-12 15:06
マイクロソフト、「Royal」ランサムウェアのさまざまな配布手段について警告
IT関連
2022-11-23 04:13
Zoom、書いたものが自動で消えるペン機能「Vanishing Pen」を追加
IT関連
2021-04-21 05:07
高校・大学eスポーツのPlayVSがGameSetaを買収してカナダ進出を加速、一般リーグも計画
ゲーム / eSports
2021-01-24 09:36
AIに顧客が期待するのは業務支援–BlackLineタッカー共同CEO
IT関連
2023-12-05 03:00
コロナ後のオフィスに戻った従業員をハッカーが「おかえりなさい」フィッシングの標的に
セキュリティ
2021-06-03 03:06
LegalOn Technologies、「LegalForce」で「オンラインエディター」機能を正式提供
IT関連
2024-01-21 22:53
SQLite3 WASM/JS、Origin Private File Systemを用いてChrome上の高速なローカルDBが機能するとGoogleが明らかに、廃止されたWeb SQLの代替として利用可能
JavaScript
2023-01-13 17:15
サイオステクノロジーとElasticsearchが業務提携、「生成AI+RAG」を展開
IT関連
2024-07-13 21:49
Next.jsのVercelがフロントエンドのクラウド化とサーバーレス化に向けて約113億円調達
ネットサービス
2021-06-28 15:03