OpenAI、待望の強化された「Voice Mode」のアルファ版を提供開始

今回は「OpenAI、待望の強化された「Voice Mode」のアルファ版を提供開始」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 OpenAIが「Spring Update」というイベントを5月に開催したとき、大きな注目を集めたものの1つが、「GPT-4o」の新しい動画機能と音声機能で大幅に強化された「ChatGPT」の「Voice Mode」のデモだった。そして、この待望の新しいVoice Modeが(不完全ではあるが)ようやく登場した。

 OpenAIは米国時間7月30日、強化されたVoice Modeを「ChatGPT Plus」の一部ユーザーにアルファ版として順次提供していくことを「X」(旧Twitter)への投稿で明らかにした。この高度な音声アシスタントにより、ユーザーはアシスタントの会話に割り込んだり、自分の感情に即した応答を得たりできるようになる。

 アルファ版へのアクセスが許可されたユーザーには、手順が記載されたメールが送られるほか、上の動画にあるように、モバイルアプリにメッセージが表示される。また、通知が一切届いていなくても心配はいらない。OpenAIによれば、同社は今後もユーザーを順次追加し、秋にはすべてのChatGPT Plusユーザーがアルファ版にアクセスできるようにする計画だという。

 下の動画にあるように、OpenAIはSpring Updateイベントで行った初めてのデモで、Voice Modeのマルチモーダル機能を披露した。このマルチモーダル機能には、ユーザーのスマートフォンの画面に表示されている内容に基づいてアドバイスをしたり、ユーザーがスマートフォンのカメラで撮影している内容に即した応答をしたりするといった機能もある。

 だが、Voice Modeのアルファ版にはこれらの機能がない。OpenAIによれば、「動画と画面の共有機能は後日リリースされる」という。また、初めてのデモ以降、音声会話の品質と安全性の向上を図ってきたと同社は述べている。

 Xのスレッドによれば、OpenAIは音声機能のテストにあたって、45の言語にまたがる100人以上で構成された外部のレッドチームを活用したという。また、あらかじめ設定された4種類の音声のみで会話するようにモデルをトレーニングし、それ以外の音声での応答をブロックしたほか、暴力的なコンテンツや著作権で保護されたコンテンツを求めるリクエストをブロックするガードレールを実装した。

 さらに同社は、ユーザーからのフィードバックに基づいてモデルの改良を重ね、制限や安全性評価など、GPT-4oのパフォーマンスに関する詳細なレポートを8月に公開する予定だとしている。

 ChatGPT Plusに加入するには、月額20ドル(約3000円)が必要だ。加入すれば、高度なデータ分析機能や画像生成機能を使ったり、GPT-4oへの優先アクセス権を得たりできるといったメリットもある。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
AWS、WebアプリケーションからAmazon S3にアクセスできるUIコンポーネント「Storage Browser for S3」、オープンソースとして公開
AWS
2024-09-09 05:35
セキュリティ対策でも「Do more with less」を–マイクロソフトが訴求
IT関連
2023-03-01 15:17
「Windows 11」新プレビュー、「スタート」メニュー改善や新しいタッチジェスチャーなど
IT関連
2022-02-19 13:45
Box、「Box Hubs」の一般提供を開始–企業のコンテンツ活用をAIで加速
IT関連
2024-09-29 20:16
製造業の受注業務、7割以上がFAXで受領–AI inside調査
IT関連
2024-09-04 02:00
総務省、LINEの利用を一時停止 中国の子会社への個人情報共有問題で
企業・業界動向
2021-03-20 00:03
自然言語生成モデル「GPT-3」を「Power Platform」で–コードの記述が不要に
IT関連
2021-07-31 22:38
AIとUXが一体化–ワークデイの最高製品責任者に聞く、エージェントで製品開発はどう変わるのか
IT関連
2024-10-25 14:35
ISID、静岡市の脱炭素先行地域づくり事業に参画–デジタルツイン技術を活用
IT関連
2022-12-28 12:17
USJ「スーパー・ニンテンドー・ワールド」開業延期 緊急事態宣言受け
くらテク
2021-01-16 02:17
ヘルスケア分野の組織を狙うランサムウェア「Maui」、CISAらが警告
IT関連
2022-07-09 03:08
人が弾くピアノに合わせて演奏する仮想バイオリニスト 他者演奏の音声から演奏の動きと音を自動作成 :Innovative Tech
イラスト・デザイン
2021-03-11 22:42
Metaの社内研究開発グループNPE TeamがグループのためのToDoアプリ「Move」を発表
IT関連
2022-03-10 12:39
「Windows Subsystem for Android」に言及–「Windows 11」の「Android」アプリ対応
IT関連
2021-06-25 16:11