マイクロソフト、「Azure AI Speech」のアップグレードを発表

今回は「マイクロソフト、「Azure AI Speech」のアップグレードを発表」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Microsoftは米国時間5月21日、年次開発者会議「Microsoft Build」で、「Azure AI Speech」サービスの新機能を発表した。これらの新機能は、音声に対応した生成人工知能(AI)アプリの開発を強化するものだ。

 MicrosoftのリリースではAzure AI Speechについて、すでに「通話分析(音声とテキスト)、医療文字起こし(音声、画像、テキスト)、キャプション作成(音声/映像、文字起こし、翻訳)、チャットボット(音声、GPT)など、さまざまなユースケース」で利用されているとしている。また、放送や配信用のキャプションを音声から作成したり、通話の中で出てきた住所を抽出したりするなど、現時点でも多くの機能を備えている。

 OpenAIが13日に発表した「GPT-4o」の目玉の1つは「Voice Mode」の改善で、プログラムの応答に使われる音声の品質向上に焦点を当てたものだった。このアップデートに後れを取るまいと、Microsoftは「パーソナル音声」機能を一般提供することを明らかにした。

 この機能により、ユーザーは「音声アシスタント、音声認識、音声コンテンツ作成など、さまざまな用途で独自のAI音声を作成し、利用できるようになる」と、Microsoftはリリースで説明している。

 もう1つの新機能は音声分析で、まずプレビュー版として提供される。この機能は「Azure」の開発環境「Azure AI Studio」内で利用でき、同社が「ソフト」分析と呼ぶ機能に対応するものだ。通話内容のソフト的な要素としては、意味の解釈や話者の感情などが挙げられるが、いずれも通話内容そのものと比べて捉えにくい要素と言える。

 センチメント分析では、「示された共感の度合い、参加者の関与、主張の強さといった情報を細かく検出できるだけでなく、今後の会話の流れを予測できるようになる」と、リリースには書かれている。

 例えば、通話記録では各話者の言葉遣いが「肯定的」「否定的」「ニュートラル」のいずれであったかを発言ごとに評価できる。詳しくは、こちらのインタラクティブデモを見てほしい。

 また、素早い分析を可能にするために、Microsoftは「Fast Transcription」(高速文字起こし)機能も導入する。この機能は「リアルタイムより40倍速い(リアルタイム係数<1)文字起こしを可能にする」ため、「文字起こし作業そのものに大きな変革をもたらす」と、同社は主張している。

 Microsoftによれば、Fast Transcriptionのおかげで、コールセンターのスタッフは通話中に手書きでメモを取る必要がなくなり、「数千時間」を節約できるほか、医師や看護師は患者との会話を数秒で分析できるようになるという。さらに、「メディアやコンテンツ制作者は、ポッドキャストやインタビューの収録を終えたらすぐに分析に取りかかり、インサイトを抽出できる」と、同社はリリースの中で述べている。

 Microsoftによれば、この機能は6月から利用可能になる予定だという。

 また、コンテンツを世界中に発信したいというニーズに対応するため、Microsoftは動画の自動吹き替え機能の導入を予告した。この機能は、コンテンツを翻訳するだけでなく、翻訳した言語で音声を作成し、動画の話者に合わせて声を吹き替えるというものだ。

 さらに同社は、多言語翻訳機能のアップデートも発表した。例えば、動画を視聴しながら字幕の言語を切り替えることが可能になるという。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
DXを進める企業とITベンダーの関係はどうあるべきか–NEC社長に聞いてみた
IT関連
2022-10-07 10:26
Apple TV+、ソフトバンクGに大損害を与えたWeWork創業者のドラマ制作
製品動向
2021-02-01 17:39
NEC、AWSとの戦略的協業を強化–印西データセンターに「AWS Direct Connect」接続拠点を開設
IT関連
2023-06-03 13:00
PICK、「業務設計プラットフォーム」を導入–業務の可視化とタスクの抜け漏れを防止
IT関連
2024-04-13 16:14
NVIDIA CEO、AIにより人間の言葉がプログラミング言語となったことで、プログラミングを学ぶことは重要でなくなった、と発言
NVIDIA
2024-03-12 08:39
テンセントクラウドが語るWeb3の展望–生成AI関連は明言せず
IT関連
2023-03-03 16:04
サイオス、2024年度はSaaS・API・生成AIの「3本の矢」で黒字化目指す
IT関連
2024-02-16 04:35
GWは旅行禁止? ジムも休館? よろしい、ならばZwiftだ :CloseBox(1/4 ページ)
トップニュース
2021-04-29 05:55
ウクライナ軍に入隊したアジャイルコーチがメソッドを駆使/Web版VSCodeがDockerコンテナをWASM環境で起動/無料のLinuxサーバー構築標準教科書ほか、2024年2月の人気記事
編集後記
2024-03-08 02:30
ギグワーカーやクリエイターに金融サービスとしての福利厚生を提供するCatch
フィンテック
2021-08-01 11:38
IT専門家の51%が「ChatGPT」を使うサイバー攻撃に警戒–BlackBerry調査
IT関連
2023-02-09 13:39
UBE、基幹システムを「SAP S/4HANA Cloud」で刷新–リアルタイムデータで意思決定を高度化
IT関連
2024-10-18 04:38
「Link in Bio」を提供するLinktreeがソーシャルコマース機能で約49億円のシリーズB調達
ネットサービス
2021-03-29 18:54
マイクロソフトのバグ報奨金プログラム、過去1年の支払額は約15億円
IT関連
2021-07-12 07:19