ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す (1/3 ページ)

今回は「ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す (1/3 ページ)」についてご紹介します。

関連ワード (毎週月曜日、邪魔、重要等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、It Media News様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 音声による日本語の認識は、過去に比べずいぶん進化してきた。日常的に使っている方も多いだろう。

 もちろん、まだまだ未成熟で、完璧ではない。使うシーンによっても精度はかなり変わる。だからこそ、「まだ使えるものではない」と思っている人も少なくなさそうだ。

 そんな中、最近「あれ、すごいぞ」と思ったのが、Microsoftの音声認識技術。特に、Wordに組み込まれた「ディクテーション」と、「Group Transcribe」というアプリだ。他のものと比較しつつ、これらがどうすごいのか、ちょっと紹介してみたいと思う。

この記事について

この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、一部を転載したものです。今回の記事は2021年4月5日に配信されたものです。メールマガジン購読(月額660円・税込)の申し込みは』(月額980円・税込)もスタート。

なぜ日本語の音声認識は難しいのか

 日本語の音声認識はなぜ難しいのか? 理由はシンプルにまとめると4つの要素がある、と筆者は考えている。

 1つ目は「データ量」。英語に比べ利用者が少ないので、どうしても不利にはなる。これはどうしようもない。とはいえ、全ての言語を見れば、トータル1億数千万人を超える日本語話者の数は上から数えた方が早いわけで、極度に悲観すべきものでもない。

 2つ目は「話し言葉と書き言葉のずれ」だ。日本語の話し言葉と書き言葉は、現代語においてもかなりのずれがある。英語における書き言葉と話し言葉の差よりも大きい。そのため、音声の書き起こしがそのまま「読むための文書」にはなりづらい。読む文章として不自然さが小さい文章を作るには、話された言葉をそのまま正確に文字にするだけではうまくいかない。「あのー」「えっと」といった邪魔な語句の存在も頭が痛い。

 3つ目は、「分かち書きがない」ことだ。分かち書きとは、語句と語句の分かれ目のこと。英語は単語の間にスペースを入れるが、日本語にはない。そして、適宜句読点を入れる。文章に句読点は必須だが、話し言葉から句読点を認識するのは難しい。

 そして4つ目が「同音異義語の多さ」。これはキーボードで文章を書く時でも課題となる。文脈解釈が重要になる部分だ。

 というわけで、英語に比べ日本語の音声認識は難しい。音を認識するテクノロジーそのものは、英語でも日本語でもそう変わらないらしいのだが、そこから文章に変えてわれわれが「自然な文章」と思えるものにするには、さまざまなテクノロジーの助けが必要なのである。

 このような事情があり、現状ではどんなサービスであっても、「日本語の完全な音声書き起こし」はできていない。今回紹介する機能も同様だ。だが、ちょっとした「変化の兆し」は生まれている。それが今回紹介する2つの機能だ。

Wordの「ディクテーション」で句読点を自動挿入

 1つ目が「句読点の処理」だ。

 基本的に、これまでの音声認識の多くは、句読点を自動入力できなかった。自分で句読点を読み上げるか、無視するかのどちらかだ。

 だが、句読点の自動挿入を採用したものも出てきた。とくに注目なのが、Wordに組み込まれた「ディクテーション」機能だ。以前からあるものだが、先行公開される「Office Insider」向けベータチャネルでは1月に、一般向けのアップデートでは3月に、WindowsとMacの両方で「句読点の自動挿入」が導入された。AndroidやiOS/iPadOS向けのモバイル版には「ディクテーション」機能はあるが、句読点自動挿入は搭載されていない。

 ではどんな感じになるのか? 以下の文章を読み上げ、機能による差を見てみよう。

Copyright © ITmedia, Inc. All Rights Reserved.

COMMENTS


15806:
2021-04-09 22:02

進撃の最終回が139話なの、物語で散々出てくる重要数字「13」と「9」で「13年の寿命」「9つの巨人」 みがあるのすごく綺麗だなぁって思うんだけど1と3と9たしても「13」になるし発売日4月9日も「13」になっちゃうのほんと怖い

15809:
2021-04-09 19:23

✨‼️【重要なお知らせ】‼️✨ 4/29 から『命を救うプレゼント企画第二弾』開催決定‼️(固定ツイート第一弾100万円) 記念して本日から 4/29まで毎日1000円のギフト2名様プレゼント致します ?応募方法? ①@shell_b…

15810:
2021-04-09 18:33

しょーくんには差し勢の壁役という重要な使命があるので、そっちでアシスト頼んだ??

15802:
2021-04-09 18:29

今気がついたんだけどバクシンオーのシナリオ、「いつかは長距離レースだって制覇できる!」って締め方で、実際の競走馬では次の世代にその血を託していくことがその在り方の重要な部分で、そして実際に孫であるキタサンブラックが中・長距離G1を総ナメにしてること…

15812:
2021-04-09 17:13

おちんちんは長さ、太さよりも硬さが一番重要だしなにより相性♡ 同じ気持ちの人はDMしてね?

15808:
2021-04-09 14:35

【3000年前】古代エジプトの「失われた黄金都市」発見 発掘チームは8日、南部ルクソール近くで同国発掘史上「最大規模」の古代都市遺構を発見したと発表した。ツタンカーメンの墓以来の最も重要な発見…

15800:
2021-04-09 13:34

各党質問することがあると思うけど今はコロナを抑えて国民の命と生活を救うことの方が最重要課題じゃ無いのか?

15801:
2021-04-09 12:27

【Wardpress】記事を更新した際に、更新した日付を入れたい【リライトの重要さ】

15805:
2021-04-09 11:57

左側でボールを持つと、ファーサイド側にラウタロ、ハキミ、バレッラいるのよな、これってもしかしてくっそ重要じゃない?左サイドの選手

15807:
2021-04-09 11:55

?新宿3丁目 メン エス? ?営業時間 朝10時〜翌朝5時 ?女子給 80分13000円 ?雑費なし? ?健全店です←✨重要✨ ?別途オプションフルバック✨ 単価の割には比較的採用緩めです? ツイッター頑張れる方大歓迎? 年齢18〜…

15811:
2021-04-09 10:41

単に合格という意味だけでなく、将来を見すえて、英語の重要性はきわめて重要であるので、 慶應大学やその他の英語重視の大学を志望する人は、 ひたすら英語の学力・偏差値の強化に努めて欲しい。

15803:
2021-04-09 01:27

セールスの世界には「客の客を喜ばせよ」という有名な格言がある。サッカー選手に置き換えると客(=クラブ)の客、つまりファンやメディアを喜ばせるとその分クラブも喜ぶことになり、結果として自分も恩恵に与るのである。「どこを向いて仕事をするか」は超重要…

15804:
2021-04-09 00:23

ブリンキー・パレルモを通して考える「絵画」の重要性。対談:五月女哲平×今井俊介

15813:
2021-04-09 00:15

やるべきことを決めるのは簡単。やらないことを決めるのが難しい。そして後者こそ大事だ。仮にやるべきことを決める。後はそれをただ実行すればよさそうだ。しかし新しいことが次々に起こり、本当にやるべきことに時間を費やせなくなる。だから要不要を精査して、見…

Recommended

TITLE
CATEGORY
DATE
マイクロソフト、オラクル、セールスフォースがコロナ予防接種情報を記録するプロジェクトで協力
IT関連
2021-01-19 04:52
ゼレンHD・和田社長に聞く事業構想と設立理由–戦略コンサルやシステム開発など傘下
IT関連
2023-10-31 20:56
トランスコスモス、コンタクトセンター向けシステムに生成AIチャットボットを追加
IT関連
2024-05-02 19:15
日立製作所の中西会長が退任、東原社長が会長職を兼務
IT関連
2021-05-13 08:34
Parler停止のAWSとトランプ氏アカウント凍結のFacebook、報復に警戒するよう従業員に通達
企業・業界動向
2021-01-14 01:48
AIスタートアップのセレブラス、2023年は「絶好調の年」–ビジネスモデルの変化で
IT関連
2023-11-25 12:16
ログポース、幹線輸送の配車を自動化するAI–属人化した配車業務を解消へ
IT関連
2024-12-05 10:16
「Fusion Applications」には50以上の生成AI機能が実装–オラクルのSaaS基調講演
IT関連
2024-04-25 15:57
「Windows 11 24H2」の一般提供が開始–新機能、入手方法、サポート期間などを解説
IT関連
2024-10-06 10:30
FBI、公共充電スポットでデータを窃取する「ジュースジャッキング攻撃」を警告
IT関連
2023-04-12 15:09
ランサムウェア攻撃、二重脅迫型が117%増–ゼットスケーラー調査
IT関連
2022-07-16 23:48
トラック輸送の円滑化を目指すSmartHopがシリーズAで約12.7億円調達
ネットサービス
2021-03-12 07:32
積水ハウスと日本IBM、「持続可能なIT開発運用体制の構築」に向けて戦略的連携
IT関連
2023-10-04 21:54
Facebook、3万5000人体制のフェイク対策 3カ月で13億の偽アカ削除
企業・業界動向
2021-03-24 22:18