ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す (1/3 ページ)

今回は「ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す (1/3 ページ)」についてご紹介します。

関連ワード (毎週月曜日、邪魔、重要等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、It Media News様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 音声による日本語の認識は、過去に比べずいぶん進化してきた。日常的に使っている方も多いだろう。

 もちろん、まだまだ未成熟で、完璧ではない。使うシーンによっても精度はかなり変わる。だからこそ、「まだ使えるものではない」と思っている人も少なくなさそうだ。

 そんな中、最近「あれ、すごいぞ」と思ったのが、Microsoftの音声認識技術。特に、Wordに組み込まれた「ディクテーション」と、「Group Transcribe」というアプリだ。他のものと比較しつつ、これらがどうすごいのか、ちょっと紹介してみたいと思う。

この記事について

この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、一部を転載したものです。今回の記事は2021年4月5日に配信されたものです。メールマガジン購読(月額660円・税込)の申し込みは』(月額980円・税込)もスタート。

なぜ日本語の音声認識は難しいのか

 日本語の音声認識はなぜ難しいのか? 理由はシンプルにまとめると4つの要素がある、と筆者は考えている。

 1つ目は「データ量」。英語に比べ利用者が少ないので、どうしても不利にはなる。これはどうしようもない。とはいえ、全ての言語を見れば、トータル1億数千万人を超える日本語話者の数は上から数えた方が早いわけで、極度に悲観すべきものでもない。

 2つ目は「話し言葉と書き言葉のずれ」だ。日本語の話し言葉と書き言葉は、現代語においてもかなりのずれがある。英語における書き言葉と話し言葉の差よりも大きい。そのため、音声の書き起こしがそのまま「読むための文書」にはなりづらい。読む文章として不自然さが小さい文章を作るには、話された言葉をそのまま正確に文字にするだけではうまくいかない。「あのー」「えっと」といった邪魔な語句の存在も頭が痛い。

 3つ目は、「分かち書きがない」ことだ。分かち書きとは、語句と語句の分かれ目のこと。英語は単語の間にスペースを入れるが、日本語にはない。そして、適宜句読点を入れる。文章に句読点は必須だが、話し言葉から句読点を認識するのは難しい。

 そして4つ目が「同音異義語の多さ」。これはキーボードで文章を書く時でも課題となる。文脈解釈が重要になる部分だ。

 というわけで、英語に比べ日本語の音声認識は難しい。音を認識するテクノロジーそのものは、英語でも日本語でもそう変わらないらしいのだが、そこから文章に変えてわれわれが「自然な文章」と思えるものにするには、さまざまなテクノロジーの助けが必要なのである。

 このような事情があり、現状ではどんなサービスであっても、「日本語の完全な音声書き起こし」はできていない。今回紹介する機能も同様だ。だが、ちょっとした「変化の兆し」は生まれている。それが今回紹介する2つの機能だ。

Wordの「ディクテーション」で句読点を自動挿入

 1つ目が「句読点の処理」だ。

 基本的に、これまでの音声認識の多くは、句読点を自動入力できなかった。自分で句読点を読み上げるか、無視するかのどちらかだ。

 だが、句読点の自動挿入を採用したものも出てきた。とくに注目なのが、Wordに組み込まれた「ディクテーション」機能だ。以前からあるものだが、先行公開される「Office Insider」向けベータチャネルでは1月に、一般向けのアップデートでは3月に、WindowsとMacの両方で「句読点の自動挿入」が導入された。AndroidやiOS/iPadOS向けのモバイル版には「ディクテーション」機能はあるが、句読点自動挿入は搭載されていない。

 ではどんな感じになるのか? 以下の文章を読み上げ、機能による差を見てみよう。

Copyright © ITmedia, Inc. All Rights Reserved.

COMMENTS


15806:
2021-04-09 22:02

進撃の最終回が139話なの、物語で散々出てくる重要数字「13」と「9」で「13年の寿命」「9つの巨人」 みがあるのすごく綺麗だなぁって思うんだけど1と3と9たしても「13」になるし発売日4月9日も「13」になっちゃうのほんと怖い

15809:
2021-04-09 19:23

✨‼️【重要なお知らせ】‼️✨ 4/29 から『命を救うプレゼント企画第二弾』開催決定‼️(固定ツイート第一弾100万円) 記念して本日から 4/29まで毎日1000円のギフト2名様プレゼント致します ?応募方法? ①@shell_b…

15810:
2021-04-09 18:33

しょーくんには差し勢の壁役という重要な使命があるので、そっちでアシスト頼んだ??

15802:
2021-04-09 18:29

今気がついたんだけどバクシンオーのシナリオ、「いつかは長距離レースだって制覇できる!」って締め方で、実際の競走馬では次の世代にその血を託していくことがその在り方の重要な部分で、そして実際に孫であるキタサンブラックが中・長距離G1を総ナメにしてること…

15812:
2021-04-09 17:13

おちんちんは長さ、太さよりも硬さが一番重要だしなにより相性♡ 同じ気持ちの人はDMしてね?

15808:
2021-04-09 14:35

【3000年前】古代エジプトの「失われた黄金都市」発見 発掘チームは8日、南部ルクソール近くで同国発掘史上「最大規模」の古代都市遺構を発見したと発表した。ツタンカーメンの墓以来の最も重要な発見…

15800:
2021-04-09 13:34

各党質問することがあると思うけど今はコロナを抑えて国民の命と生活を救うことの方が最重要課題じゃ無いのか?

15801:
2021-04-09 12:27

【Wardpress】記事を更新した際に、更新した日付を入れたい【リライトの重要さ】

15805:
2021-04-09 11:57

左側でボールを持つと、ファーサイド側にラウタロ、ハキミ、バレッラいるのよな、これってもしかしてくっそ重要じゃない?左サイドの選手

15807:
2021-04-09 11:55

?新宿3丁目 メン エス? ?営業時間 朝10時〜翌朝5時 ?女子給 80分13000円 ?雑費なし? ?健全店です←✨重要✨ ?別途オプションフルバック✨ 単価の割には比較的採用緩めです? ツイッター頑張れる方大歓迎? 年齢18〜…

15811:
2021-04-09 10:41

単に合格という意味だけでなく、将来を見すえて、英語の重要性はきわめて重要であるので、 慶應大学やその他の英語重視の大学を志望する人は、 ひたすら英語の学力・偏差値の強化に努めて欲しい。

15803:
2021-04-09 01:27

セールスの世界には「客の客を喜ばせよ」という有名な格言がある。サッカー選手に置き換えると客(=クラブ)の客、つまりファンやメディアを喜ばせるとその分クラブも喜ぶことになり、結果として自分も恩恵に与るのである。「どこを向いて仕事をするか」は超重要…

15804:
2021-04-09 00:23

ブリンキー・パレルモを通して考える「絵画」の重要性。対談:五月女哲平×今井俊介

15813:
2021-04-09 00:15

やるべきことを決めるのは簡単。やらないことを決めるのが難しい。そして後者こそ大事だ。仮にやるべきことを決める。後はそれをただ実行すればよさそうだ。しかし新しいことが次々に起こり、本当にやるべきことに時間を費やせなくなる。だから要不要を精査して、見…

Recommended

TITLE
CATEGORY
DATE
「接続のしやすさ」よりも「強力な保護」を優先–マカフィーの消費者調査
IT関連
2022-02-08 18:18
Linux Foundation、「グリーンソフトウェア 実践」無料オンラインコースを開始
IT関連
2024-03-22 19:17
Joby Aviationの墜落事故、米国運輸安全委員会が調査中
IT関連
2022-02-19 20:51
ギグカンパニーが労働者の身分をめぐりマサチューセッツ州でも住民投票を画策
シェアリングエコノミー
2021-08-05 22:20
「ワンピース」90巻まで無料公開 期間限定で 100巻発売を前にデジタル版でキャッチアップ
くらテク
2021-07-21 15:30
CIAや米陸軍が語る、AI戦略とリスク–AWS Summit Washington DC
IT関連
2024-07-04 04:00
マイクロソフト、1万人の人員削減へ–過去8年間で最大規模
IT関連
2023-01-20 04:41
PHPとSQLiteをWebAssembly化し、Webブラウザ上でWordPressを実行可能にしたデモをVMwareが公開
PHP
2022-08-22 15:40
IT運用のソフトウェア工学的アプローチ–SREとは?
IT関連
2022-03-17 03:55
OpenStack、25回目のリリース「Yoga」公開
IT関連
2022-04-01 02:52
日大板橋病院、ネットワーク統合とサーバー仮想化で医療DXへの基盤構築
IT関連
2023-11-29 02:05
BlackBerryの最期–アップルとグーグルに敗れたかつてのスマートフォン王者
IT関連
2022-01-22 16:10
メンタルセルフケア・アプリ「emol」と第一生命グループが協業、ミレニアル世代向け保険商品を提供開始
ヘルステック
2021-07-20 20:55
「Raspberry Pi」パワーユーザー向けの冷却ファン
IT関連
2023-04-02 06:45