ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す (1/3 ページ)

今回は「ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す (1/3 ページ)」についてご紹介します。

関連ワード (毎週月曜日、邪魔、重要等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、It Media News様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 音声による日本語の認識は、過去に比べずいぶん進化してきた。日常的に使っている方も多いだろう。

 もちろん、まだまだ未成熟で、完璧ではない。使うシーンによっても精度はかなり変わる。だからこそ、「まだ使えるものではない」と思っている人も少なくなさそうだ。

 そんな中、最近「あれ、すごいぞ」と思ったのが、Microsoftの音声認識技術。特に、Wordに組み込まれた「ディクテーション」と、「Group Transcribe」というアプリだ。他のものと比較しつつ、これらがどうすごいのか、ちょっと紹介してみたいと思う。

この記事について

この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、一部を転載したものです。今回の記事は2021年4月5日に配信されたものです。メールマガジン購読(月額660円・税込)の申し込みは』(月額980円・税込)もスタート。

なぜ日本語の音声認識は難しいのか

 日本語の音声認識はなぜ難しいのか? 理由はシンプルにまとめると4つの要素がある、と筆者は考えている。

 1つ目は「データ量」。英語に比べ利用者が少ないので、どうしても不利にはなる。これはどうしようもない。とはいえ、全ての言語を見れば、トータル1億数千万人を超える日本語話者の数は上から数えた方が早いわけで、極度に悲観すべきものでもない。

 2つ目は「話し言葉と書き言葉のずれ」だ。日本語の話し言葉と書き言葉は、現代語においてもかなりのずれがある。英語における書き言葉と話し言葉の差よりも大きい。そのため、音声の書き起こしがそのまま「読むための文書」にはなりづらい。読む文章として不自然さが小さい文章を作るには、話された言葉をそのまま正確に文字にするだけではうまくいかない。「あのー」「えっと」といった邪魔な語句の存在も頭が痛い。

 3つ目は、「分かち書きがない」ことだ。分かち書きとは、語句と語句の分かれ目のこと。英語は単語の間にスペースを入れるが、日本語にはない。そして、適宜句読点を入れる。文章に句読点は必須だが、話し言葉から句読点を認識するのは難しい。

 そして4つ目が「同音異義語の多さ」。これはキーボードで文章を書く時でも課題となる。文脈解釈が重要になる部分だ。

 というわけで、英語に比べ日本語の音声認識は難しい。音を認識するテクノロジーそのものは、英語でも日本語でもそう変わらないらしいのだが、そこから文章に変えてわれわれが「自然な文章」と思えるものにするには、さまざまなテクノロジーの助けが必要なのである。

 このような事情があり、現状ではどんなサービスであっても、「日本語の完全な音声書き起こし」はできていない。今回紹介する機能も同様だ。だが、ちょっとした「変化の兆し」は生まれている。それが今回紹介する2つの機能だ。

Wordの「ディクテーション」で句読点を自動挿入

 1つ目が「句読点の処理」だ。

 基本的に、これまでの音声認識の多くは、句読点を自動入力できなかった。自分で句読点を読み上げるか、無視するかのどちらかだ。

 だが、句読点の自動挿入を採用したものも出てきた。とくに注目なのが、Wordに組み込まれた「ディクテーション」機能だ。以前からあるものだが、先行公開される「Office Insider」向けベータチャネルでは1月に、一般向けのアップデートでは3月に、WindowsとMacの両方で「句読点の自動挿入」が導入された。AndroidやiOS/iPadOS向けのモバイル版には「ディクテーション」機能はあるが、句読点自動挿入は搭載されていない。

 ではどんな感じになるのか? 以下の文章を読み上げ、機能による差を見てみよう。

Copyright © ITmedia, Inc. All Rights Reserved.

COMMENTS


15806:
2021-04-09 22:02

進撃の最終回が139話なの、物語で散々出てくる重要数字「13」と「9」で「13年の寿命」「9つの巨人」 みがあるのすごく綺麗だなぁって思うんだけど1と3と9たしても「13」になるし発売日4月9日も「13」になっちゃうのほんと怖い

15809:
2021-04-09 19:23

✨‼️【重要なお知らせ】‼️✨ 4/29 から『命を救うプレゼント企画第二弾』開催決定‼️(固定ツイート第一弾100万円) 記念して本日から 4/29まで毎日1000円のギフト2名様プレゼント致します ?応募方法? ①@shell_b…

15810:
2021-04-09 18:33

しょーくんには差し勢の壁役という重要な使命があるので、そっちでアシスト頼んだ??

15802:
2021-04-09 18:29

今気がついたんだけどバクシンオーのシナリオ、「いつかは長距離レースだって制覇できる!」って締め方で、実際の競走馬では次の世代にその血を託していくことがその在り方の重要な部分で、そして実際に孫であるキタサンブラックが中・長距離G1を総ナメにしてること…

15812:
2021-04-09 17:13

おちんちんは長さ、太さよりも硬さが一番重要だしなにより相性♡ 同じ気持ちの人はDMしてね?

15808:
2021-04-09 14:35

【3000年前】古代エジプトの「失われた黄金都市」発見 発掘チームは8日、南部ルクソール近くで同国発掘史上「最大規模」の古代都市遺構を発見したと発表した。ツタンカーメンの墓以来の最も重要な発見…

15800:
2021-04-09 13:34

各党質問することがあると思うけど今はコロナを抑えて国民の命と生活を救うことの方が最重要課題じゃ無いのか?

15801:
2021-04-09 12:27

【Wardpress】記事を更新した際に、更新した日付を入れたい【リライトの重要さ】

15805:
2021-04-09 11:57

左側でボールを持つと、ファーサイド側にラウタロ、ハキミ、バレッラいるのよな、これってもしかしてくっそ重要じゃない?左サイドの選手

15807:
2021-04-09 11:55

?新宿3丁目 メン エス? ?営業時間 朝10時〜翌朝5時 ?女子給 80分13000円 ?雑費なし? ?健全店です←✨重要✨ ?別途オプションフルバック✨ 単価の割には比較的採用緩めです? ツイッター頑張れる方大歓迎? 年齢18〜…

15811:
2021-04-09 10:41

単に合格という意味だけでなく、将来を見すえて、英語の重要性はきわめて重要であるので、 慶應大学やその他の英語重視の大学を志望する人は、 ひたすら英語の学力・偏差値の強化に努めて欲しい。

15803:
2021-04-09 01:27

セールスの世界には「客の客を喜ばせよ」という有名な格言がある。サッカー選手に置き換えると客(=クラブ)の客、つまりファンやメディアを喜ばせるとその分クラブも喜ぶことになり、結果として自分も恩恵に与るのである。「どこを向いて仕事をするか」は超重要…

15804:
2021-04-09 00:23

ブリンキー・パレルモを通して考える「絵画」の重要性。対談:五月女哲平×今井俊介

15813:
2021-04-09 00:15

やるべきことを決めるのは簡単。やらないことを決めるのが難しい。そして後者こそ大事だ。仮にやるべきことを決める。後はそれをただ実行すればよさそうだ。しかし新しいことが次々に起こり、本当にやるべきことに時間を費やせなくなる。だから要不要を精査して、見…

Recommended

TITLE
CATEGORY
DATE
PCは「パーソナルコンピューター」から「パーソナルコンパニオン」に–日本HP
IT関連
2024-01-23 23:10
セキュリティで問題なのはテクノロジーではなく教育–ソフォス調査
IT関連
2022-04-30 15:43
暗号資産取引やフィンテック企業で起こる不正を独自のアルゴリズムで見つけるSardine
IT関連
2022-02-12 20:35
クラウドからオンプレミスへ回帰した理由は? クラウドとの通信費用の高さや、クラウド移行ありきなどが課題。ノークリサーチが中堅中小企業を調査
クラウド
2024-03-28 23:14
OpenAI、新しい動画生成AIモデル「Sora Turbo」を有料ユーザーに公開
IT関連
2024-12-11 08:39
AWS、Java 18対応の独自Javaディストリビューション「Amazon Corretto 18」正式リリース
AWS
2022-03-24 15:54
マイクロソフト、「Windows 365 Cloud PC」を発表–Windows 10と11をクラウド経由で
IT関連
2021-07-15 08:41
ラオックス、7店舗を閉店へ インバウンド需要の減少で 今後はアジア雑貨に注力
くらテク
2021-08-17 02:23
AWS、アプリケーション内できめ細かなアクセス制御を実現するポリシー言語「Ceder」と認可エンジンをオープンソースで公開
AWS
2023-05-15 12:29
ITエンジニアが使いたいエディタトップ10 「Visual Studio Code」は3位 1位は?
企業・業界動向
2021-05-28 18:36
ツイッターがAP通信、ロイターと提携して誤情報の拡散防止を強化
ネットサービス
2021-08-04 19:28
米証券取引委員会「誰かがイーロン・マスク氏のツイートを監視しなくてはならない」
IT関連
2022-03-24 07:12
【3月22日】掲載記事アクセスランキング・トップ5―1位はフロム・ソフトウェアElden Ring、2位はMac Studioレビュー
IT関連
2022-03-23 05:14
サムスン、12nmクラスDDR5 DRAMを発表–2023年から量産へ
IT関連
2022-12-24 21:23