ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す (1/3 ページ)

今回は「ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す (1/3 ページ)」についてご紹介します。

関連ワード (毎週月曜日、邪魔、重要等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、It Media News様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 音声による日本語の認識は、過去に比べずいぶん進化してきた。日常的に使っている方も多いだろう。

 もちろん、まだまだ未成熟で、完璧ではない。使うシーンによっても精度はかなり変わる。だからこそ、「まだ使えるものではない」と思っている人も少なくなさそうだ。

 そんな中、最近「あれ、すごいぞ」と思ったのが、Microsoftの音声認識技術。特に、Wordに組み込まれた「ディクテーション」と、「Group Transcribe」というアプリだ。他のものと比較しつつ、これらがどうすごいのか、ちょっと紹介してみたいと思う。

この記事について

この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、一部を転載したものです。今回の記事は2021年4月5日に配信されたものです。メールマガジン購読(月額660円・税込)の申し込みは』(月額980円・税込)もスタート。

なぜ日本語の音声認識は難しいのか

 日本語の音声認識はなぜ難しいのか? 理由はシンプルにまとめると4つの要素がある、と筆者は考えている。

 1つ目は「データ量」。英語に比べ利用者が少ないので、どうしても不利にはなる。これはどうしようもない。とはいえ、全ての言語を見れば、トータル1億数千万人を超える日本語話者の数は上から数えた方が早いわけで、極度に悲観すべきものでもない。

 2つ目は「話し言葉と書き言葉のずれ」だ。日本語の話し言葉と書き言葉は、現代語においてもかなりのずれがある。英語における書き言葉と話し言葉の差よりも大きい。そのため、音声の書き起こしがそのまま「読むための文書」にはなりづらい。読む文章として不自然さが小さい文章を作るには、話された言葉をそのまま正確に文字にするだけではうまくいかない。「あのー」「えっと」といった邪魔な語句の存在も頭が痛い。

 3つ目は、「分かち書きがない」ことだ。分かち書きとは、語句と語句の分かれ目のこと。英語は単語の間にスペースを入れるが、日本語にはない。そして、適宜句読点を入れる。文章に句読点は必須だが、話し言葉から句読点を認識するのは難しい。

 そして4つ目が「同音異義語の多さ」。これはキーボードで文章を書く時でも課題となる。文脈解釈が重要になる部分だ。

 というわけで、英語に比べ日本語の音声認識は難しい。音を認識するテクノロジーそのものは、英語でも日本語でもそう変わらないらしいのだが、そこから文章に変えてわれわれが「自然な文章」と思えるものにするには、さまざまなテクノロジーの助けが必要なのである。

 このような事情があり、現状ではどんなサービスであっても、「日本語の完全な音声書き起こし」はできていない。今回紹介する機能も同様だ。だが、ちょっとした「変化の兆し」は生まれている。それが今回紹介する2つの機能だ。

Wordの「ディクテーション」で句読点を自動挿入

 1つ目が「句読点の処理」だ。

 基本的に、これまでの音声認識の多くは、句読点を自動入力できなかった。自分で句読点を読み上げるか、無視するかのどちらかだ。

 だが、句読点の自動挿入を採用したものも出てきた。とくに注目なのが、Wordに組み込まれた「ディクテーション」機能だ。以前からあるものだが、先行公開される「Office Insider」向けベータチャネルでは1月に、一般向けのアップデートでは3月に、WindowsとMacの両方で「句読点の自動挿入」が導入された。AndroidやiOS/iPadOS向けのモバイル版には「ディクテーション」機能はあるが、句読点自動挿入は搭載されていない。

 ではどんな感じになるのか? 以下の文章を読み上げ、機能による差を見てみよう。

Copyright © ITmedia, Inc. All Rights Reserved.

COMMENTS


15806:
2021-04-09 22:02

進撃の最終回が139話なの、物語で散々出てくる重要数字「13」と「9」で「13年の寿命」「9つの巨人」 みがあるのすごく綺麗だなぁって思うんだけど1と3と9たしても「13」になるし発売日4月9日も「13」になっちゃうのほんと怖い

15809:
2021-04-09 19:23

✨‼️【重要なお知らせ】‼️✨ 4/29 から『命を救うプレゼント企画第二弾』開催決定‼️(固定ツイート第一弾100万円) 記念して本日から 4/29まで毎日1000円のギフト2名様プレゼント致します ?応募方法? ①@shell_b…

15810:
2021-04-09 18:33

しょーくんには差し勢の壁役という重要な使命があるので、そっちでアシスト頼んだ??

15802:
2021-04-09 18:29

今気がついたんだけどバクシンオーのシナリオ、「いつかは長距離レースだって制覇できる!」って締め方で、実際の競走馬では次の世代にその血を託していくことがその在り方の重要な部分で、そして実際に孫であるキタサンブラックが中・長距離G1を総ナメにしてること…

15812:
2021-04-09 17:13

おちんちんは長さ、太さよりも硬さが一番重要だしなにより相性♡ 同じ気持ちの人はDMしてね?

15808:
2021-04-09 14:35

【3000年前】古代エジプトの「失われた黄金都市」発見 発掘チームは8日、南部ルクソール近くで同国発掘史上「最大規模」の古代都市遺構を発見したと発表した。ツタンカーメンの墓以来の最も重要な発見…

15800:
2021-04-09 13:34

各党質問することがあると思うけど今はコロナを抑えて国民の命と生活を救うことの方が最重要課題じゃ無いのか?

15801:
2021-04-09 12:27

【Wardpress】記事を更新した際に、更新した日付を入れたい【リライトの重要さ】

15805:
2021-04-09 11:57

左側でボールを持つと、ファーサイド側にラウタロ、ハキミ、バレッラいるのよな、これってもしかしてくっそ重要じゃない?左サイドの選手

15807:
2021-04-09 11:55

?新宿3丁目 メン エス? ?営業時間 朝10時〜翌朝5時 ?女子給 80分13000円 ?雑費なし? ?健全店です←✨重要✨ ?別途オプションフルバック✨ 単価の割には比較的採用緩めです? ツイッター頑張れる方大歓迎? 年齢18〜…

15811:
2021-04-09 10:41

単に合格という意味だけでなく、将来を見すえて、英語の重要性はきわめて重要であるので、 慶應大学やその他の英語重視の大学を志望する人は、 ひたすら英語の学力・偏差値の強化に努めて欲しい。

15803:
2021-04-09 01:27

セールスの世界には「客の客を喜ばせよ」という有名な格言がある。サッカー選手に置き換えると客(=クラブ)の客、つまりファンやメディアを喜ばせるとその分クラブも喜ぶことになり、結果として自分も恩恵に与るのである。「どこを向いて仕事をするか」は超重要…

15804:
2021-04-09 00:23

ブリンキー・パレルモを通して考える「絵画」の重要性。対談:五月女哲平×今井俊介

15813:
2021-04-09 00:15

やるべきことを決めるのは簡単。やらないことを決めるのが難しい。そして後者こそ大事だ。仮にやるべきことを決める。後はそれをただ実行すればよさそうだ。しかし新しいことが次々に起こり、本当にやるべきことに時間を費やせなくなる。だから要不要を精査して、見…

Recommended

TITLE
CATEGORY
DATE
マクニカとNEXTAGE、わさびの促成栽培可能なコンテナ型植物工場を共同開発
IT関連
2023-02-25 03:44
個人向け銀行ローンマッチングのクラウドローンが自動車遠隔制御IoT活用のFinTechサービスGMSと業務提携
フィンテック
2021-04-27 19:52
包括的メンズヘルスケア「Manual」が米国と欧州の投資家から33.1億円のシリーズAを調達
ヘルステック
2021-04-01 23:30
東海旅客鉄道、AIによる車両向け自動学習を導入–「315系」で活用
IT関連
2022-03-10 18:48
インドのジャンムー・カシミール地域で18カ月ぶりに4Gインターネット回線が復活
パブリック / ダイバーシティ
2021-02-08 09:42
東日本大震災から進化を続ける“移動基地局” 災害時の通信ライフラインを確保する最新技術
トップニュース
2021-03-12 11:09
NECと三井住友銀行、カーボンニュートラル事業で協業–CO2排出量を可視化
IT関連
2024-02-29 19:23
Denoのフルスタックフレームワーク「Fresh 1.1」登場。プラグインシステム、Preact DevTools対応、404ページのレンダリングなど新機能
Deno
2022-09-20 23:51
オリオンビール、缶に純アルコールのグラム数表記へ 背景に沖縄の飲酒文化
くらテク
2021-04-27 06:24
サイバーリーズン、「Cybereason XDR」の国内展開を本格化–XDRは中堅企業で普及期に
IT関連
2023-03-31 08:17
TRUST SMITHとADEKAが荷姿・ラベル位置・種類を問わずラベル内情報を自動認識するシステムの実証実験
人工知能・AI
2021-05-01 17:07
M2 Max「MacBook Pro」をクリエイター目線でレビュー–プロ動画編集者の心をつかんだ点
IT関連
2023-04-13 11:07
NTT-AT、ネットワークのトラブルシューティングを自動化
IT関連
2023-03-05 00:39
ネスレ、無人販売機「食品ロス削減ボックス」全国5カ所に 「キットカット」など賞味期限1カ月前まで販売
くらテク
2021-06-18 08:23