ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す (1/3 ページ)

今回は「ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す (1/3 ページ)」についてご紹介します。

関連ワード (毎週月曜日、邪魔、重要等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、It Media News様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 音声による日本語の認識は、過去に比べずいぶん進化してきた。日常的に使っている方も多いだろう。

 もちろん、まだまだ未成熟で、完璧ではない。使うシーンによっても精度はかなり変わる。だからこそ、「まだ使えるものではない」と思っている人も少なくなさそうだ。

 そんな中、最近「あれ、すごいぞ」と思ったのが、Microsoftの音声認識技術。特に、Wordに組み込まれた「ディクテーション」と、「Group Transcribe」というアプリだ。他のものと比較しつつ、これらがどうすごいのか、ちょっと紹介してみたいと思う。

この記事について

この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、一部を転載したものです。今回の記事は2021年4月5日に配信されたものです。メールマガジン購読(月額660円・税込)の申し込みは』(月額980円・税込)もスタート。

なぜ日本語の音声認識は難しいのか

 日本語の音声認識はなぜ難しいのか? 理由はシンプルにまとめると4つの要素がある、と筆者は考えている。

 1つ目は「データ量」。英語に比べ利用者が少ないので、どうしても不利にはなる。これはどうしようもない。とはいえ、全ての言語を見れば、トータル1億数千万人を超える日本語話者の数は上から数えた方が早いわけで、極度に悲観すべきものでもない。

 2つ目は「話し言葉と書き言葉のずれ」だ。日本語の話し言葉と書き言葉は、現代語においてもかなりのずれがある。英語における書き言葉と話し言葉の差よりも大きい。そのため、音声の書き起こしがそのまま「読むための文書」にはなりづらい。読む文章として不自然さが小さい文章を作るには、話された言葉をそのまま正確に文字にするだけではうまくいかない。「あのー」「えっと」といった邪魔な語句の存在も頭が痛い。

 3つ目は、「分かち書きがない」ことだ。分かち書きとは、語句と語句の分かれ目のこと。英語は単語の間にスペースを入れるが、日本語にはない。そして、適宜句読点を入れる。文章に句読点は必須だが、話し言葉から句読点を認識するのは難しい。

 そして4つ目が「同音異義語の多さ」。これはキーボードで文章を書く時でも課題となる。文脈解釈が重要になる部分だ。

 というわけで、英語に比べ日本語の音声認識は難しい。音を認識するテクノロジーそのものは、英語でも日本語でもそう変わらないらしいのだが、そこから文章に変えてわれわれが「自然な文章」と思えるものにするには、さまざまなテクノロジーの助けが必要なのである。

 このような事情があり、現状ではどんなサービスであっても、「日本語の完全な音声書き起こし」はできていない。今回紹介する機能も同様だ。だが、ちょっとした「変化の兆し」は生まれている。それが今回紹介する2つの機能だ。

Wordの「ディクテーション」で句読点を自動挿入

 1つ目が「句読点の処理」だ。

 基本的に、これまでの音声認識の多くは、句読点を自動入力できなかった。自分で句読点を読み上げるか、無視するかのどちらかだ。

 だが、句読点の自動挿入を採用したものも出てきた。とくに注目なのが、Wordに組み込まれた「ディクテーション」機能だ。以前からあるものだが、先行公開される「Office Insider」向けベータチャネルでは1月に、一般向けのアップデートでは3月に、WindowsとMacの両方で「句読点の自動挿入」が導入された。AndroidやiOS/iPadOS向けのモバイル版には「ディクテーション」機能はあるが、句読点自動挿入は搭載されていない。

 ではどんな感じになるのか? 以下の文章を読み上げ、機能による差を見てみよう。

Copyright © ITmedia, Inc. All Rights Reserved.

COMMENTS


15806:
2021-04-09 22:02

進撃の最終回が139話なの、物語で散々出てくる重要数字「13」と「9」で「13年の寿命」「9つの巨人」 みがあるのすごく綺麗だなぁって思うんだけど1と3と9たしても「13」になるし発売日4月9日も「13」になっちゃうのほんと怖い

15809:
2021-04-09 19:23

✨‼️【重要なお知らせ】‼️✨ 4/29 から『命を救うプレゼント企画第二弾』開催決定‼️(固定ツイート第一弾100万円) 記念して本日から 4/29まで毎日1000円のギフト2名様プレゼント致します ?応募方法? ①@shell_b…

15810:
2021-04-09 18:33

しょーくんには差し勢の壁役という重要な使命があるので、そっちでアシスト頼んだ??

15802:
2021-04-09 18:29

今気がついたんだけどバクシンオーのシナリオ、「いつかは長距離レースだって制覇できる!」って締め方で、実際の競走馬では次の世代にその血を託していくことがその在り方の重要な部分で、そして実際に孫であるキタサンブラックが中・長距離G1を総ナメにしてること…

15812:
2021-04-09 17:13

おちんちんは長さ、太さよりも硬さが一番重要だしなにより相性♡ 同じ気持ちの人はDMしてね?

15808:
2021-04-09 14:35

【3000年前】古代エジプトの「失われた黄金都市」発見 発掘チームは8日、南部ルクソール近くで同国発掘史上「最大規模」の古代都市遺構を発見したと発表した。ツタンカーメンの墓以来の最も重要な発見…

15800:
2021-04-09 13:34

各党質問することがあると思うけど今はコロナを抑えて国民の命と生活を救うことの方が最重要課題じゃ無いのか?

15801:
2021-04-09 12:27

【Wardpress】記事を更新した際に、更新した日付を入れたい【リライトの重要さ】

15805:
2021-04-09 11:57

左側でボールを持つと、ファーサイド側にラウタロ、ハキミ、バレッラいるのよな、これってもしかしてくっそ重要じゃない?左サイドの選手

15807:
2021-04-09 11:55

?新宿3丁目 メン エス? ?営業時間 朝10時〜翌朝5時 ?女子給 80分13000円 ?雑費なし? ?健全店です←✨重要✨ ?別途オプションフルバック✨ 単価の割には比較的採用緩めです? ツイッター頑張れる方大歓迎? 年齢18〜…

15811:
2021-04-09 10:41

単に合格という意味だけでなく、将来を見すえて、英語の重要性はきわめて重要であるので、 慶應大学やその他の英語重視の大学を志望する人は、 ひたすら英語の学力・偏差値の強化に努めて欲しい。

15803:
2021-04-09 01:27

セールスの世界には「客の客を喜ばせよ」という有名な格言がある。サッカー選手に置き換えると客(=クラブ)の客、つまりファンやメディアを喜ばせるとその分クラブも喜ぶことになり、結果として自分も恩恵に与るのである。「どこを向いて仕事をするか」は超重要…

15804:
2021-04-09 00:23

ブリンキー・パレルモを通して考える「絵画」の重要性。対談:五月女哲平×今井俊介

15813:
2021-04-09 00:15

やるべきことを決めるのは簡単。やらないことを決めるのが難しい。そして後者こそ大事だ。仮にやるべきことを決める。後はそれをただ実行すればよさそうだ。しかし新しいことが次々に起こり、本当にやるべきことに時間を費やせなくなる。だから要不要を精査して、見…

Recommended

TITLE
CATEGORY
DATE
アジア太平洋地域の企業、セキュリティ対策が万全は38%–Cloudflare調査
IT関連
2023-09-05 14:52
マッチングアプリのプロフ写真は本物? AIで照合 「Tinder」新機能
ロボット・AI
2021-04-22 15:20
生成AIで盛り上がる半導体市場、日本企業も活躍
IT関連
2023-06-06 04:52
進化するブレインコンピューターインターフェース–実用化への期待と課題
IT関連
2022-03-29 14:52
宮城県岩沼市、AI活用した公共交通システム「岩沼AI乗合バス」を運行
IT関連
2024-03-14 04:22
「Duet AI for Google Workspace」、2024年初頭から「Gemini」搭載へ
IT関連
2023-12-15 11:56
イオン銀行、日立のソリューション活用で共通アプリケーション基盤構築
IT関連
2023-12-02 16:29
アタックサーフェスの拡大で高まるDevSecOpsの重要性
IT関連
2023-02-09 00:14
第6回:ビジネスの革新に不可欠なデータファブリック戦略
IT関連
2021-06-10 15:37
東芝テック、リテール基盤とRetail AIのスマートカートを連携–食品スーパーで実証
IT関連
2024-10-09 05:11
富士フイルム、1億画素ミラーレスカメラの第2弾 「プロのみならず写真愛好家にも」 価格は約70万円に
くらテク
2021-01-29 08:27
東京大学が「デジタルツイン」構築向けWebGISプラットフォーム「Re:Earth」をオープンソースとして公開
ソフトウェア
2021-07-29 15:03
SAPジャパン、国内AIエコシステムで戦略的パートナーシップ–他社製AIを連携活用
IT関連
2023-09-21 15:27
協和キリン、従業員エクスペリエンス管理ツールを導入–従業員が抱えているニーズを把握
IT関連
2023-06-30 23:44