LINE WORKS、「CLOVA Note β」で話者の言いよどみを判別・除去する機能

今回は「LINE WORKS、「CLOVA Note β」で話者の言いよどみを判別・除去する機能」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 LINE WORKSは3月6日、「CLOVA Note β」において、話者が発するフィラーや言いよどみを除去する機能を追加したと発表した。

 CLOVA Note βは、AI技術を活用した無料の音声記録管理サービスで、人の話す言葉を音声として認識してテキスト化するための音声認識が使用されている。この音声認識では、音声データそのものからAIモデルを学習し、正解ラベルを利用せずにモデルを構築する手法「自己教師あり学習」が活用されているとLINE WORKSは説明する。

 従来の「End-to-End音声認識」は、膨大な音声データと正解ラベルの人的作業がペアで必須となるため、精度向上に不可欠な品質の良い学習データを集めるのに多大なリソースと時間がかかることが課題といわれている。CLOVA Note βでは、大量の音声データを用いてAI学習を行うため、効率的に精度を向上させることができるという。

 今回追加されたフィラー・言いよどみ除去機能は、話者が発する「えー」「あのー」といったフィラー・言いよどみを識別・除去する。さらに、「あの」「その」のような指示代名詞などの重要な単語が誤って削除されないよう、文脈に応じたテキストの保持または除去が判断されるように調整されている。

 フィラー・言いよどみ除去モデルの開発は、不要な言葉が含まれると可読性が低下し、内容の把握が困難になるというユーザーからの声を反映しているという。開発の初期段階では、ユーザーの意図に沿っているか、また発話内容から重要な情報を削除してしまうような処理を行っていないかを特に意識し、開発および性能評価を繰り返したと同社は述べる。

 自然言語処理(NLP)タスクにおいて高い性能を発揮するRoBERTaを用い、適切なモデルの選択やテキストの前処理に重要な役割を果たす「モデルのサイズ」と「トークナイザー」は、フィラーと言いよどみの検出という下流タスクに合わせて最適化されるよう事前学習している。文章やテキストを小さな単位に分割するツールであるトークナイザーは、日本語の文字ベースのものを使用することで、フィラーや言いよどみなどを文字単位で効果的に識別できるよう工夫しているという。

 フィラー・言いよどみ除去モデルの完成度を高めるための微調整においては、ドメインミスマッチを防ぐために正解テキストデータも使用している。専門チームによってアノテーションされた高品質なユーザーデータをサービスの向上のための情報源として活用することで、フィラーや言いよどみを高い精度で検出するモデルを実現。使用されるユーザーデータは、「サービス品質向上のためのユーザーデータの取得」で同意したユーザーのみのデータを利用していると同社は強調する。

 このような高精度な日本語音声認識モデルの開発・提供ができる背景として、高品質な正解データを生成するための専門チームや、誤認識結果の分析や先行研究などを参考に音声精度の向上に取り組むリサーチエンジニアが在籍していることを同社は挙げる。

 フィラー・言いよどみ除去機能は過去作成されたノートには適用されず、新規作成ノートにのみ適用される。また自動的に適用されるため、アプリアップデートは不要。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
人間が“鼻輪ウェアラブル”装着 臭いの方向を検知しガス漏れの場所を特定 :Innovative Tech
トップニュース
2021-08-11 00:32
第2回:「ウェブアクセシビリティー義務化」に向けて企業のウェブ担当者が今すぐすべきこと
IT関連
2024-04-17 03:36
コロナ禍でマクロレンズが売れた 「CP+ 2021」で見えたカメラの今 :荻窪圭のデジカメレビュープラス(1/2 ページ)
くらテク
2021-03-03 16:28
Twilio、固定電話番号で利用できる音声通話サービス提供–ソフトバンクと提携
IT関連
2022-05-20 20:26
「IBM Cloud Code Engine」はフルマネージド型で開発に注力できるランタイムサービス
IT関連
2021-06-30 23:55
マイクロソフト、AIが人間を支援する「Copilot for everything」を推進。3DアニメツールのMayaで自然言語による操作をAutodeskと開発中。Microsoft Build 2022
Adobe
2022-05-26 00:54
DDoS攻撃の攻撃元はアジアがトップ–A10ネットワークス調査
IT関連
2024-05-29 15:20
ベイシス、社内RPAの推進により手作業時間を4256時間削減
IT関連
2022-08-25 08:09
テック業界でのダイバーシティの向上には妥協点を見出すアプローチが必要
IT関連
2021-01-29 07:27
アドビ神谷新社長が事業戦略–新ビジョンは「心、おどる、デジタル」
IT関連
2021-06-30 12:15
OTセキュリティは実装段階に–TXOneが事業戦略を説明
IT関連
2024-11-24 03:30
核融合スタートアップ京都フュージョニアリングが総額20億円調達、グローバル核融合市場の取り込みと事業拡大を目指す
IT関連
2022-02-03 03:21
NVIDIA、CEOの基調講演を一部CGで生成–制作過程を公開
IT関連
2021-08-13 15:43
“ウソ”をつけないマッチングアプリ、早稲田大の学生がAIコンペで開発 リモートでも緊密にチーム開発できたワケ
PR
2021-03-06 21:27