中国の音声AI大手が取り組むAIによる方言保護
今回は「中国の音声AI大手が取り組むAIによる方言保護」についてご紹介します。
関連ワード (中国ビジネス四方山話、開発等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
「地元以外で、誰も聞いたことがない方言を聞き取れますか?」。中国の音声人工知能(音声AI)大手の科大訊飛(アイフライテック)は2017年、消滅する恐れのある方言を音声AIで保存するプロジェクトを発表した。その発表時に冒頭のメッセージが投げかけられた。
中国には、漢民族のほかに55の少数民族がある。それぞれが自民族の言葉を話し、さらに地域によって方言が使われている。無数の方言があるといってもいい。とはいえ、若者を中心に方言が薄れてきているという。AIの活用が広がっている中、各方言を完全に再現するAIシステムの研究が緊急に求められている。
同社の入力アプリは、発表時点で22の方言に対応しており、「広東語、四川方言、東北方言の認識率は90%超」だとしていた。
それから5年、AIで方言を再現すべく、多数の資料を集めて方言のライブラリーを作り、各地の方言の専門家や学者と協力して研究を重ね、入力アプリで23の方言と3つの少数民族言語をサポートするようになった。そして、アプリでの入力や翻訳のほかにも活用の事例が少しずつ出てきている。江蘇省蘇州では、次のような形で蘇州語(蘇州方言)のAIを活用している。
アイフライテックは、中世の蘇州での生活の様子を描く短編動画「姑蘇瑣記」を発表した。上海からほど近い江蘇省蘇州を舞台にした明代の時代物のコンテンツになる。女性芸能人をもとにバーチャルキャラクターを作成し、当時の服装や道具を使って動き回る様子を違和感なく再現している。ナレーションや対話の部分はAIで生成した蘇州方言を活用している。数分の動画だが、映画のような見た目に仕上がっており、蘇州語も自然なのだそうだ。
蘇州での方言プロジェクトには2万2000人が参加し、蘇州語に関する資料を積み重ねた。言葉を聞き取って理解するだけでなく、発音や抑揚、調子の癖もAIに学ばせることで、より自然で感情的な話し方を再現したという。伝達情報に感情を含ませることにより、ただ音声通訳をするだけでなく、感情表現などが重要な要素となる演劇などの芸能分野にも活用できるようになった。
アイフライテックは蘇州市と提携し、蘇州語AIを教育分野や文化観光、メディア領域に適用できないか模索していくという。例えば、蘇州語AIを使って動画配信やショートムービーなどを配信し、次の世代に方言を継承していくとしている。
アイフライテックが中国語の音声入力機能をリリースしたのは2010年のことで、当時は標準語である北京語向けに開発された。ただ、北京語といっても多くの地域でそれぞれに訛りがあり、「使いづらい」という声が目立っていた。それがきっかけで、まずは広東語、合肥語、四川語などの方言に対応するようになった。一方で、開発者らは地域によって方言入力が思ったほど使われないことにも驚かされた。日常生活で人々が方言を使用する機会が少なくなり、若い世代では聞き取ることすらできなくなっていることに気づかされた。そこで前述のプロジェクトが開始されたというわけだ。
上海語の音声認識AIを開発するための作業は次の通りだ。まず、上海語を読み書きできる人が、上海語と標準語の書き方を見比べて、異なる資料の間に矛盾がある場合はチェックしておき、それをまとめたリストを作る。その地域でしか使われていない漢字は文字化けするので、方言の同音異義語を探して置き換える。こうしてできたリストを方言の母語話者に発音してもらい録音する。その内容を確認して問題がなければ完成となる。この作業にまず半年かかったという。次にさまざまな文章を使ってAIに繰り返し学習させる。こうして上海語AIが完成するころには、開発者も上海語が自然と身についてしまったという。2018年に上海語の音声入力方式が出来上がると、上海語の使い手は誰もが非常に斬新だと絶賛した。
そして上海語の開発チームは蘇州語の開発に移る。また同社では少数民族言語のAI開発も進んでいる。中国雲南省のミャンマー国境と接する中国最深部に居住する、中国最少の少数民族「独龍族」(トーロン族)の方言がその一つだ、現在、独龍語を母語とする人は1万人未満であり、母語とする人もまた高齢者が多く、読み書きができず「独龍族の文字」を書くこともできない。こうした状況下、録音された音声に国際音声記号を対応させて言語材料をまとめて独龍族語AIの開発を行っている。