無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力 (1/3 ページ)

今回は「無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力 (1/3 ページ)」についてご紹介します。

関連ワード (技術、操作性、高速化等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、It Media News様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 市販の歌声合成ソフトとして、ヤマハのVOCALOIDとともに独自の歴史を刻んできた「CeVIO」が1月29日、登場から8年を前に大きく進化。深層学習の技術を取り入れ「CeVIO AI」として、開発元のテクノスピーチが発売した。まずはその歌声を聴いてほしい。

 これは、ソフト上で楽譜を打ち込んで再生ボタンを押しただけで出力された音声だ。それだけでこのように人間らしい歌声が出力できる。「しゃくりあげ」や「ビブラート」といった歌唱表現も勝手に付く。メインボーカルとして起用するにはもう少し調整が必要だが、作曲中の仮歌に使うなら文句のないクオリティーになっている。人間らしい歌声を合成するまでの時間が短いため、作業を迅速に進められるのがメリットの一つだ。

CeVIO AIリリースまでの道のり

 CeVIOは2013年公開のWindows専用音声/歌声合成ソフト。名古屋工業大学が長年研究しているHMM(隠れマルコフモデル)による音声合成技術をもとに、人間らしい話し声や歌声を合成するソフトとして、オリジナル曲のボーカルや、ゲーム実況動画のナレーションに使われてきた。

 今回発売したのは進化版のCeVIO AI。CNN(畳み込みニューラルネットワーク)やRNN(リカレントニューラルネットワーク)といった技術を活用して、モデルとなる歌手や声優の歌い方や話し方を学習。人間らしい声を再現するソフトウェアだ。

 テクノスピーチの大浦圭一郎代表取締役によると、16年にはCeVIOへの深層学習技術の導入を開始。当時はまだ処理が重く、歌声の合成にGPUが必要で、一般的なノートPCなどでは合成が難しく「製品化はまだ遠いなと思っていた」(大浦代表)という。19年からは製品化に向け高速化や操作性の向上などを行っていた。

 1000分の5秒単位でAIが人間らしい声質などを推定して合成していたのを、推定の頻度を下げることで合成スピードを高速化。クオリティーとのバランスが取れるようになったため、製品化に踏み切ったという。

Copyright © ITmedia, Inc. All Rights Reserved.

COMMENTS


Recommended

TITLE
CATEGORY
DATE
藤沢市、電子契約サービス「GMOサイン」で行政DXを加速
IT関連
2024-09-25 10:00
グーグル、「Chrome」のゼロデイ脆弱性を修正
IT関連
2022-07-07 12:41
NTT、モバイル6Gの実証に向けた連携体制を構築
IT関連
2022-06-08 11:54
2023年からの5年間で100社のSaaS導入を目指す–インフォアジャパンの黒塚新社長
IT関連
2022-11-09 12:28
MODE、生成AIとセンサーデータを活用するパートナープログラムを展開
IT関連
2024-06-13 12:13
AI時代の相続はどうなる? 可能性と限界、専門家の未来を考察
IT関連
2024-08-01 10:05
「Firefox」の垂直タブ機能が画期的なアップデートである理由
IT関連
2025-02-13 05:29
自律型AIソフトウェアエンジニア「Devin」、ついに正式サービス開始。月額500ドルから
Microsoft Azure
2024-12-12 14:38
サントリー、「全社員型タレントマネジメント」の推進で統合人事システムを導入
IT関連
2024-02-01 10:47
マイクロソフト、400万ドルのバグ報奨金をかけたイベント開催へ
IT関連
2024-11-23 08:45
勤怠管理システム「KING OF TIME」、人材管理システム「ヒトマワリ」とAPI連携
IT関連
2022-05-07 01:11
ソフトバンク、楽天モバイルと元社員に1000億円規模の訴訟 まず10億円の支払いなどを請求
企業・業界動向
2021-05-07 19:37
フェイスブックとInstagramで「いいね!」の数を非表示可能に、徐々に展開中
ネットサービス
2021-06-06 18:13
サステナビリティー経営のITソリューションはERPベンダーに有利か
IT関連
2022-04-28 22:28