みずー工房

気ままライフを綴るブログです

「AIきりたん」って何者??

私が最近YouTubeで偶然発見した音声合成ソフトの「AIきりたん」
音声合成ソフトで作られたとは思えないくらいの完成度でびっくりしたので、綴っておきます。


ボーカロイド」とか「初音ミク」って言葉は聞いたことがあると思いますけど、
VOCALOID(ボーカロイド)」自体は、ヤマハの商品名 のようです。知らなかった!
なので、ここでは回りくどく「音声合成ソフト」って書いていこうかなあと思いますw


私自身、音声合成ソフトはあまり詳しくないのですが、
偶然、たまたま、さきほどの「 さくらん 」を発見しまして感動しました。


この動画では「 東北きりたん 」って子が歌ってるそう。
音声合成ソフトの名前は「 NEUTRINO(ニュートリノ) 」っていうらしいです。
「東北きりたん」以外にも、あと2つの音声データベースをソフト内で選択できるようです。
びっくりするくらい人が歌っているような感じがします。
言われてみると機械っぽさもありますが、人が歌ってますよって言われたら騙されそう...


この手の声を聞くと「合成音声だ!」ってわかるイメージだったんですが、
技術が進みすぎて、だんだん見分けがつかなくなってくるかもですね。。。


そういえば、音声合成AIといえば、ヤマハVOCALOIDのプロジェクトの一環として、
NHKと手を組んで「 AI美空ひばり 」ってのを作ってましたね(あれはあれでびっくりした)。
復活して嬉しいとか死者への冒涜だとか賛否はあるようですが、それはそれとして、
エンジニアが悩みながらも、さまざまな工夫を凝らしているシーンをみて感動してました。
AIきりたんもこんな感じで開発されたんでしょうかね?


ちょっと疑問に思ったのは、
ボーカロイド等の音声合成ソフト自体はいままであったのに、なぜAIが絡んでくるのか。


音声合成ソフト系に全く触ったことがないなりに調べてみると、
ボーカロイドで一番大変な作業が「調声 ということらしいです。
この調声とは、声の質やかすれ具合、発声方法を整えていく作業とのこと。
ただ音と歌詞を打ち込んだだけでは、思った通りに発声してくれないのかあ...!
しかもこの調声は、経験や時間が相当必要な作業になるそうで、初心者がやるには敷居が高そうです。


ここでAIが登場します。この調声作業をAIに学習させてやってもらおうというわけです。
学習方法はニコニコ大百科にちょろっと書いてありましたが、知識足らずで断念。。。
機会があれば、ぜひ勉強してみたいなあ
調声作業をAIに任せることができるようになったことで、相当な負担が軽減できて、
効率よくクオリティの高い合成音声を作れるようになったそう
です。


さらに、AIきりたんのすごいところは、無料というところです。
なお、音声データベースについては配布元のライセンスに基づいて利用する必要があります。


VOCALOIDのような合成音声系は高価なイメージがあって手を出してこなかったのですが、
AIきりたんにせっかく出会ったので、使ってみようかなと思います。