第196回、はっぴー☆ちゃんねる:音声合成で遊んでみた


るな 「おは☆はっぴ〜♪」
しん 「第196回、はっぴー☆ちゃんねる!ナビゲータのしんに」
えてぃ「アシスタントのえてぃ、るなでお送りいたします♪」


しん 「最近話題(?)の音声合成で遊んでみたのです。」
るな 「相変わらず現実逃避ですか…」
しん 「巷では有名な音声合成ソフトにAquesTalk*1っていうのがあるんだけど、Windows版のライブラリが公開されてたんで、いじってみました。」

しん 「合成してできた音がこれ。」
http://hoshimi.ddo.jp/tmp/hc195.wav
えてぃ「これ、前回のはっぴー☆ちゃんねる?」
しん 「うん」
るな 「なんか微妙にぬけたり…あと、『私は』の『わ』の発音が『は』になってるのです」
しん 「そのまま読む仕様になってるからね」
えてぃ「でも、これ、ライブラリを使ったってことは、普通にその関数を呼んで実行しただけ?」
しん 「ううん。このソフト、ひらがなしか対応してなくて、漢字読めないんだ。それ困るからMeCab*2っていう形態素解析するライブラリをつかって読み仮名に変換してそれをつなげて読ませる仕様にしたんだ」
えてぃ「形態素解析?」
るな 「ってなんですか?」
しん 「形態素解析っていうのは文章を分析して分節に変換することをいうんだ。たとえば『わたしのたわし』って入力すると…」
えてぃ「れーてん」
るな 「つまらないのです」

わたし  名詞,代名詞,一般,*,*,*,わたし,ワタシ,ワタシ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
たわし  名詞,一般,*,*,*,*,たわし,タワシ,タワシ
EOS

しん 「てな感じに分析してくれるのです」
えてぃ「おー!!!」
るな 「なんと!?」
しん 「それで片仮名の部分を抽出してつないで読ませたわけ。」
るな 「じゃあそのめかぶってので片仮名に変換してそれを読んでるのですね?」
しん 「そーいうこと」
えてぃ「だから棒読みなのね」
しん 「だからってわけでもないけど…でもアクセントとかデータベース化すれば、メカブから変換する過程でアクセントを指定できそうなんだよね。でも面倒だからしない予定」
えてぃ「あらあら。」
しん 「このAquesってのよりもっと便利なライブラリでg-talk*3っていうのがあって、それはちゃんと形態素解析から、ことば自体のアクセントまで自動でやってくれるみたいで(プログラム完成してから発見した。。。)今度はそれで遊んでみようかと」
るな 「なるほどなのです」
えてぃ「あたし結構こういう国語的なの好きなのよね。なんか進んだらまた紹介してちょうだい」
しん 「あい」
るな 「でもその前に勉強なのです」
しん 「あい…」

*1:AquesTalk:組み込み用途向けに開発された、テキスト情報を音声波形に変換出力する日本語の規則音声合成ライブラリ。 http://www.a-quest.com/aquestalk/

*2:MeCab:京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発されたオープンソース形態素解析エンジン。 http://mecab.sourceforge.net/

*3:http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html