2008年09月28日

フランス語の音声ファイルを作ってみる

この記事は古い情報です。
現在、aozoravoice2は無料の各国語音声エンジンが使えるMicrosoft Speech Platform に対応しています。
詳しくは、aozoraVoice2をMicrosoft Speech Platformに対応させました。をご覧ください。
2011/12/03
追記終わり


今作ってるaozoraVoice2は、テキストファイルから音声合成ファイルを作るソフト。
つまり、原稿を渡すと自動的にそれを朗読して録音してくれるソフト。もちろん喋ってくれるのはコンピュータにインストールしている合成音声。

ダウンロード先:aozoravoice2

名前からして、青空文庫のテキストを読ませるためのものなんですけれど、折角だからいろんな言語で読めるようにならないかなということで、現在バージョンでは音声エンジンさえ持っていれば、いろんな言語で録音可能にしました。

サンプルを用意しました。
音声ファイル:Le Rouge et le Noir.mp3

これは、スタンダールの「赤と黒」の原文です。冒頭のほんの少しだけですけど。
原文は、プロジェクト・グーテンベルグから引用。下記リンクの第8版を利用。
Le Rouge et Le Noir by Stendhal - Project Gutenberg


設定は次のものを利用。もともと青空文庫用のソフトだから、この変換で使っていない設定がいろいろくっついていて変だけど。
// aozoravoice2 設定ファイル
{
"ruby_mode" : 0,
"ruby_mode2" : 0,
"commentout_flag" : true,
"global_replace_flag" : false,
"local_replace_flag" : false,
"divide_flag" : false,
"numbering_mode" : 2,
"keta" : 3,
"limit" : 5000,
"lame_flag" : true,
"lameoptions" : "--preset cbr 128",
"about_symbol_remove_flag" : true,
"tag_remove_flag" : false,
"donoji_flag" : false,
"donoji_equal_flag" : true,
"donoji_multi_flag" : true,
"donoji_part_flag" : true,
"kunoji_flag" : false,
"kunoji_string" : "[繰り返し]",
"gunoji_string" : "[繰り返し]",
"ichinoji_flag" : false,
"speakout_flag" : true,
"textout_flag" : true,
"textinfo_flag" : false,
"voice_name" : "ScanSoft Virginie_Full_22kHz",
"format" : 22,
"level" : 80,
"speed" : 0,
"target_flag" : false,
"charset" : "ISO-8859-1",
"delete_wav_flag" : true,
"message_flag" : true,
"" : ""
}
エンコードが「ISO-8859-1」のファイルをメモ帳などで開くと、アクセント記号が文字化けして正しく表示できません。日本語でよく使われるShift_JISエンコードのまま開いて変換すると、フランス語の音声を使っても文字化けのまま読んでしまいます。しかし、上記のように aozoraVoice2 の設定でcharsetを正しく設定すると、正しい音声が出てくるようになります。

この設定にはテキストを出力する機能もオンにしています。出力されるのはUNICODE (UTF-16) の文書です。今回のaozoraVoice2.3.3から出力ファイルをこのUNICODEに切り替えました。切り替えた理由はもちろんいろんな言語の文字を表示させるためです。WindowsXP標準のテキストエディタ「メモ帳」だとちゃんと、UNICOEとして開いてくれて、アクセント記号も表示できるはずです。

TextAloudも前から持って使ってましたが、ISO-8859-1のファイルから直接変換するのは難しかったはずです。僕はいったんテキストをWebブラウザで開いて、それをコピペしてました。

この音声変換を実行するためには、「ScanSoft Virginie_Full_22kHz」というフランス語の音声合成が入っていないといけません。今回はICレコーダの付属ソフトを利用しました。RR-US470付属のVoice Editing Ver.2.0 Premium Editionをインストールすると、九ヶ国語(日本語、英語、中国語、フランス語、ドイツ語、スペイン語、イタリア語、韓国語、ロシア語)の音声合成が使えるようになります。


関連記事:takayanの雑記帳: WindowsXPにSAPI5音声を入れるには



posted by takayan at 11:03 | Comment(0) | TrackBack(0) | aozoraVoice | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック