2011年11月23日

aozoraVoice2をMicrosoft Speech Platformに対応させました。

aozoraVoice2 は3年前に公開した青空文庫形式などのテキストファイルを音声ファイルに変換するスクリプトです。今回遅ればせながら、Microsoft Speech Platform に対応させました。

次のページで公開しています。
http://et-dev.main.jp/index.php?AozoraVoice

フォルダの中に解凍し、そこに出てきた setup.wsf を実行すると、右クリックの「送る」メニューに「テキストを音声に変換する」と「設定してからテキストを音声に変換する」、そしてデスクトップにショートカットが追加されます。テキストファイルを選択して、この「送る」メニューを使って変換を行うのがこのプログラムの目的です。またデスクトップに作られたショートカットにテキストファイルを落としても変換できます。

今回の改良で、設定画面の下の方にある「音声合成」の「音声の選択メニュー」の中に、Microsoft Speech Platform の音声合成エンジンの名前が並ぶようになりました。

 

■ Microsoft Speech Platform

Microsoft Speech Platform というのは、Windows パソコンで音声認識や音声合成を使ったプログラムを開発、実行させるためのものです。利用者はマイクロソフトのホームページにあるランタイムと音声エンジンをインストールすれば、これに対応したソフトで音声認識や音声合成を利用できるようになります。今回のバージョン(2.4.0)の aozoraVoice2 において Microsoft Speech Platform による音声合成を利用できるよう改良しました。

何よりもありがたいのが、無料で日本語の音声合成エンジンが手に入ることです。また英語や日本語だけでなく様々な言語の音声合成エンジンも手に入ります。現在マイクロソフトのホームページで配布されているもの見ると、カタロニア語、デンマーク語、ドイツ語、英語、スペイン語、フィンランド語、フランス語、イタリア語、日本語、韓国語、ノルウェー語、オランダ語、ポーランド語、ポルトガル語、ロシア語、スウェーデン語、中国語があります。

Microsoft Speech Platform のサポート対象となっているOSはWindowsVista以降、具体的には、Windows 7, Windows Server 2008, Windows Server 2008 R2, Windows Vista です。なおネットで探すと、XPでも動作するという報告があります。

 

■ Microsoft Speech Platform のランタイムおよびランタイム言語のインストール

最新のバージョン11のダウンロード先を紹介します。既に前のバージョンを入れている方がこれらをインストールするときはアンインストールしておいてください。

ランタイムは次のページにあります。

Microsoft Speech Platform - Runtime Languages (Version 11)

64ビットパソコンにはx64で始まるものを、32ビットパソコンにはx86で始まるものをダウンロードします。(念のために言っておくと、スクリプトを実行するアプリケーションが、そのパソコンのビット数で動いているから、これを入れるわけで、64ビットパソコンでも音声合成を使うアプリが32ビット版のアプリならばx86で始まる方が必要になります。そんなこともあり得るので、64ビットパソコンでは両方入れておいた方がいいかもしれません。)

言語ランタイムは次のページにあります。音声認識と音声合成の両方が置いてありますが、今回必要なのは音声合成なので名前にTTSが含まれるものをダウンロードします。日本語音声合成エンジンは MSSpeech_TTS_ja-JP_Haruka.msi です。

Microsoft Speech Platform - Runtime (Version 11)

上記のページからダウンロードしたランタイムと音声合成エンジンのインストールがうまくいけば、aozoraVoice2 で Microsoft Speech Platform 音声を利用できるようになります。

なお、いろいろ書きましたが、Microsoft Speech Platform 関連ファイルは下記のまほろばさんのリンク先で紹介されている「簡易インストーラー」を使うといろいろ手間が省けて便利です。

 

■ 関連サイト

Microsoft Speech Platform についての情報は、下記の記事で詳しく書かれています。マイクロソフトの配布ページが英語だったり、Microsoft Speech Platform について日本語で読める情報が極端に少ないので、とても貴重な情報源です。

Microsoft Speech Platform 11 - 電脳スピーチ blog
まほろば::無料の音声合成エンジン 「Microsoft Speech Platform 11

(追記2011.11.23)
英語でよければ、次のページに情報があります。
Speech Platforms - MSDN Library
My Ramblings - About TTS and Speech Synthesis Technologies - Site Home - MSDN Blogs



posted by takayan at 17:09 | Comment(2) | TrackBack(0) | aozoraVoice | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
こんばんは。

ありがとうございました。2点補足を。

1点目、言語の説明です。電脳さんのがとても詳しいです。
http://denspe.blog84.fc2.com/blog-entry-105.html

2点目、英語(US)の高音質版が見付かりました。
http://denspe.blog84.fc2.com/blog-entry-147.html
Posted by a at 2011年11月23日 20:24
aさん、どうも。
Microsoft Speech Platformを教えてもらってから、かなり時間が経ってしまいました。
それから今回も情報ありがとうございます。高音質が使えるのはいいですね。
Posted by takayan at 2011年11月24日 00:42
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック