昨日 SAPI5 のことを久しぶりに思い出して、完全なオープンソースの SAPI5 日本語音声というのは、ちょっとやり甲斐がある仕事だなと思っていましたが、これを見つけてこの気持ちは消えてしまいました。
新しい音声合成システム Microsoft Speech Platform には、ちゃんと日本語音声が用意されていました。いままでこれがないことで、どれだけ困っていたことか。Fire Vox で SAPI4 の日本語音声が使えるようにするために、XPCOMの勉強をしたり、なんかもうほんと苦労しました。
無料でインストールできる日本語の合成音声があれば、ソフトを作る側はほんとに楽になります。Aquestalk の登場で爆発的に改善されましたが、今後標準になるだろう Windows の音声合成のシステムで最初から日本語が用意されているというのは、ほんとに素晴らしいことです。欲を言えば、インストーラが日本語になりインストールがもっと楽になってくれるといいですね。将来、 iOS のようにインストールさえせずに設定画面でチェックを入れるだけで使えるようになれば、もっといいですけど。
日本語音声を使えるようにするには、次の二つのファイルをダウンロードし、インストールする必要があります。
次のページから、Microsoft Speech Platform - Server Runtime 。
Download details: Microsoft Speech Platform - Server Runtime (Version 10.2)
プラットフォームに合わせて、下記のどちらかをダウンロードし、インストール。
x64\SpeechPlatformRuntime.msi
x86\SpeechPlatformRuntime.msi
次のページから、日本語音声 MSSpeech_TTS_ja-JP_Haruka.msi を探して、ダウンロードし、インストール。
Download details: Microsoft Speech Platform - Server Runtime Languages (Version 10.2)
開発者は、さらに次の Microsoft Speech Platform - Software Development Kit (SDK) も。
Download details: Microsoft Speech Platform - Software Development Kit (SDK) (Version 10.2)
詳しいインストールの仕方は、既に詳しい記事がいくつか書かれているので、そちらを見てください。
特に、aさんも紹介してくれたこのサイトの記事は、とても詳しく書かれています。
Microsoft Speech Platform の日本語音声合成エンジン - 電脳スピーチ blog
インストールできたら、ここで公開されている spcbght.bat で試してみましょう。入力文字の読み上げから音声ファイルの作成までたいていのことができます。
ただし、これは10.1用の記事で、記事の中にもあるように現在のバージョンは10.2です。Microsoft Speech Platform 10.2 - 電脳スピーチ blog
それから、読み上げソフトの SofTalk が2010.08.31に Microsoft Speech Platform に対応していました。最近 Aquestalk2 にも対応しました。
SofTalk - トップページ
SDKの中の sapi.h をsapi5のものと見比べてみると、sapi5からバージョンアップされたもの以外の何物でもないのがわかります。よく見ると、sapi.h内で_SAPI_VER が0x055に定義されていて、16進数ですが、これは sapi5.5 を意味していると考えて差し支えないでしょう。
それでも、SAPI5 のようにコントロールパネルで操作できないし、内部の名前もいくつか違っているので、sapi5のシリーズの延長線上にある別物という位置づけなのでしょう。プログラムを作る側としては、sapi5ととてもよく似ているので、新しいことを覚えなくてすむため、移行や併用が簡単にできるので、少なくともその点だけはありがたいです。
私が知る限り、Microsoft Speech Platformに
対応している読み上げソフトで、
かつ、こちらで既出ではないもので、Text To Wavが
あります。てか、ここで Platformを知りました。
http://noah0.blog119.fc2.com/blog-category-2.html
こちらのサイトで、話題になっているSofTalkは、
読み上げは良いのですが、最新版でもwav出力が
使い物になりません。
spcbght.batの方ですが、小説を貼り付けると、
動作が不安定な感じですね。小説の貼り付けが完了するまで、
ちょっと時間が掛かりますし、たまに反応なしになって
固まったままとかになりました。mp3の変換は試してはいません。
短文は試しましたけど、無理に使おうと思いません。
現状だと、及第をあげれるのは、 Noahさんの
Text To Wavになりますかね。使い慣れていないので、
使いづらいのですがw
WAVへの変換中に何%終了しましたとか分かりますし、
ディスクの空き容量も表示してくれます。
Microsoft Speech PlatformをSAPI5として、
認識させる方法が出ました。
色々試している人がいるんですねぇ。
まあ、みんなで勝ち得たものなんでしょうけど。
http://ameblo.jp/ukp1992/entry-10677588452.html
http://denspe.blog84.fc2.com/blog-entry-116.html
あと、お暇な時に、Aozoravoice2をMicrosoft Speech Platformに対応させて下さい。
お手数ですが、宜しくお願いします。
aozoraVoice2は自分でも何を書いたか忘れているので、思い出すまでちょっと時間がかかりそうです。
音声ファイルフォーマットは、
「Microsoft Haruka」を使うなら「8kHz 16Bit」、
VoiceTextの「MISAKI」は「16kHz 16Bit」になるそうです。
また、まほろばのマーチンさんがSAPI5登録の初心者用のアプリを
作って下さいました。
http://mahoro-ba.net/index.php?e=1389
Microsoft Haruka を先日の方法で登録すると、Fire Vox 、Click Speakアドオンがインストールされている Firefox で起動ができなくなりました。僕が日本語化したものでも、日本語化していないオリジナルのものでも起きています。はまってしまったら、Firefoxをセーフモードで起動させて、CLC-アドオンをすべて無効化しないと、Firefox が使えません。
それ以外のソフトでは今のところ問題はないようです。
Vista以降なら、新しいVerのソフトひとつで、全てインストールされます。
変更履歴
2010/10/31 Ver.2.0
・32bit版 と 64bit版 を自動で判別するようにした。
・Server Runtime と MSSpeech Haruka を Microsoftのサイトからダウンロードするようにした。
と、SAPI5登録まで。
http://blog.livedoor.jp/blackwingcat/archives/1307612.html
Microsoft Speech Platform の環境がどんどん整っていっていますね。
頭の固い、利己的な人なので、しょうがいないて感じです。
http://mahoro-ba.net/e1378.html
sapi5化は手作業でやらないと駄目になりました。
http://denspe.blog84.fc2.com/blog-entry-116.html
でも、視覚障害者の福祉に関わりがある者としては、いつのまにかNVDAが高機能になった情報に対しては正直うれしいです。
新しく、Microsoft Speech Platform 11なるものが出ました。
http://denspe.blog84.fc2.com/blog-entry-144.html
なお、マーチンさんによる簡易インストーラは次のページ
http://mahoro-ba.net/e1542.html