2010年09月20日

Microsoft Speech Platform が出てた。

最近、Windows 関連の情報を全然チェックしていなかったので、今頃になって、Microsoft Speech Platform が出ていたことを知りました。
昨日 SAPI5 のことを久しぶりに思い出して、完全なオープンソースの SAPI5 日本語音声というのは、ちょっとやり甲斐がある仕事だなと思っていましたが、これを見つけてこの気持ちは消えてしまいました。

新しい音声合成システム Microsoft Speech Platform には、ちゃんと日本語音声が用意されていました。いままでこれがないことで、どれだけ困っていたことか。Fire Vox で SAPI4 の日本語音声が使えるようにするために、XPCOMの勉強をしたり、なんかもうほんと苦労しました。

無料でインストールできる日本語の合成音声があれば、ソフトを作る側はほんとに楽になります。Aquestalk の登場で爆発的に改善されましたが、今後標準になるだろう Windows の音声合成のシステムで最初から日本語が用意されているというのは、ほんとに素晴らしいことです。欲を言えば、インストーラが日本語になりインストールがもっと楽になってくれるといいですね。将来、 iOS のようにインストールさえせずに設定画面でチェックを入れるだけで使えるようになれば、もっといいですけど。

日本語音声を使えるようにするには、次の二つのファイルをダウンロードし、インストールする必要があります。

次のページから、Microsoft Speech Platform - Server Runtime 。
Download details: Microsoft Speech Platform - Server Runtime (Version 10.2)
プラットフォームに合わせて、下記のどちらかをダウンロードし、インストール。
x64\SpeechPlatformRuntime.msi
x86\SpeechPlatformRuntime.msi

次のページから、日本語音声 MSSpeech_TTS_ja-JP_Haruka.msi を探して、ダウンロードし、インストール。
Download details: Microsoft Speech Platform - Server Runtime Languages (Version 10.2)


開発者は、さらに次の Microsoft Speech Platform - Software Development Kit (SDK) も。
Download details: Microsoft Speech Platform - Software Development Kit (SDK) (Version 10.2)


詳しいインストールの仕方は、既に詳しい記事がいくつか書かれているので、そちらを見てください。

特に、aさんも紹介してくれたこのサイトの記事は、とても詳しく書かれています。
Microsoft Speech Platform の日本語音声合成エンジン - 電脳スピーチ blog
インストールできたら、ここで公開されている spcbght.bat で試してみましょう。入力文字の読み上げから音声ファイルの作成までたいていのことができます。

ただし、これは10.1用の記事で、記事の中にもあるように現在のバージョンは10.2です。Microsoft Speech Platform 10.2 - 電脳スピーチ blog

それから、読み上げソフトの SofTalk が2010.08.31に Microsoft Speech Platform に対応していました。最近 Aquestalk2 にも対応しました。
SofTalk - トップページ



SDKの中の sapi.h をsapi5のものと見比べてみると、sapi5からバージョンアップされたもの以外の何物でもないのがわかります。よく見ると、sapi.h内で_SAPI_VER が0x055に定義されていて、16進数ですが、これは sapi5.5 を意味していると考えて差し支えないでしょう。
それでも、SAPI5 のようにコントロールパネルで操作できないし、内部の名前もいくつか違っているので、sapi5のシリーズの延長線上にある別物という位置づけなのでしょう。プログラムを作る側としては、sapi5ととてもよく似ているので、新しいことを覚えなくてすむため、移行や併用が簡単にできるので、少なくともその点だけはありがたいです。


拍手する
posted by takayan at 00:40 | Comment(13) | TrackBack(0) | 音声合成 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
こんばんは。

私が知る限り、Microsoft Speech Platformに
対応している読み上げソフトで、
かつ、こちらで既出ではないもので、Text To Wavが
あります。てか、ここで Platformを知りました。
http://noah0.blog119.fc2.com/blog-category-2.html

こちらのサイトで、話題になっているSofTalkは、
読み上げは良いのですが、最新版でもwav出力が
使い物になりません。

spcbght.batの方ですが、小説を貼り付けると、
動作が不安定な感じですね。小説の貼り付けが完了するまで、
ちょっと時間が掛かりますし、たまに反応なしになって
固まったままとかになりました。mp3の変換は試してはいません。
短文は試しましたけど、無理に使おうと思いません。

現状だと、及第をあげれるのは、 Noahさんの
Text To Wavになりますかね。使い慣れていないので、
使いづらいのですがw 

WAVへの変換中に何%終了しましたとか分かりますし、
ディスクの空き容量も表示してくれます。
Posted by a at 2010年09月22日 23:49
aさん、いつも情報ありがとうございます。変換中に、%表示があるのは、便利ですね。
Posted by takayan at 2010年09月24日 01:33
こんばんは。

Microsoft Speech PlatformをSAPI5として、
認識させる方法が出ました。
色々試している人がいるんですねぇ。

まあ、みんなで勝ち得たものなんでしょうけど。
http://ameblo.jp/ukp1992/entry-10677588452.html
http://denspe.blog84.fc2.com/blog-entry-116.html

あと、お暇な時に、Aozoravoice2をMicrosoft Speech Platformに対応させて下さい。
お手数ですが、宜しくお願いします。
Posted by a at 2010年10月18日 22:42
aさん、これはいい情報をありがとうございます。ただレジストリをいじるのは危険なので、もとに戻す方法がわからない人はやらないほうがいいでしょう。
aozoraVoice2は自分でも何を書いたか忘れているので、思い出すまでちょっと時間がかかりそうです。
Posted by takayan at 2010年10月19日 01:46
はい、全然急いでおりませんので、無理の無いようにお願い致します。

音声ファイルフォーマットは、
「Microsoft Haruka」を使うなら「8kHz 16Bit」、
VoiceTextの「MISAKI」は「16kHz 16Bit」になるそうです。

また、まほろばのマーチンさんがSAPI5登録の初心者用のアプリを
作って下さいました。
http://mahoro-ba.net/index.php?e=1389
Posted by a at 2010年10月26日 23:17
どんどん環境が整っていっているようですね。
Microsoft Haruka を先日の方法で登録すると、Fire Vox 、Click Speakアドオンがインストールされている Firefox で起動ができなくなりました。僕が日本語化したものでも、日本語化していないオリジナルのものでも起きています。はまってしまったら、Firefoxをセーフモードで起動させて、CLC-アドオンをすべて無効化しないと、Firefox が使えません。
それ以外のソフトでは今のところ問題はないようです。
Posted by takayan at 2010年10月27日 02:45
マーチンさんが、新しいVerを発表されました。

Vista以降なら、新しいVerのソフトひとつで、全てインストールされます。

変更履歴
2010/10/31 Ver.2.0 
 ・32bit版 と 64bit版 を自動で判別するようにした。
 ・Server Runtime と MSSpeech Haruka を Microsoftのサイトからダウンロードするようにした。

と、SAPI5登録まで。
Posted by a at 2010年10月31日 20:10
win2000でも、裏技で動くようです。
http://blog.livedoor.jp/blackwingcat/archives/1307612.html
Posted by a at 2010年12月26日 21:43
aさん、いつもありがとうございます。
Microsoft Speech Platform の環境がどんどん整っていっていますね。
Posted by takayan at 2011年01月04日 18:21
NVDAの仕様変更に伴い、まほろばのSAPI5化のページが削除されちゃいました。
頭の固い、利己的な人なので、しょうがいないて感じです。
http://mahoro-ba.net/e1378.html
sapi5化は手作業でやらないと駄目になりました。
http://denspe.blog84.fc2.com/blog-entry-116.html
Posted by a at 2011年04月24日 18:52
ちょっと不便になって残念ですね。
でも、視覚障害者の福祉に関わりがある者としては、いつのまにかNVDAが高機能になった情報に対しては正直うれしいです。
Posted by takayan at 2011年04月25日 00:08
お久しぶりです。

新しく、Microsoft Speech Platform 11なるものが出ました。
http://denspe.blog84.fc2.com/blog-entry-144.html
Posted by a at 2011年09月11日 06:38
aさん、いつもながら情報ありがとうございます。

なお、マーチンさんによる簡易インストーラは次のページ
http://mahoro-ba.net/e1542.html
Posted by takayan at 2011年11月05日 01:19
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック