2010年08月17日

GNOME Orca で MBROLA と mecab を使って日本語をしゃべらせる方法

注意:
このプログラムは実験的なものです。自己責任でお使いください。
動作が確認できたのは Ubuntu10.04 です。
それ以後では動作しません。インストールしないでください。
2011.10.18

そういうわけで、Ubuntu上で日本語スクリーンリーダーを動作させる方法です。
以下に必要なファイルと、手順を示します。興味がある人は自己責任で試してみてください。

現在確認しているOS は Ubuntu 10.4 だけです。
orca ですので、GNOME デスクトップが動いているディストリビューションでも、動くかもしれません。問題があるとすれば、今回利用している mbtts がそのディストリビューションで使えるかどうかです。

TTS として、以前僕が作った mbtts というものを使います。これは、日本語のテキストを、mecabにより日本語形態素解析を行い音素文字列に変換し、それをMBROLA の日本語音素を使って音声に変換するものです。ruby で書かれた吉田 智章氏の muDaTTS を参考にして、Pythonで書いたものです。今回、orca への対応のためローマ字の逆変換など機能追加や修正を行いました。

以下インストール手順です。
[2010/08/19 orca-2.31.90へ対応のため修正]
[2010/08/30 mbtts 97.6への対応]

1. 下記のリンクより mbtts 0.97.6 をダウンロードし、展開後 mbtts.txt で示してある手順で、必要なパッケージと、mbtts 本体をインストールします。このとき MBROLA の日本語音素データベースを所定の場所に必ず一つ入れてください。
https://neu101.up.seesaa.net/etc/mbtts-0.97.6.zip

2. orca のソースを 下記の GNOME の ftp からダウンロードします。今回は バージョン2.31.90 を使っていますので、それをダウンロードしてください。
orca-2.31.90.tar.bz2

3. orca で日本語を再生できるようにするためのファイル群をダウンロードします。今回作ったものそのものです。
https://neu101.up.seesaa.net/etc/orca-2.31.90-mbtts-files-0.3.tar.gz
(0.3 ... 初回起動時に選択できない問題を修正 2010/10/13)

4. 2でダウンロードした orca-2.31.90.tar.bz2 ファイルと、3でダウンロードした orca-2.31.90-mbtts-files-0.3.tar.gz ファイルを同じフォルダに入れ、次のコマンドを実行してください。問題がなければ、これで日本語に対応したOrca がインストールされます。今回 intltool を最新版にする必要があるようなので、下記のように configure の前に sudo apt-get install intltool も実行する必要があります。
sudo apt-get install intltool
tar xvfj orca-2.31.90.tar.bz2
tar xvfz orca-2.31.90-mbtts-files-0.3.tar.gz
cd orca-2.31.90
./configure
make
sudo make install

5. Orcaの起動は、「アプリケーション」メニュー>「ユニバーサル・アクセス」>「Orca スクリーン・リーダと拡大鏡」です。初回起動のときは、質問をいろいろされると思います。これはあとから設定画面で変更できます。日本語の音声にならないときは、設定画面を開き、読み上げシステムを mbtts に切り替えて、右下のOKボタンを押せば、日本語をしゃべるようになるはずです。

できないこと
・句読点などの読み上げレベルが変更できません。
・漢字変換を読み上げません。
・そのほかいろいろ

まだ完全な機能ではありませんが、これで Ubuntu で日本語スクリーンリーダーを使えるようになりました。


posted by takayan at 03:44 | Comment(0) | TrackBack(0) | GNOME Orca | このブログの読者になる | 更新情報をチェックする