2008年09月04日

aozoravoice2

先日から、再開発していた青空文庫からダウンロードしたテキストを音声ファイルにするスクリプトです。
あとからあとから、アイデアが浮かんだのでいろいろ詰め込んで書いてみました。とりあえず、このくらいの機能があればいいでしょう。
もともと自分が使うために作ったので、はじめは設定の変更もスクリプトファイルを直接編集という素っ気ないものでしたが、今回メニュー形式のものにしてみました。よかったら使ってみてください。

置き場
http://et-dev.main.jp/index.php?AozoraVoice

WindowsでSAPI5音声が入っていないと使えません。
上記の置き場所から最新版をダウンロードし、解凍してください。
readme.txtに使い方とか書いていますので、それを読んでから使ってください。

問題がまだ残っているかもしれません。もしありましたら、関連記事のコメント欄に報告お願いします。エラー報告しやすいように、エラー表示を以前のものに戻しました。エラーメッセージが出たらエラー発生の行番号も表示されるので、その行番号を一緒に教えてもらえると解決の手掛かりになります。どの作品を変換して問題が起きましたという情報もあるともっとわかりやすいです。


さて、今後も気が向いたら青空文庫関連や音声関連のソフトを書いてみたいと思っています。スクリプトで記述して自分の手の内を見せるのは、もうほどほどにするつもりですが。

次に作るとすれば、テキストファイルを元にするのではなく、ネットで直接閲覧できるXHTMLをソースにしたいです。いちいちダウンロードの操作をしなくてもいいですし、内部を見ると属性を使って情報が整理されているようですから、今回途中で諦めた著者名の抽出も簡単にできます。またアドレスで一意の文書が特定されるので、その作品だけに特定の変換をさせるという機構もすぐにできます。

それはそうと、ルビの置き換えをやってしまうと、最終的には仮名だらけの、人間にも音声合成にも読みにくい日本語になってしまいます。文学作品はできる限り作者が意図した発音にしたいので、標準でルビ置き換えの設定で読ませていますが、そのせいでかえって変な読みになってしまう可能性があります。この問題の解決策を探していくと、結局点字の文章のように、発音通りの仮名表記と、分かち書きに行き着くでしょう。最終的な目標としては、日本語を形態素解析して、自動で分かち書きにして読ませようと思っています。ついでに二倍の踊り字の精度も高められるでしょう。問題があるとすれば、僕の集中力と、最近の音声合成の分かち書きの読みの異常な下手くそさですね。そこがちょっと心配ですが。形態素解析は前にも使ったことがあるMeCabを使えば今すぐにもできそうです。

青空文庫に限定しない汎用的なものももう少しやってみたいです。クリップボードを読んだりするのや、プレイヤーのような操作性があるやつもほしいです。最初に作った textvoice というスクリプトもなんかできそうです。そういえばこの名前はmisakiさんたちの合成音声であるVOICETEXTをひっくり返した言葉になってますね。自分で名前付けておきながら、ちょっと紛らわしいです。


posted by takayan at 19:34 | Comment(18) | TrackBack(0) | aozoraVoice | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
こんばんは。

今回、aozoravoiceの紹介のやり方を変えました。

以前はこのプログラムしか紹介しなかったのですが、
今回はこのプログラムとMiyuとShowが買えるサイトを
紹介しました。だから、今回は前回よりDL数が増えたのかなと
考えています。

ここからが本題なんですが、以前は$35で買えたのですが最近では、
$35で購入出来るサイトは私が調べた限りでは壊滅状態です。

最近になってTextAloudで、旧タイプのKyoukoが$45で売られるように
なりましたが。それ以外の音声も$45に値上げになっています。円では 5.044円ですね。
http://sites.fastspring.com/nextup/product/realspeak?csid=1378

何があったんでしょうね〜て感じです。↓でも、最後で話題になっています。
ここで紹介されているサイトを、紹介したんですよ。$40です。
http://www.maruo.co.jp/honyaku/7/x01558_p1gui.html
Posted by a at 2008年09月07日 20:19
高くなっているんですね。買っておいてよかった。
それにしても、もう少し簡単に、いろんな日本語音声を手に入れる手段があるといいですよね。カードでドルを使ってというのはハードルが高すぎます。MISAKIさんも、新しいHARUKAさんもダウンロード販売すれば、十分需要はあると思うんですが。
Posted by takayan at 2008年09月08日 02:37
Misakiは業務用で取っておきたいのでしょう。要望は向こうに行っているはずですがね。

恐らく、MiyuはMisakiが出てきたから、単体で売りに出されたかも知れません。
電子かたりべは元々はMiyuで、Misakiにモデルチェンジしましたから。

Harukaは、あまり人気がないかもです。小生意気という意見もちらほら。。。
Posted by a at 2008年09月08日 21:43
こんばんは。

aozoravoice2のDL数が2000を超えました。
おめでとうございます。3月末までに超えるかなと
思っておりましたが、4月7日頃越えたみたいです。

3月中旬頃にDL数が止まっちゃって、大笑いです。

何故に、急にDL数が増えたかというと視覚障害者を
支援している団体とか、ボランティア団体(合計約30団体)
とかに音声合成や、青空文庫や、Aozoravoice2や、NVDAや、
Microsoft Speech Platformをsapi5化や、
Text To wavなどを紹介したからです。

2月上旬でDL数が1750弱で、2月15日には1884まで増えました。
Microsoft Speech PlatformとAozoravoice2のコラボが素晴らしいと
認めて頂けたようで、団体の会員の方々や、その親族方に紹介して
頂けたようです。

DL数から考えれば、5〜10ぐらいの団体には、認めて頂けたのではないかと
考えています。
Posted by a at 2011年05月17日 23:37
さて、話は変わりますが、Aozoravoice2の設定を作ってみました。
申し訳ないのですが、04 番外ルビ変換mp3 だけで良いので、
間違っていないか確認して頂けないでしょうか?
http://www1.axfc.net/uploader/Sc/so/235127
キーワード abc

テストした限りでは、問題が無かったので、大丈夫だと思うのですが。
説明文も作りました。分かりにくい場合は、こうしたら良いよと
アドバイスを頂けたらと思います。

次は、大震災の被災地宛に紹介しようかなと考えています。
視覚障害者の支援団体のみならず、県や市町村宛に紹介しようと考えています。

それ故、設定を急遽作ってみました。設定したものと、
mp3に変換したサンプルを渡してあげれば、すぐに確認とテストが出来、
時間の節約になるだろうと考えたからです。

Misaki版を作ってみました。
Posted by a at 2011年05月17日 23:42
aさん、いつもありがとう。
04番いいと思います。
このソフトのメンテナンスをしてなくて申し訳ないです。
Posted by takayan at 2011年05月23日 02:56
おはようございます。

お礼が遅くなりました、ありがとうございました。

ドタバタとやっていたので、仙台市と宮城県の方にしかまだ送っていなかったりします。

返事を待っていたというのも理由のひとつですが。

仙台市の方は、読んだら読んだて、返事を出してくれたら嬉しいですと書いたら、
返事を送って下さいました。

6月上旬の投稿から、返事が来たのは8月30日でした。
かなりお忙しいようです。

返事の概要は、仙台市視覚障害者福祉協会に紹介しましたという事でした。
それと、市のパソコンにはフリーソフトをDL出来ない為、
確認に時間がかかりました。
引き続き、視覚障害のある方の生活の向上に努めてまいりますので、
今後ともご理解ご協力の程をよろしくお願いします。

との事でした。避難所関連は、見送りになったみたいです、しくしく。

https://sourceforge.jp/projects/aozoravoice2
で、設定データなどをあげました。
Posted by a at 2011年09月11日 07:02
リンク先を覗いたら、いろいろ充実してきましたね。
これからもがんばってください。
Posted by takayan at 2011年11月05日 01:23
こんばんは。

takayanさんがお忙しいようなので、
Microsoft Speech Platform専用のAozoravoice2(aozoravoice234MSP)を
出して頂きたいのですが、如何でしょうか。

というのも、SAPI5化の方で失敗の例もあり、
一番簡単な解決方法が、Microsoft Speech Platform専用に
なると思うのです。

aozoravoice2.htaの修正点は2箇所です。

一つ目
var voiceObj = new ActiveXObject('SAPI.SpVoice')

var voiceObj = new ActiveXObject('Speech.SpVoice')

で、Microsoft Speech Platformのみ使えます。SAPI5は動きません。

参考にしたのは、電脳さんのサイトです。
http://denspe.blog84.fc2.com/blog-entry-103.html

二つ目
見出しの『aozoraVoice2は、青空文庫などのテキストファイルをSAPI5対応音声エンジンを使って、
音声ファイルに変換するプログラムです。』
   ↓
『aozoraVoice2は、青空文庫などのテキストファイルをMicrosoft Speech Platformを使って、
音声ファイルに変換するプログラムです。SAPI5対応音声エンジンでは動きません。』


setup.wsfの方もショートカットの作成の方は『aozoraVoice2MSP 音声変換』に、
send to の作成の方は、『テキストを音声に変換する MSP』に
しておけば、SAPI5の方と混在が出来ると思います。

お手数だと思いますが、検討の方、宜しくお願いします。
Posted by a at 2011年11月20日 18:10
aさん、お久しぶりです。
Microsoft Speech Platformへの対応してなくてすみません。
応急措置としては、上記の変更でも何とかなるようですが、専用として使う場合でも、他のところの変更も必要みたいです。ちょっと考えてみます。

Posted by takayan at 2011年11月21日 22:16
こんにちは、Microsoft Speech Platform と SAPI5の両方の音声合成エンジンに対応した最新版ver2.4.0を作ってみました。
http://neu101.seesaa.net/article/236658066.html
http://et-dev.main.jp/index.php?AozoraVoice
ちなみに、aさんが書いてくれた上記の修正だけでは、不完全でした。応急措置としていけそうだと書いてしまいましたが、自分でも変換の本体が、aozoravoice2.wsf だったことを忘れていました。
Posted by takatan at 2011年11月23日 17:36
おはようございます。

実は少し慌てていました。
というのも、東北大震災復興応援第2弾という訳で、
岩手の方に情報提供させて頂いたからです。

最近ツイッターを始めたのですが、私より頭の良い人に巡り合い、
その方のフォローをさせて頂いています。興味のある情報が
流れてくるので楽です。

その中のお一人で、TENTO_TWITさんがおられます。
仙台は東北大学でおこなわれたTEDxTohokuに参加なさいました。
http://tento.doorblog.jp/archives/4782645.html

それがご縁でだと思うのですが、TENTOさんのHPが
岩手震災IT支援プロジェクト go-iwate.orgに載りました。
http://go-iwate.org/ それをTENTOさんにHPで掲載されましたと
紹介されています。http://www.tento-net.com/

説明が長くなりましたが、そのご縁で、
岩手震災IT支援プロジェクトを知り、情報を提供させて頂きました。
投稿フォームで送って、2時間後くらいに返事が来たので、
ビックリはしましたが。そのHPの管理者である村山教授(女性)から

『有用なソフトウェアの紹介をありがとうございます。
ボランティア関係および被災地の福祉関係の方々に連絡し、利用してみたいと存
じます。

先ずは御礼まで。』というご返事を頂きました。
Posted by a at 2011年11月27日 07:55
いろいろ、つながりができていいですね。
TENTOというのは面白そうですね。
子どもたちに知識を与えるだけでなく、柔らかな才能を伸ばしていこうというビジョンをデザイン型の人材という言葉で明確に示しているのもいいと思いました。
Posted by takayan at 2011年11月28日 03:11
昨日青空文庫の方にコメントを入れさせていただきました松井です。
素晴らしいソフトをありがとうございます。
感謝して使わせていただいております。

ただ、「全て」を「ぜんて」と読むようなところは止むを得ないと思いますので、辞書に読みを入れていますが一向に反映しませんが、どこに注意すればいいのでしょうか?
Posted by 松井 at 2012年02月11日 18:37
松井さん、使ってくださってありがとうございます。
辞書に登録したのにそう読まない可能性としては、設定画面で辞書の使用不使用の設定を「します」に切り替えられていないのかもしれません。
切り替えたあと、内容を<標準設定>として「登録」すると、標準設定でその読みが使えるようになります。別の理由かもしれませんが。

Posted by takayan at 2012年02月14日 23:54
早速にご回答ありがとうございます。
ご指摘の通りしましたがだめでした。
私のやり方に何か問題があると思いますので
もう一度
readme.txt等を読み直してみます。
いずれにしても、このままで十分使えます。
ありがとうございます。
Posted by 松井 at 2012年02月15日 11:25
役に立てなくてすみません。
Posted by takayan at 2012年02月17日 00:59
こんばんは。

大学の方と地域が連携して、復興をしようという動きがあるようです。
そちらに、紹介をしてみました。

宮城県 http://www.myu.ac.jp/chiikicenter/index.html
福島県 http://fsl-fukushima-u.jimdo.com/
茨城県 http://renkeihonbu.ibaraki.ac.jp/
千葉県 http://www.le.chiba-u.ac.jp/koukai/index.html

おまけ
赤い羽根共同募金 - 赤い羽根メッセージボックス
http://www.akaihane.or.jp/contact/index.html

見事に、何処からもご返事を頂く事は出来ませんでしたが、
Aozoravoice2がDLされた事は確認しています。

後は、岩手県のように、福祉施設や、ボランティア団体等に、
紹介して頂ける事を祈るだけかと。
Posted by a at 2012年03月04日 19:16
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック