10月 04
はじめに
先日、Mac用自動音声プログラム(フリー)版を入手しつつ、
Saykanjiを改造し遊んでましたが、これと言ってパソコンが日本語で喋って
便利と思うは余り思い浮かばない。(逆に五月蠅く感じることもある)
しかし、改造版Saykanaは表面的な部分を弄っているに過ぎないが、
使用している機能は優れたソフトウェア群だ!と思う。
っと言うことで、漢字の読み書きも苦手ななので、青空文庫の読み上げ
スクリプトを作ることにしました。
-2009.10.03 プロトタイプ:(字幕+音声で漢字の読み方を勉強等):誤字脱字多し
-2009.10.07 追記:az_speech.sh v1.1 :説明不足気味
目的
- 秋の夜長、読めない漢字の本でも読んでみたい。
- 音楽鑑賞もいいけど、ラジオ代わりに使えたらいいかな。
動作環境
| OS | CPU | 備考 |
| Mac OSX 10.6.1 | Intel Core2Duo | MacBook |
| Mac OSX 10.5.8 | PPC | PowerBook G4 (未確認) |
前提
- 改造: saykanji on saykana
- この改造が済んでいること。
- 読み上げスクリプトは、青空文庫ファイルを読み込み適宜整形後、saykanji,mecab,saykanaにデータ処理を委譲する。(これだけ)
- CUI環境で動作。(GUI環境を目指し開発すると、今年の秋は終わってしまう)
- 青空文庫の提供ファイルを使用する。
以下の、最も簡単そうなNo.A.1に対応する。
「青空文庫取扱ファイル種別一覧」(記入もれの可能性あり)No.A. ファイル種別予定 対応予定 備考 1 テキストファイル(ルビあり) 実装中 2,3ファイルテスト済み 2 XHTMLファイル 未定 3 エキスパンドブック・ファイル 無し 4 PDF 無し 5 TTZ 無し
構成ファイル一覧
| No.B. | パス/ファイル名 | 説明 | 備考 |
| 1 | az_speech.sh | 青空文庫読み上げ | (仮名)名前が長すぎる |
| 2 | *.zip | 青空文庫取扱ファイル種別一覧 No.A.1で圧縮版 | |
| 3 | *.txt | 青空文庫取扱ファイル種別一覧 No.A.1で解凍版 | スクリプトに指定する |
| 4 | 〜/tmp/aozora.*.txt | No.A.1 *.txtの整形版 | スクリプトが作る |
| 5 | .aozorarc | 環境設定ファイル | 記録保存に使う予定 |
機能
- 前提通り、指定したNo.B.3を指定すると字幕と音声で読み上げが一気に始まる。
不満な点
- 何度か使ってみると、使いにくい箇所はでてくる。
- 停止・再生ができない。
CTRL+s,CTRL+qは出来ますが、そんな意味でなくて。 - また聴きたい本のファイル名が分からない。(覚えるのが面倒)
スクリプトで書籍管理ができれば有り難いかも。- 書庫一覧
- 読書状態の確認
停止位置からの再開は欲しいな。巻き戻しは出来るかな・・・ - 青空文庫からの調達
これはWebで出来るので、わざわざ作らない。
現状では圧縮・解凍・整形の3種類のファイルがあるので、
最小限に残せれば良いのかな。
- 停止・再生ができない。
実装済み
- 字幕・音声表示(字幕は端末に垂れ流し)
- 各種起動オプション
- saykanaに渡すオプション
- 主にデバッグ用ですね。本スクリプト/saykanji/mecab等の最終変換結果を見るとか。
実装予定
以下、不完全、本単位で出来たら便利かな。
- 済み:
読書状態の保存 - 済み:
保存状態からの読書の再開
使用例
- 上述より、Safariで青空文庫からzip入手し、Finderで解凍する。
- Finderで解凍してできたファイル(仮ファイルA.txt)とする。
- スクリプトに指定する。
$ az_speech.sh -i 仮ファイルA.txt
ここで問題が無ければ、読み上げが始まる。
- 起動オプション
-G,-D, -S 2, -f ,-V 等がありどれも状態を確認するものなので、- -v {m1|f1}
m1 か f1 を指定することで、男女の声質が変わる。
saykanaの元々の機能です。 - -s [50-300]
読み上げスピードが変更 (早い(0) > 普通(100) > 低速(300))
saykanaの元々の機能です。
- -v {m1|f1}
- 起動オプション
スクリーンショット
スクリーンショットは以下のコマンドの実行中のものです。
$ az_speech.sh -i rashomon.txt
読み上げスクリプト(Download)
備考
- 拝聴
- ドグラ・マグラ
ルビ関係の変換で何度か聴きました。
ルビ入りで、”「こ」わ「ご」わ”だったかな、うまく変換できませんでした。 - 人間失格
一度読んだことあり、スクリプトの確認で使ってました。
これは1行が文末の「。」までが長いんです。
いいデータになりました。 - 羅生門
3,40分で聞き取れます。内容は別として。
短編だったのかな。「京都」は「みやこ」と変換するんだ。
スクリプトでも読めない漢字が少しありましたが、気にならないかな。
って、さて聴こうと思ったら終わりでした。
- ドグラ・マグラ
