テキストファイルを分割して、音声ファイルを作る

23.02.15
ネット上で、著者の没後50年を経過したことで著作権が消滅した文学作品や、著者が無料閲覧を許可した作品を公開している「青空文庫」からダウンロードしたファイルを音声に変換して聴くことを考察。
前のページで音声変換ソフトの紹介をしたが、長文の音声ファイルの再生には時間を要し、どの部分を再生しているのか、判断がしにくい。そこで、原本のファイルを分割して 音声に変換することを考察。

使用した原本のテキストファイル

夏目漱石原作:我輩は猫である。(neko_00.txtファイル以外ダウンロード不可)
我輩は猫である.txt:641KB   neko_00.txt
我輩は猫である.wmv:1GB (再生時間19時間14分)
我輩は猫である.mp3:207MB (再生時間19時間14分)
我輩は猫である.pdf:1.4MB (横80文字、縦80行、95頁)

このページで解説しているフリーソフトです

テラパッド:テキストエディタ   tpad093.exe 681KB
メディアコーダー:音声ファイルの変換    mediacoder-0.7.5.4710.exe 24MB
MP3Gain:MP3ファイルの音量調整    mp3gain-win-1_2_5.exe 651KB

再生用に考察した機器


左は、mp3ファイルを再生するミュージックプレイヤーです。SDカードもしくはUSBメモリーを差し込むと、朗読文や音楽を再生します。大きさ8cmの立法体、電源はusb接続、充電池内蔵です。
廉価だったので、表示部なし。 これが問題です。どの部分を再生しているのかが不明で、ファイルの途中からの再生は不可能です。ながら再生の機器ですので簡便なのが取り得です。ファイルはスイッチで選べますが、ファイルの中の途中からの再生は出来ません。

ファイルの分割とmp3ファイルへの変換の方法

テキストファイルの分割

左は、フリーソフトのテキストエディターのテラパッドです。
テキストファイルを分割するときには注意が必要です。どこで分割するかを考えないとどこを再生しているのかが不明です。幸いなことに「我輩は猫である」は11章から出来ているので、先に原本を11個の文章に分割します。 原本を11個コピーします。それに1から11まで番号を振ります。 1ファイルづつ、テキストエディターに取り込み、前後の不要な部分を削除してヘッダー部分に1個目と同じ様にファイル名を記します。番号は順に送り最後はその11です。

  吾輩は猫である  その1
  夏目漱石

これで、ファイルの朗読の最初にファイルの番号を読みます。 分割したファイルを前頁の「青空ろーどく」に読み込み、音声ファイルとして保存します。WAVファイルが11個完成します。

WAVファイルのMP3ファイルへの変換

左は、フリーソフトのメディアコーダーです。
多くの機能があります。ここでは、WAVファイルをMP3ファイルに変換します。 下図の「ファイル名」とある窓にファイルをドラッグドロップし、その下の「エンコーダ」の箇所から変換先のファイル形式を選び、上部の「START」ボタンを押すと変換されます。MP3形式でいくつかありますので、いくつか実行して再生し、音質を調べ適当なものを選びます。変換したファイルのサイズが小さいものは音質も劣化します。


MediaCorder Wav を Helix MP3 に変換する画面

11個のWAVファイルをMP3形式に変換して完成します。
MediaCorder はCDからも音楽を取り込めます。再生しながらではなく、データとして変換するので短時間で変換が終わります。

MP3ファイルの音量の均一化

左は、フリーソフトのMP3gainです。
再生したときに音量が色々あると調整が面倒です。その時には音量をそろえます。
パス/ファイルの窓にMP3ファイルをドラッグドロップし、ボタン「トラック分析」を押し現在の音量を調べ、結果の目標音量を設定し、ボタン「トラックゲイン」をクリックするとファイルの音量を同じように設定します。


目標音量を80dbに設定。トラックゲインを実行したあとの画面

MP3ファイルをSDカードに書き込む


あとは、完成したMP3ファイルをSDカードに書き込み、冒頭のミュージックプレイヤーに差し込んで再生すれば完成です。
このときにフォルダーで分割したり、フォルダーごと書き込むと認識しません。SDカードのファイルリストはファイル名の羅列にします。

蛇足:WAVファイルからそのほかのファイル形式への変換

ファイル形式
容量  
原本・1握の砂.txt
29KB
原本・1握の砂.wav
50.2MB
PE.ape
27.3MB
FAAC.aac
5.1MB
FFmpeg.mp3
25.1MB
FLAC.flac
27.3MB
Fraunfofer.mp3
50.1MB
Helix.mp3
9.2MB
LAME.mp3
25.1MB
Nero Encoder.m4a
2.3MB
Speex.spx
5.4MB
Volbis.ogg
6.9MB
Waveform.wav
50.2MB
WavPack.wv
27.3MB
WM Encoder.wma
38.2MB

上記のメディアコーダーを使って、変換が可能なファイル形式にエンコードしてみました。
原本・1握の砂.wav,50.2MB は、結果がわかり易い様に、テキストファイルを少し削除して、約50MBになるように最初に加工しています。
変換時にファイルが不足して変換不可能な形式のものは割愛しています。また、 ウィンドウズ標準のメディプレイヤーで再生不可能なファイル形式も含んでいますので、正しく変換できたのか不明なファイル形式もあります。
これを見ると多くのファイル形式があり、それを再生する方法も千差万別ある、ということも解ります。
今回、MP3形式のファイルのいくつかをSDカードに書き込み、冒頭のミュージックプレイヤーで再生し、その結果、Helix.MP3 形式を使っています。原本の約1/5のファイルサイズです