子供の棚を確保するため、小さい本棚を丸々一本空けました。
![Dsc_1553 Dsc_1553]()
昔、実家で山のようにあった本を、数度の引越しの後、一人暮らしするときに、この小さな一本の本棚に収まるまで絞込み、あるいは捨てあるいはあげ、あるいは古本屋に売って減らした結果、100冊まで減らした経験があります。数百分の一の冊数にしたわけです。
その後なんだかんだで増えてしまっていますけれど、減らすというのも楽しいものです。
さて、今回は、書籍の自炊です。それもコミックではなく、お気に入りの小説についてです。iPad以降、ずいぶん一般的になって、ドキュメントスキャナも裁断機も自炊に適した機種が販売され、普通に購入できるようになっています。いい時代です。
今回、本棚を空けるために色々処分しましたけれど、このうちの多くは、場所をとらない電子書籍で買い直せるから、という理由で処分できたものも多いです。kindle Paperwhite 3Gで読めるからいいじゃないということです。
少し脇道にそれますけれど、今のAmazon kindle本や、楽天kobo kepub本は、DRMによって縛られて、囲い込まれて、ごく限られた閲覧ができるだけというものです。
本来は、DRMフリーの電子書籍(日本語ePub3形式のハリーポッター本など)が、当然あるべき姿ですが、Amazon kindle本や、楽天kobo kepub本はずいぶん違います。その企業のごくごく限られたプラットホームでの閲覧がゆるされているだけです。これも使い道はあって、一度読んで古本屋に売ってしまうとか、図書館で借りて読むような本については、こういった囲い込まれた限定的な電子書籍でも問題はないとも言えます。
koboは楽天の志を信じられなさそうだから、Amazonと心中するつもりでkindleで行くことにするというのは、そういうごく限られた選択肢の中でやむを得ずしている行動ですから、やっぱり寄らばAmazonの陰だと思ってしまったり、koboの立ち上げのひどいところをことさらにあげつらったりするのも、何かそもそもおかしいような気がするものです。
本来、楽天ポイントでkoboの電子書籍を買い、kindleのクラウトを利用して未読管理をして、SONY Readerで頁をめくって読めるようになるのが当然なのだと思っています。ベータマックスはなくなりそうだからVHSにしようということではないでしょう。
ぼくは電子書籍を数百冊データで持っていますけれど、kindle本の使い勝手などはそれなりに便利だと思いますので、そちらで買うこともあります。
でも、数万冊を百冊に絞り込んだ結果のような、お気に入りの本については、ある特定の会社の電子書籍閲覧環境に縛られているようなのは、自分のためには良くありません。もちろん、著者に投げ銭するために利用という使い道もありますので、そういう意味ではとても良いよね、とも思っているわけです。
お気に入りの本が電子書籍で出ていれば、紙の本を持っていても、著者にお金を払うために買い直したりもしています。これはフリー版もあるけどドネーション版や有償版のアプリケーションソフトを購入するような感覚のことです。
さて、お気に入りの本が電子書籍になっていない場合です。ここで自炊に話が戻ってきました。
裁断してドキュメントスキャナでスキャンして、たとえばJPEG(ZIP)とかPDFとかのファイルにして、画像を見るように見るのが、今一般的なやり方です。
ぼくの場合は幼児がいるので200DXなどの裁断機はあきらめ、カール事務器 ディスクカッター DC-210N
で切ります。ここはたいして手間が増えるというほどでもないところです。裁断機と比べると安価で場所をとらず薄型軽量です。
つぎにFUJITSU ScanSnap iX500 FI-IX500
でスキャンします。
ScanSnapはずいぶん古い機種から使った経験がありますけれど、この最新機種はOCRが速いのがとても助かります。あらゆるスキャンをOCRオンでやっています。そのために特に遅くなるということもありません。ここはずいぶん進化したものだと感心します。
自炊本のときは何も考えずスーパーファインです。(それ以外の紙類はノーマルです) この辺りも、最近の機種では細かい設定が不要で助かります。
さて、OCRテキスト付きPDFにするわけです。これを少し調整する程度でタブレット端末などで読むのが現在一般的な自炊でしょう。
このPDF自炊本は問題があります。kindleやkoboや、スマートフォンやタブレットのアプリで、もちろん画像を見るように閲覧できるのですけれど、たとえば歩きながら読むときは字のフォントサイズを大きくして読みたいとかということはできません。画像なので、ズームしても自動で折り返して表示してくれません。ぼくにとっては、論外です。結局のところ、よほど時間が余ってどうしようもないときにタブレット端末を持っている場合でなければ、読みませんから。ぼくは今は首都圏の長時間電車通勤とは無縁なので、そういうことになりません。
つまりぼくにはリフローは必須です。そうすると、画像閲覧方式ではなく、テキストを処理する前提になります。
言い直すと、タブレットに縛られずに、お気に入りの本を持ち歩こうとすると、画像形式だけでは不満があるということです。
様々な画面サイズの様々な端末で、好きに読めるようになりたいということです。
![Dsc_1552 Dsc_1552]()
テキスト形式が一番汎用性があるのですけれど、kindleやkoboなどの最近流行のeInk端末ではシフトJISテキストをそのまま読んで縦書きで表示するような芸当とは無縁です。残念なことです。そろそろSONY Readerの新機種が発表されていい頃ですから、そちらに期待して待っています。縦書きはePubなりにしないといけないところなのかもしれません。どうもこのあたりも釈然としませんけれども。
先にハリーポッターで話題に出た、ePub形式が電子書籍では今後の主流と言われていて、実際koboではePubに独自DRMを付加したkepub形式を中心にしています。
ぼくも自炊本のテキストをePub形式にすると、ほぼどのプラットホームでも快適に読むことができるようになります。Androidアプリで言えば、kindleでもkoboでもSONY Readerでも、この日本語縦書きePubは快適に読書ができます。もちろんフォントサイズも自由に変えられます。
kindleも、大分ePubの対応環境が進みつつあるようです。
Amazon自らKindleGenというツールを提供しています。ePub形式の書籍をこのツール放り込むと、kindleで読めるmobi形式に変換してくれます。ぼくが自炊で作ったePub形式の縦書き日本語電子書籍をkindlegenにかけると、kindle PaperwhiteやAndroid kindleアプリで縦書き日本語として読める電子書籍のmobi形式に変換してくれます。残念ながらiOSアプリはこの形式での縦書きに未対応のため、iPadやiPhoneでは横書きになってしまいます。ぼくにはiPadは幼児のおもちゃでiPhoneもあまり使っていないので、どうせ対応は時間の問題だろう程度で気になりませんけれど、ここは気になる人もいるかもしれません。
スキャンしたPDFをどうやってePubにするかですけれど、これは大変時間はかかるけれど単純です。
ScanSnapなどのドキュメントスキャナでスキャンするときにOCR機能をオンにしておきます。先ほど触れた最新のiX500なら、それによってスキャンが特に遅くなることもありません。
PDF形式のファイルは普通にAdobe Readerでそのまま開きます。Windows版のAdobe Readerなら編集メニューの「ファイルをクリップボードにコピー」を選べば、Windows標準のワードパットに貼り付けられるようになります。
ぼくはWindows環境の場合、テキストエディタは秀丸を使っているので、貼り付けたワードパッドでCTRL+A、CTRL+Cで再度コピーし直して、秀丸に貼り付けてから作業します。
ここからは単純な校正作業です。ふりがななどを青空文庫形式の《》に入れて該当箇所に移動したり、頁数や章などを削ったり、誤認識を訂正したり、不要な改行を除去したり、字下げをしたりといった全くの単純作業です。本によりますけれど、大体1冊10時間程度の単純作業です。
テキストは青空文庫形式の注記でふりがなや字下げなどを校正します。
最後までざっと校正したら、AozoraEpub3の出番です。素晴らしいツールです。青空文庫形式のテキストをドラッグアンドドロップして、変換を押すだけです。ぼくは表紙の画像一枚だけ追加でドラッグアンドドロップします。
楽天koboで読むことを考えて、kepub.epubで出力しておきます。ここからkidle用mobi形式には、前述のkindlegenで一発変換して終わりです、kidlegenはコマンドラインツールですけれど、Windowsならエクスプローラでヂラッグアンドドロップすれば自動的にmobi形式を元ファイルと同じフォルダに出力してくれます。
つまり、青空文庫形式テキストにさえしてしまえば、あっという間に日本語縦書きePubに変換できてしまうわけです。
![Aozoraipub Aozoraipub]()
校正作業は時間がかかりますけれど、特に複雑なことはありません。秀丸マクロも、さほど使わずキー割り当てやキー操作の再生程度でひたすらがりがり校正していくだけです。日本語の読み書きができれば誰でもできる作業です。
ただ、一冊に数時間から十数時間をかけてテキストの校正作業をするには、よほどその本が好きでないと、苦痛になるかもしれません。でも、何十回も読み返しているお気に入りの本でしたら、別に苦痛というより、少しゆっくりと言葉の使い方も味わいながら読み返しているようなものです。ついつい深夜まで過ごしてしまう楽しい作業とも言えます。
時間がかかるので、どんな本でもこんな作業をするわけではありません。実際、ドキュメントスキャナでは色々なものをスキャンしていますけれど、OCRテキストの校正をするのは百分の一といったところでしょうか。
そうして、お気に入りの小説を、いつでもどこでもどの小箱でも、快適に楽しめるようになるわけです。
なお、お気に入りの本は、紙でももちろんとってあります。自炊のために裁断スキャンするのは別途買いなおした本ということになります。電子書籍にもなっていれば電子本ももちろん別途購入しているわけです。お気に入りの本は最低3冊買うというのは、昔から常識なので、別に変なことではありませんね。貸し出し用が自炊用に変わったくらいの話でしょうね。
このため、追加入手困難な本については、裁断自炊の対象にできません。文庫本ですら、ダーコーヴァシリーズとか、新刊書店はおろか古本屋をくまなく巡っても、なかなか見つけられません。OCRをあきらめて全部手打ちでテキスト起こしすればいいわけですけれど、さすがに今はそこまでの時間は取れません。PDFを表示しながらテキストエディタで校正するのに比べ、紙の本を固定したり頁をめくったりしながら大量のテキスト打ち込みをミスなくするのは、幼児の相手をしながらできることではありません。
もちろん、DRMフリーのePub3形式で販売してくれれば、一も二もなくそれを買います。手間を考えたら安価に決まっていると思いますから。でも、なかなかそういうようになりませんね。まだまだ何年も何十年もかかるのかもしれません。ハリーポッターやオライリーの一部の電子書籍は既にそうなっているわけですけれども、それ以外はまだまだ間違った道を歩み続けるのでしょうね。
企業の行動はどうあれ、自分のお気に入りの小説を、時間を掛けて自分で電子書籍にして、eInkや好きな小箱でいつでもどこでも読めるようになっっているのです。これがいつの間にかDVDリッピングのように違法にされたりしないことを願っています。
何十回も読み返したお気に入りの小説とか、もしありましたら。今ならまだ紙で買い足せるんじゃありませんか?