書籍のPDF化;拡大してもぼやけない。

雑誌を複合機のスキャナーでPDFにしてみたが出来たデータは容量が巨大でしかも文字が薄かったり、拡大すると文字がぼやけてしまった。そこでOCRソフト「読取革命Lite for Mac」を使ってこれを解決してみました。

必要なもの。
〇読取革命Lite for Mac(読取革命に同梱)
〇Microsoft Word(Mac版)
〇Mac;MacOS 10.11を使用(MacOS High Sierraではソフトが未対応)
〇スキャナー(読取革命から直接スキャン出来るのはキヤノン製のもののみでEpson製の場合、スキャンした画像ファイルを用いる)。
スキャンの解像度はソフトでは400dpiを指定しているが、それ以下でも使えます。

手順。
1、今回はB5版の200ページ程の雑誌だったのでそのままスキャンすると厚過ぎてうまくスキャン出来ないので本をバラバラにしてスキャンすることにしました。
2、スキャン。解像度は200dpi。

読み取りプロ
読取革命Liteの画面

3、読取革命Lite起動。
4、画像ファイルを開く。
自動的にレイアウトが表示されます。
5、認識。
認識ボタンをクリックすると自動で認識されます。
手動で認識する場合には文字、表、画像に分けて領域を設定し、枠内をダブルクリックして属性変更をする。
認識結果で結果チェック。違っている場合、編集。画像は表示されません。
6、保存をクリックし、名前を入力。次にファイルタイプをRTFに指定。
7、読取革命Liteを終了。
8、Wordを起動。
9、読取革命で保存したファイルを開く。
10、ファイルの保存を選択し、ファイルの種類をPDFにする。

結果。
(1) スキャンしたままのPDF;1.5MB/枚
(2) 同上(iPadのiBooksで拡大表示)
(3) (1)のファイルをプレビューでサイズ圧縮;30KB/枚
(4) 同上(iPadのiBooksで拡大表示)
(5) 読取革命Lite、Wordで作成したPDF;106KB/枚
(6) 同上(iPadのiBooksで拡大表示)

ORG1
スキャンしたままのPDF

ORG拡大1
スキャンしたままのPDF(拡大表示)

ORG圧縮1
スキャンしたままのPDFをプレビューでサイズ圧縮したもの

ORG圧縮拡大1
スキャンしたままのPDFをプレビューでサイズ圧縮したもの(拡大表示)

読み取り1
読取革命Lite、Wordで作成したPDF

読み取り拡大1
読取革命Lite、Wordで作成したPDF(拡大表示)

最後に。
スキャナーでPDF出力したものは写真をPDF変換しただけのもの。だからデータ容量が大きい。また、写真の色彩が薄かったりすると見づらい。データ容量を減らすためにMacOSのプレビューでQuartzフィルタを使った場合、文字を含めぼやけて非常に見づらくなります。
読取革命は写真から文字を抽出してデータにし、WordでPDFにしたものはTrue Typeフォント。拡大してもぼやけません。ファイル容量で比較した場合、文書中に画像無しの場合、B5版で、スキャンしたままのPDFでは 約1.5MB/枚、読取革命を使ったものは約106KB/枚でした(一例として)。
それからバラバラにした雑誌は折角買ったのですから、製本用のりを使って元に戻しました。