スキャナーで取り込んだ文書のPDF作成、編集について
ここではMac OS Xでの話として理解して下さい。
PDFは取説、マニュアルを見るために印刷物代わりに利用しています。取説等のPDFはネット上から得られるものが多いですが、中には無いものがあります。その場合は、スキャナーを使って、画像を取り込み、Mac OS XのプレビューでをPDFに変換することが出来増すが、スキャンする書類の状態によっては出来たPDFが読みにくい場合があります。特に文字がぼやける場合がありまっす。画像を修正してからPDFに変換するのも良いですが、もう少し突っ込ん、文字の編集、修正をふまえた、変換ソフトについて簡単に解説します。
方法
1、スキャンしたデータ(JPEG)をMacのプレビューでPDFに変換し、それをPDF→WORD変換ソフトを使って、変換して、WORD或はPages等で修正する。
2、スキャンしたデータ(JPEG)をOCR機能を持った、画像からWORD等の文書に変換するソフトを使って編集を行う。
1の場合
例えば、「PDFから簡単変換!」(Wondershare PDF Converter)というのがあります。Pro版もあり、OCR機能が使えます、現在、Macでは日本語には対応していない。
これはPDFをWORDで使える文書に変換する。ただ、文書と言っても画像から変換した画像データであるため、WORDで開いても、画像とし開かれる。Pro版の場合、OCRにより、文字認識が行われるため文字は文字として変換され、編集可能となります。Windows用体験版で試したところ、認識が自動であるため、認識結果にバラツキがあった。
使い方
(1)画像ファイルの文字部分が見え易くするための調整をする(シャープネスを強くするとか)。
(2)プレビューで開き、PDFで保存する。
(3)「PDFから簡単変換!」を起動。
(4)PDFファイルをドラッグ&ドロップするか、メニューから開いて登録し、保存形式を選択し、変換すれば完了。
○文書の修正の仕方。
空いている部分に文字を入れる場合、テキスト入力ボックスでテキストを入力し、それを適切な位置にドラッグ&ドロップする。
既に有る文字を修正する場合、長方形の画像を作り、修正する文書にかぶせる。長方形の画像の色は文書のバックの色と同じにする。テキスト入力ボックスでテキストを入力し、それをドラッグ&ドロップする。テキストは最前面にしておきます。
グラフィックについても同様。
2の場合
Macでは日本語のOCR機能付きの画像変換ソフトは「読取革命Lite」以外、見た事がありません。このソフトはCanonの複合プリンター、スキャナーにバンドルされていて、単体としては、「読取革命」(Windous版)にMac版として同梱されています。
このソフトはスキャナーで文書を読み取るか、或はスキャンしたデータ(JPEG)を読み込み、WORD文書やテキストに書き出します。WORD用の文書はWORDがインストールされていないと出力出来ない。
操作画面は、画像、レイアウト、認識結果の3つに分かれています。レイアウト画面で領域設定をします。認識結果画面ではテキストのみ表示されますがWORDにデータが送られる時にはテキスト、画像が認識された通りに送られます。
OCRは認識能力の関係から、小さい文字やかすれた文字を含め認識ミスもあります。また、斜体文字、手書き文字、特殊記号は認識しませんのでWORDでの編集で修正が必要になります。
使い方
(1)画像スキャン又は画像データの読み込み。
(2)領域設定;文字、表、画像で分ける。画像と文字が重なっている場合は画像として扱う必要があり、文字、表、画像の混在はやりにくい。
領域設定は自動、手動で可能。領域設定が正しく行われないと認識も正しく行われないので手動でも出来るのは良いと思います。
(3)文字認識。
文字の認識結果は認識結果エリアに表示されます。
読取革命Liteの画面
(4)メニューのWORDアイコンをクリックしてWOR文書を出力すると自動的にWORDが起動します。WORDでのテキストの編集はそのままテキストとして編集出来ます。
ファイルをPDFにするにはPDF形式で保存すればOKです。
○かすれた文字を良く見えるようする場合や、文字の大きさを変えたい場合には使う価値があります。ただし、画像、表、文字が複雑になっていると領域設定が難しくなります。
関連リンク