紙も、デジタルも。あらゆるものを記録したい人間の模索。

 今年にはいってからだが、ノート類をたくさん買って、何冊かずつ交替で片っ端から書き殴っている。1冊目の1ページ目から書くということではなく、何冊も同時進行で適当なページを開いては何かを書き、書いていないページが減ってきたらいったんそのノートを休んでほかのものを使い、また何ヶ月かしてそのノートの空白に何かを埋める。この方式だと必然的に何ヶ月か前の自分のメモが目にはいることになる。数ヶ月前のものでも面白く読めるし、何らかの発見がある場合も。

 もちろん欠点はある。偶然に発見されるまで、その言葉や表現はぜったいに出てこない。そういう記録方法(ただの書き殴り)なのだから、それはそれで仕方がない。

 ネットでも、片っ端からページを保存してevernote.comに放りこんでいる。文字として保存したものであるから、文字として検索すれば何年前のものでも調べることができる。ブラウザでネット検索をすると同時にevernoteの中も検索すれば、ネットですでに消えてしまった記事でも自分の保存したものが拾い出せて、便利である。

 こちらにも欠点はある。時間がかかるのだ。ある程度は読んで「これはとっておこう」と決めたページを開いた状態でブラウザからevernoteに保存という手順を踏んでいるので、evernoteのサービスが不調ならば、その瞬間に保存できない場合もある。別のサービスPocketも利用することがあるが、こちらは表示されている内容を保存せずにリンクを保存する場合があるため、先方が記事を消してしまったとき、もう読めないことがある。そのため、できるだけevernote.comを優先したいと思っている。

 だが最近、さらに少し欲が出てきた。いちいちウェブページを文字として保存するのではなく、文字や画像などをひっくるめた、目の前に見えているウェブページの一部のみを切り出して、概要がわかればよい程度で画像として保存し、のちに整理できたらどれだけよいだろうかと。カーソルで囲った範囲を画面キャプチャしていくだけなら、いちいちブラウザからevernote.comへ貼り付ける手順を踏むよりもどんどん楽ができるからだ。おそらく時間は格段に節約できる。

 ただ、もちろんこれには問題がある。画像の中に含まれる文字は整理するときに自分の言葉でも添えておかないかぎり、検索対象にはならない。そして保存にかかる時間を惜しんで画像でとっておいたものを、あとになって検索しやすいよう自分の言葉を添えて補うなど、わたしがするはずもない。そんな労力をいとわない人間ならば、そもそも最初から、楽をしようとは思わない。

 ここでOCR機能付きの画像ファイル変換はできないかという話になってくる。できれば無料で。

 そして、見つけた。このソフト → http://solutions.weblite.ca/pdfocrx/home
 英語ならばけっこうな確率で文字として認識してくれる。Community Edition というほうならば、個人利用は無料で利用できる。

 画像または画像をPDF保存したものの中に文字が含まれていれば、それを認識してテキストの抜き出し、またはテキスト検索が可能なPDFファイル変換をしてくれる。英語だけでよければ、かなり戦力になる。動作も軽く、ストレスを感じない。
 日本語パックをダウンロードして試してみたが、やはり無料ソフトでの日本語認識は、ほぼ使えないと思った方がよいようだ。あまりにもすごくて、話の種に何か事例を書いてみたい気もするが、それ以前にため息が出てしまう(笑)。

 今後、もし日本語でも同様なものがほしくなった場合にそなえて市販のOCR対応ソフトの値段も調べてみた。おそらく最低でも1万円は覚悟をしておかねばならないだろう。そして、あまり一般的ではないフォントや、文字に修飾がついている場合は認識されないとも思う。ただ、有料のソフトで日本語対応を売りにしている商品であれば、おそらく縦書きや新聞のような段組レイアウトにも対応していると思われ、そこまでを期待するならば、やはり高額な有料ソフトの購入は避けて通れまい。

 わたしとしては、ひとまず英語だけでも楽ができそうなところまで来たので、しばらくはこの状態であれこれ試して、今後に備えていきたい。

 最後に念のため書いておくが、今回紹介したPDF OCR Xのほかにも、いくつか無料ソフトをダウンロードしてみた。2回までお試しでOCRを使わせてくれるが別料金支払いが必要なソフトや、かなり高機能でPDF編集に優れているがOCR部分は有料版にアップグレードする必要があるものなど、試せる範囲では試した。英語ならば使えることはおそらく間違いないだろうが、日本語の対応は未知数だ。最初から日本語OCRを中心に考えているのならば、それらソフトに数千円程度のアップグレード料金を払ってしまってから苦労することになるよりは、ある程度の金額を最初から予定しておいたほうが、よいのではないだろうか。

Did you enjoy this post? Why not leave a comment below and continue the conversation, or subscribe to my feed and get articles like this delivered automatically to your feed reader.

Comments

OCRを日常的に使っています。日本語対応のOCRであればABBYY FineReaderがお薦めです。ただし最新版は2万円とお高いです。
無料ということであれば、GoogleドキュメントのOCR機能が日本語対応ですね。

コメントありがとうございます。
なるほど、Googleドキュメントについては、まったく考えていませんでした。ちょっと試してみます。

まずは無料で、少し慣れてから有料ソフトに進んでいこうかと思います。

Googleドキュメントで、試してみました。けっこう使えますね。ありがとうございます。

無料15GBのうち、一時期たくさん使っていたので10GBが埋まってしまっていて、最近はできるだけほかのストレージを使うようにしてきたのですが、これならば従来のファイルをどこかに移転してスペースを空け、Googleドキュメントをお試ししてみたいと思います。

Leave a comment