Evernoteからの脱出を進めている。用途は次の感じだった。
(1)これはと思った新聞などの記事を入れておく。当初は新聞記事をA4にコピーしたものをスキャンして投入、後半はiPadでスクリーンショットした画像をぶちこんだ。スキャンデータはPDFで、スクリーンショットはpngファイル。直近の仕事にかかわることもあれば、自分の興味関心で抽出された記事もあり、長めにとっておきたい。
(2)有料データベースで検索したデータを入れておく。紙がもったいないからデジタルで保存しておいたデータで、その時々の必要に応じて検索したものだから、なくてもまた検索すればいい。
(3)仕事メモ。相手が話したことをその場で書き込んだり、テープ起こしをしたりしてテキスト化したデータ。おそらく、自分の中では最も価値の高いデータ。
(4)仕事資料。図書館で探してきた資料のコピーをスキャンしたり、その時々のネット資料を保存したりした資料。ネットで拾ってきた資料もあるけれど、当時物の資料は消えていることが多いので、実は重要なのかもしれない。
(5)備忘録。パスワードやら名簿やら年賀状をPDF化したものやら雑多なデータ。繰り返し参照するという意味ではこれらのデータを一番使う。
(1)と(2)、(4)は後から検索や参照ができるようになっていればよいわけで、Googleドライブに入れておけば同じように使える。NotionはPDFのサムネイル表示はされないが、Googleドライブはサムネイルで中身がのぞけるので一覧を見ていけば何となく内容がわかる。
Evernoteに入れたPDFや画像は、OCR処理されて検索できるようになるのが魅力なのだが、そのデータはファイルに上書きされるのではなく、Evernote側の検索インデックスとして保存されているらしく、データをエクスポートするとそのデータは引き継がれないらしい。名刺やコピーした記事については、ドキュメントスキャナでスキャンした際にOCRがかかっていてPDFにテキストデータが記録されていると思うのだが、スクリーンショットにはテキストデータが付いていない。すなわち、検索できない。
なのでEvernoteからエクスポートしたpngファイルについてOCRをかけた上でPDF化してGoogleドライブに入れようと思う。もし一つ一つのファイルを処理していったら膨大な作業になるのだが、今はAI時代。ChatGPTに「pngにOCRをかけてPDFに変換するPythonプログラムを作って」とお願いすればいい。
最初はぜんぜん認識してくれなかったのだが、AIにプログラムのチューニングを何度か命じたら何となく日本語っぽいテキストを認識できるようになった。そもそもスクリーンショットでは解像度が足りないらしく、認識率が低いのは仕方ないと思われる。それでも、断片でもテキストデータが埋め込まれていれば、検索で拾える可能性が高まる。
AIは世の中にあるクソみたいな作業をなくす可能性があるツール。どう使いこなせるかで生産性がかなり変わってくる。s