没落亭日誌

科学史/メディア論のリサーチ・ダイアリー

スキャンした見開きページを1ページずつに変換する

論文が電子ジャーナルからダウンロードできるといいが、電子化されておらず書籍からコピー/スキャンした場合、そのままだとディプレイ上で読みにくいので何とかする必要がある。以下のやり方が今のところ画質がきれいに保ててよいように思う。

  • PDF上でトリミング(crop)して、奇数ページと偶数ページをつくる
  • PDFsamのalternatemixで奇数ページと偶数ページを混合させて一つのファイルにまとめる。

1ページずつにしてからOCRかけた方が精度が上がる印象。