今、Pythonで仕事で使うスクリプトを書いているのですが、そのために色々調べごとをしました。世の中、いろんな役に立つ情報をまとめて提供してくれている方がいて、非常に参考になります。しかしながら、その場で全部は理解できない/必要できないことも多いので、後でじっくり読みたいと思うものも少なくありません。
しかし、それらの情報はほとんどがWebサイトという形をとっていて、永続的に存在することが保証されてもいませんので、ぜひとも手元に残したいと思うものです。(もちろん、著作権は元々作成された方にある場合がほとんどですので、他の目的に使うことはできませんが)
で、一番お手頃なのがChromeブラウザで印刷してPDFに変換してしまうことなのですが、それだとページ毎にバラバラのファイルになってしまいます。自分はAcrobat7とAcrobat9のStandard版は持っているので、そちらで結合してもいいのですが、わざわざWindowsを立ち上げなければなりません。
そこでそのPDFファイルを編集(といっても結合だけでいいのですが)するツールがないか調べてみました。
Synapticで「PDF」で見て、pdfeditとpdftkをなんとなくインストールしてみました。
- pdfedit
「アプリケーション」→「グラフィックス」→「PDF Editor」で起動します。
ファイルを開くと、PDFファイル中のテキストやオブジェクトなどをあれこれできそうな表示はされるのですが、残念ながら今回の目的の複数のPDFファイルの結合は容易にはできそうにありませんでした。(こうすればできるよ、という情報があれば教えてもらえると嬉しいです) - pdftk
こちらはコマンドラインツールですので、目的のディレクトリにファイルに通し番号をつけた上で、シェルを開いて目的のディレクトリで、
$ pdftk *.pdf cat output outfile.pdf
とすることで、 瞬時のうちに結合したファイルが得られました。
ということで、ChromeのPDF出力とpdftkの組み合わせで個人用Web情報コレクションができそうです。