2011-02-23 オープンソースのPDFライブラリ(Python編) 技術調査 Pythonから利用できるオープンソースのPDF出力ライブラリを集めてみました。 PDFに対して分割・結合などの加工を行うライブラリは含めていません。 他にあれば追加しますので教えてください。また,記述に誤りがあれば訂正しますので,ご指摘ください。 ReportLab Toolkit 主な特徴 商用ソフト ReportLab PLUS のコア部分をオープンソースとして公開している。 古くから Python でのPDF出力ツールの定番。 商用版はRMLというXMLベースのマークアップ言語で帳票デザインを定義するが,オープンソース版はAPIのみの提供。 配布場所 http://www.reportlab.com/software/opensource/rl-toolkit/ Pyharu 主な特徴 最近注目のPDFライブラリ Haru Free PDF Library (http://libharu.org/wiki/) のPythonバインディング。 ctypes を使って実現されている。 最近は,開発が止まっているように見える。 配布場所 http://groups.google.com/group/pythoncia/files PDFMiner 主な特徴 Pure Python の PDFライブラリ。 PDFをオブジェクトレベルで操作するためのプリミティブなAPIを提供している。 PDFの構造を理解してないと使いこなすのが難しいと思われる。 配布場所 http://www.unixuser.org/~euske/python/pdfminer/index.html rst2pdf 主な特徴 reStructuredText (reST)形式のファイルをPDFに変換するプログラム。 配布場所 http://code.google.com/p/rst2pdf/