PythonでPDFファイルを結合(マージ)する方法について – How to marge pdf files with Python?
PyPDF2を使用してPDFファイルを結合(結合)する方法について解説します。
必要なモジュールをインポート
import PyPDF2
Pythonで結合するPDFファイルを読み込む
結合する各PDFファイルを個別に読み込みます。たとえば、pdf1.pdf
とpdf2.pdf
を結合する場合、次のようにします。
pdf1 = open('pdf1.pdf', 'rb')
pdf2 = open('pdf2.pdf', 'rb')
PDFリーダーオブジェクトを作成
PdfFileReader
オブジェクトを作成して、各PDFファイルを読み込みます。
pdf_reader1 = PyPDF2.PdfFileReader(pdf1) pdf_reader2 = PyPDF2.PdfFileReader(pdf2)
新しいPDFファイルを作成
結合したPDFファイルを保存するために、PdfFileWriterオブジェクトを作成します。
pdf_writer = PyPDF2.PdfFileWriter()
ページを追加
pdf_reader1とpdf_reader2からページを読み取り、pdf_writerに追加します。
for page_num in range(pdf_reader1.numPages): page = pdf_reader1.getPage(page_num) pdf_writer.addPage(page) for page_num in range(pdf_reader2.numPages): page = pdf_reader2.getPage(page_num) pdf_writer.addPage(page)
Pythonで結合したPDFを保存
結合したPDFを保存
output_pdf = open('combined.pdf', 'wb') pdf_writer.write(output_pdf) output_pdf.close()
ファイルを閉じる
pdf1.close() pdf2.close()
これで、
combined.pdf
という名前の新しいPDFファイルに、pdf1.pdf
とpdf2.pdf
の内容が結合されました。この方法を使用して、Pythonで複数のPDFファイルを結合し、結合済みのPDFファイルを生成することができます。必要に応じて、ページの追加や削除、ページの順序変更などを行って、PDFファイルをカスタマイズすることも可能です。
- PythonでPDF内のテキストを取得・操作する
- PythonでPDFのページを抽出・追加・削除・回転するには
- Pythonでパスワード保護されたPDFファイルの処理するには
- PythonでPDFファイルのページのサイズ、回転、アノテーション、リンクの情報を取得
- PythonでPDFファイルからメタデータ(文書情報)を取得する方法
- PythonでPDFファイルからページの画像を抽出する方法
- PythonでPDFファイルを暗号化(パスワードで保護)するには
にほんブログ村
インターネット・コンピュータランキング
ブログ王ランキングに参加中!
PC関連ランキング