PythonでPDFのページを抽出・追加・削除・回転するには – How to extract, add, delete, or rotate PDF pages in Python?
PyPDF2を使用してPDFファイルからページを抽出、ページを追加、ページを削除、およびページを回転させる方法を詳しく解説します。
PythonでPDFのページを抽出する
PyPDF2を使用してPDFファイルから特定のページを抽出するには、以下のステップを実行します。
import PyPDF2
# PDFファイルを読み込む
pdf_file = open('input.pdf', 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 抽出したいページ番号(0から始まる)を指定
page_number = 1 # 例: 2番目のページ
# ページを抽出
page = pdf_reader.getPage(page_number)
# 抽出したページを新しいPDFファイルに保存
pdf_writer = PyPDF2.PdfFileWriter()
pdf_writer.addPage(page)
with open('output.pdf', 'wb') as output_file:
pdf_writer.write(output_file)
# ファイルを閉じる
pdf_file.close()
上記のコードでは、指定したページ(例では2番目のページ)を抽出して、新しいPDFファイルに保存しています。
PythonでPDFのページを追加する
既存のPDFファイルに新しいページを追加するには、次の手順を実行します。
import PyPDF2
# 既存のPDFファイルを読み込む
pdf_file = open('existing.pdf', 'rb')
existing_pdf = PyPDF2.PdfFileReader(pdf_file)
# 新しいページを含むPDFファイルを読み込む
new_page = open('new_page.pdf', 'rb')
new_pdf = PyPDF2.PdfFileReader(new_page)
# 新しいページを既存のPDFに追加
pdf_writer = PyPDF2.PdfFileWriter()
for page_num in range(existing_pdf.getNumPages()):
page = existing_pdf.getPage(page_num)
pdf_writer.addPage(page)
page = new_pdf.getPage(0) # 新しいページを取得
pdf_writer.addPage(page)
# 新しいPDFファイルに保存
with open('output.pdf', 'wb') as output_file:
pdf_writer.write(output_file)
# ファイルを閉じる
pdf_file.close()
new_page.close()
このコードでは、既存のPDFファイルに新しいページを追加して、新しいPDFファイルに保存しています。
PythonでPDFのページを削除する
PyPDF2を使用してページを削除するには、以下のステップを実行します。
import PyPDF2
# PDFファイルを読み込む
pdf_file = open('input.pdf', 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 削除したいページの番号を指定
page_to_delete = 1 # 例: 2番目のページ
# 新しいPDFファイルを作成し、削除したいページ以外のページを追加
pdf_writer = PyPDF2.PdfFileWriter()
for page_num in range(pdf_reader.getNumPages()):
if page_num != page_to_delete:
page = pdf_reader.getPage(page_num)
pdf_writer.addPage(page)
# 新しいPDFファイルに保存
with open('output.pdf', 'wb') as output_file:
pdf_writer.write(output_file)
# ファイルを閉じる
pdf_file.close()
このコードでは、指定したページ(例では2番目のページ)を削除して、新しいPDFファイルに保存しています。
PythonでPDFページを回転する
PyPDF2を使用してページを回転させるには、以下のステップを実行します。
import PyPDF2
# PDFファイルを読み込む
pdf_file = open('input.pdf', 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 回転したいページの番号を指定
page_to_rotate = 0 # 例: 1番目のページ
# ページを回転
page = pdf_reader.getPage(page_to_rotate)
page.rotateClockwise(90) # 90度回転
# 新しいPDFファイルに保存
pdf_writer = PyPDF2.PdfFileWriter()
for page_num in range(pdf_reader.getNumPages()):
if page_num == page_to_rotate:
pdf_writer.addPage(page)
else:
pdf_writer.addPage(pdf_reader.getPage(page_num))
with open('output.pdf', 'wb') as output_file:
pdf_writer.write(output_file)
# ファイルを閉じる
pdf_file.close()
このコードでは、指定したページ(例では1番目のページ)を90度回転させて、新しいPDFファイルに保存しています。
- PythonでPDF内のテキストを取得・操作する
- PythonでPDFファイルを結合(結合)する方法について
- Pythonでパスワード保護されたPDFファイルの処理するには
- PythonでPDFファイルのページのサイズ、回転、アノテーション、リンクの情報を取得
- PythonでPDFファイルからメタデータ(文書情報)を取得する方法
- PythonでPDFファイルからページの画像を抽出する方法
- PythonでPDFファイルを暗号化(パスワードで保護)するには
にほんブログ村
インターネット・コンピュータランキング
ブログ王ランキングに参加中!
PC関連ランキング