[python] PyPDF2 소개
PyPDF2는 Python에서 PDF 파일을 다루기 위한 강력한 라이브러리입니다. 이 라이브러리를 사용하면 PDF 파일의 내용을 읽고 편집할 수 있습니다. 다양한 기능을 제공하여, PDF 파일을 생성하고 분할하며, 페이지를 병합하고 보안을 설정할 수 있습니다.
설치하기
PyPDF2를 설치하려면 pip를 사용합니다. 아래의 명령을 터미널에서 실행하세요.
pip install PyPDF2
사용 예제
PDF 파일 열기
import PyPDF2
# PDF 파일 열기
with open('sample.pdf', 'rb') as file:
pdf = PyPDF2.PdfFileReader(file)
# 페이지 수 출력
print(f"페이지 수: {pdf.numPages}")
# 첫 페이지 출력하기
first_page = pdf.getPage(0)
print(first_page.extractText())
PDF 파일 생성하기
import PyPDF2
# 새로운 PDF 파일 생성
pdf = PyPDF2.PdfWriter()
# 페이지 추가하기
pdf.addPage(PyPDF2.pdf.PageObject())
# PDF 파일 저장하기
with open('new.pdf', 'wb') as file:
pdf.write(file)
PDF 파일 병합하기
import PyPDF2
# 첫 번째 PDF 파일 열기
with open('file1.pdf', 'rb') as file1:
# 두 번째 PDF 파일 열기
with open('file2.pdf', 'rb') as file2:
pdf1 = PyPDF2.PdfFileReader(file1)
pdf2 = PyPDF2.PdfFileReader(file2)
# 새로운 PDF 파일 생성
merger = PyPDF2.PdfFileMerger()
# 첫 번째 파일의 페이지 추가하기
for page in range(pdf1.numPages):
merger.append(pdf1.getPage(page))
# 두 번째 파일의 페이지 추가하기
for page in range(pdf2.numPages):
merger.append(pdf2.getPage(page))
# 새로운 파일로 저장하기
merger.write('merged.pdf')
결론
PyPDF2는 Python 개발자들에게 PDF 파일을 다루는 데 매우 유용한 도구입니다. 다양한 기능을 제공하며, 사용하기 쉽고 강력한 성능을 가지고 있습니다. 이 라이브러리를 사용하여 PDF 파일을 읽고 편집하는 작업을 쉽게 수행할 수 있습니다.
더 자세한 정보는 PyPDF2 공식 문서를 참고하세요.