[python] PyPDF2와 PyPDF4 라이브러리 사용 예시
많은 기능과 유연성을 제공하는 Python 라이브러리인 PyPDF2
와 PyPDF4
는 PDF 파일을 다루는데 사용됩니다. 이 라이브러리들은 간단하고 직관적인 인터페이스를 제공하여 PDF 문서를 읽고 쓰는 작업을 쉽게 할 수 있게 해줍니다.
PyPDF2 라이브러리 사용 예시
PDF 파일 읽기
import PyPDF2
# PDF 파일 열기
with open('example.pdf', 'rb') as file:
pdf_reader = PyPDF2.PdfFileReader(file)
# 페이지 수 출력
num_pages = pdf_reader.numPages
print(f"페이지 수: {num_pages}")
# 특정 페이지의 텍스트 읽기
page = pdf_reader.getPage(0)
text = page.extractText()
print(text)
PDF 파일 쓰기
import PyPDF2
# 새로운 PDF 파일 생성
pdf_writer = PyPDF2.PdfFileWriter()
# 페이지 추가
page = PyPDF2.PageObject()
page.mergePage(pdf_reader.getPage(0))
pdf_writer.addPage(page)
# PDF 파일 저장
with open('output.pdf', 'wb') as file:
pdf_writer.write(file)
PyPDF4 라이브러리 사용 예시
PDF 파일 분할
import PyPDF4
# PDF 파일 열기
with open('example.pdf', 'rb') as file:
pdf_reader = PyPDF4.PdfFileReader(file)
# 페이지 수 출력
num_pages = pdf_reader.numPages
print(f"페이지 수: {num_pages}")
# 각 페이지를 개별 파일로 저장
for page_num in range(num_pages):
pdf_writer = PyPDF4.PdfFileWriter()
page = pdf_reader.getPage(page_num)
pdf_writer.addPage(page)
with open(f"page_{page_num+1}.pdf", 'wb') as output_file:
pdf_writer.write(output_file)
PDF 파일 병합
import PyPDF4
# PDF 파일 병합
pdf_merger = PyPDF4.PdfFileMerger()
# 병합할 PDF 파일 추가
pdf_merger.append('file1.pdf')
pdf_merger.append('file2.pdf')
# PDF 파일 저장
pdf_merger.write('merged.pdf')
pdf_merger.close()
위 예시 코드를 이용해서 PyPDF2
와 PyPDF4
라이브러리를 사용하여 PDF 파일을 읽고 쓰는 작업을 수행할 수 있습니다. 이 라이브러리들은 많은 다른 기능도 제공하므로 공식 문서를 참조하는 것이 좋습니다.
참고 자료
- PyPDF2 공식 문서: https://pythonhosted.org/PyPDF2/
- PyPDF4 공식 문서: https://pythonhosted.org/PyPDF4/