[python] PyPDF2 기본 사용법

PyPDF2는 Python에서 PDF 파일을 조작할 수 있는 유용한 라이브러리입니다. 이번 포스트에서는 PyPDF2의 기본 사용법을 알아보도록 하겠습니다.

PyPDF2 설치하기

먼저, PyPDF2를 설치해야 합니다. 다음 명령어를 사용하여 PyPDF2를 설치할 수 있습니다.

pip install PyPDF2

PDF 파일 열기

PyPDF2를 사용하여 PDF 파일을 열려면 PdfFileReader 클래스를 사용해야 합니다. 다음 코드는 example.pdf 파일을 열고 PdfFileReader 객체를 생성하는 예제입니다.

from PyPDF2 import PdfFileReader

pdf_path = 'example.pdf'
pdf_file = open(pdf_path, 'rb')
pdf_reader = PdfFileReader(pdf_file)

페이지 수 가져오기

PDF 파일의 페이지 수를 가져오기 위해서는 numPages 속성을 사용합니다. 다음 코드는 PDF 파일의 페이지 수를 출력하는 예제입니다.

page_count = pdf_reader.numPages
print(f"페이지 수: {page_count}")

페이지 내용 읽기

특정 페이지의 내용을 읽기 위해서는 getPage 메서드를 사용해야 합니다. 이 메서드는 0부터 시작하는 페이지 인덱스를 인자로 받고 PageObject를 반환합니다. 해당 페이지의 내용은 extractText 메서드를 사용하여 추출할 수 있습니다. 다음 코드는 첫 번째 페이지의 내용을 출력하는 예제입니다.

first_page = pdf_reader.getPage(0)
content = first_page.extractText()

print(content)

PDF 파일 닫기

PDF 파일을 열었으면 작업이 끝난 후에는 반드시 파일을 닫아야 합니다. 파일을 닫기 위해서는 close 메서드를 사용합니다. 다음 코드는 PDF 파일을 닫는 예제입니다.

pdf_file.close()

이제 PyPDF2를 사용하여 PDF 파일을 열고 읽는 기본적인 방법을 알아보았습니다. PyPDF2에는 다양한 기능과 옵션이 포함되어 있으며, 공식 문서를 참조하여 자세한 사용법을 알아보시기 바랍니다.

참고 자료