[python] PyPDF2 기본 사용법
PyPDF2는 Python에서 PDF 파일을 조작할 수 있는 유용한 라이브러리입니다. 이번 포스트에서는 PyPDF2의 기본 사용법을 알아보도록 하겠습니다.
PyPDF2 설치하기
먼저, PyPDF2를 설치해야 합니다. 다음 명령어를 사용하여 PyPDF2를 설치할 수 있습니다.
pip install PyPDF2
PDF 파일 열기
PyPDF2를 사용하여 PDF 파일을 열려면 PdfFileReader
클래스를 사용해야 합니다. 다음 코드는 example.pdf
파일을 열고 PdfFileReader
객체를 생성하는 예제입니다.
from PyPDF2 import PdfFileReader
pdf_path = 'example.pdf'
pdf_file = open(pdf_path, 'rb')
pdf_reader = PdfFileReader(pdf_file)
페이지 수 가져오기
PDF 파일의 페이지 수를 가져오기 위해서는 numPages
속성을 사용합니다. 다음 코드는 PDF 파일의 페이지 수를 출력하는 예제입니다.
page_count = pdf_reader.numPages
print(f"페이지 수: {page_count}")
페이지 내용 읽기
특정 페이지의 내용을 읽기 위해서는 getPage
메서드를 사용해야 합니다. 이 메서드는 0부터 시작하는 페이지 인덱스를 인자로 받고 PageObject
를 반환합니다. 해당 페이지의 내용은 extractText
메서드를 사용하여 추출할 수 있습니다. 다음 코드는 첫 번째 페이지의 내용을 출력하는 예제입니다.
first_page = pdf_reader.getPage(0)
content = first_page.extractText()
print(content)
PDF 파일 닫기
PDF 파일을 열었으면 작업이 끝난 후에는 반드시 파일을 닫아야 합니다. 파일을 닫기 위해서는 close
메서드를 사용합니다. 다음 코드는 PDF 파일을 닫는 예제입니다.
pdf_file.close()
이제 PyPDF2를 사용하여 PDF 파일을 열고 읽는 기본적인 방법을 알아보았습니다. PyPDF2에는 다양한 기능과 옵션이 포함되어 있으며, 공식 문서를 참조하여 자세한 사용법을 알아보시기 바랍니다.