[python] PDF 파일에서 특정 페이지 이동하기
PDF 파일에서 특정 페이지로 이동하기 위해서는 PyPDF2 라이브러리를 사용할 수 있습니다. PyPDF2는 Python으로 PDF를 조작하기 위한 강력한 도구입니다. 아래는 PyPDF2를 사용하여 특정 페이지로 이동하는 방법에 대한 예제 코드입니다.
import PyPDF2
def goto_page(pdf_path, page_number):
with open(pdf_path, 'rb') as f:
pdf_reader = PyPDF2.PdfReader(f)
num_pages = len(pdf_reader.pages)
if page_number < 1 or page_number > num_pages:
print(f"Invalid page number. The PDF contains {num_pages} pages.")
return
page = pdf_reader.pages[page_number - 1]
page_content = page.extract_text()
# 페이지 내용 출력 또는 원하는 작업 수행
print(page_content)
# 원하는 작업 수행
# PDF 파일 경로와 이동할 페이지 번호 설정
pdf_path = "example.pdf"
page_number = 5
goto_page(pdf_path, page_number)
위 예제 코드에서는 goto_page()
함수를 정의하고, 해당 함수를 호출하여 특정 페이지로 이동합니다. pdf_path
는 PDF 파일의 경로를, page_number
는 이동할 페이지 번호를 설정합니다.
함수 내부에서는 PyPDF2.PdfReader()
를 사용하여 PDF 파일을 열고, 페이지의 개수를 확인한 후, 이동할 페이지 번호가 유효한지 확인합니다. 유효하지 않은 페이지 번호인 경우 메시지를 출력하고 함수를 종료합니다.
이동할 페이지 번호가 유효한 경우, pdf_reader.pages
를 통해 해당 페이지를 가져옵니다. page.extract_text()
를 사용하여 페이지의 내용을 추출하고, 원하는 작업을 수행할 수 있습니다. 위 예제 코드에서는 페이지 내용을 출력하는 부분과 필요한 작업을 실행하는 부분이 주석 처리되어 있습니다.
PyPDF2 라이브러리는 다양한 기능을 제공하므로, 이를 활용하여 PDF 파일을 자유롭게 조작할 수 있습니다. 자세한 사용 방법에 대해서는 공식 문서를 참고하시기 바랍니다.