[python] PDF 파일에서 특정 페이지 이동하기

PDF 파일에서 특정 페이지로 이동하기 위해서는 PyPDF2 라이브러리를 사용할 수 있습니다. PyPDF2는 Python으로 PDF를 조작하기 위한 강력한 도구입니다. 아래는 PyPDF2를 사용하여 특정 페이지로 이동하는 방법에 대한 예제 코드입니다.

import PyPDF2

def goto_page(pdf_path, page_number):
    with open(pdf_path, 'rb') as f:
        pdf_reader = PyPDF2.PdfReader(f)
        num_pages = len(pdf_reader.pages)
        
        if page_number < 1 or page_number > num_pages:
            print(f"Invalid page number. The PDF contains {num_pages} pages.")
            return
        
        page = pdf_reader.pages[page_number - 1]
        page_content = page.extract_text()
        
        # 페이지 내용 출력 또는 원하는 작업 수행
        print(page_content)
        # 원하는 작업 수행
    
# PDF 파일 경로와 이동할 페이지 번호 설정
pdf_path = "example.pdf"
page_number = 5

goto_page(pdf_path, page_number)

위 예제 코드에서는 goto_page() 함수를 정의하고, 해당 함수를 호출하여 특정 페이지로 이동합니다. pdf_path는 PDF 파일의 경로를, page_number는 이동할 페이지 번호를 설정합니다.

함수 내부에서는 PyPDF2.PdfReader()를 사용하여 PDF 파일을 열고, 페이지의 개수를 확인한 후, 이동할 페이지 번호가 유효한지 확인합니다. 유효하지 않은 페이지 번호인 경우 메시지를 출력하고 함수를 종료합니다.

이동할 페이지 번호가 유효한 경우, pdf_reader.pages를 통해 해당 페이지를 가져옵니다. page.extract_text()를 사용하여 페이지의 내용을 추출하고, 원하는 작업을 수행할 수 있습니다. 위 예제 코드에서는 페이지 내용을 출력하는 부분과 필요한 작업을 실행하는 부분이 주석 처리되어 있습니다.

PyPDF2 라이브러리는 다양한 기능을 제공하므로, 이를 활용하여 PDF 파일을 자유롭게 조작할 수 있습니다. 자세한 사용 방법에 대해서는 공식 문서를 참고하시기 바랍니다.