[java] Apache PDFBox를 이용한 PDF 파일 분할

Apache PDFBox는 Java로 작성된 오픈 소스 라이브러리로, PDF 파일을 생성, 수정 및 분석할 수 있습니다. PDF 파일을 필요에 따라 여러 부분으로 분할하는 프로그래밍적 접근 방법은 많은 사용자들에게 유용할 수 있습니다.

이번 포스트에서는 Apache PDFBox를 사용하여 Java 언어로 PDF 파일을 분할하는 방법에 대해 살펴보겠습니다.

Apache PDFBox 라이브러리 추가

PDFBox를 프로젝트에 추가하기 위해서 Maven을 이용하여 다음과 같이 dependency를 추가합니다.

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.24</version>
</dependency>

Gradle을 사용한다면 다음과 같이 추가할 수 있습니다.

implementation 'org.apache.pdfbox:pdfbox:2.0.24'

PDF 파일 분할

PDF 파일을 분할하는 간단한 예제를 살펴보겠습니다. 아래의 코드는 PDF의 첫 페이지를 분리하여 새로운 파일에 저장하는 방법을 보여줍니다.

import org.apache.pdfbox.pdmodel.PDDocument;
import java.io.File;
import java.io.IOException;

public class PdfSplitter {
    public static void main(String[] args) throws IOException {
        // 원본 PDF 파일
        File file = new File("original.pdf");
        PDDocument document = PDDocument.load(file);

        // 첫 페이지 분할
        PDDocument firstPage = new PDDocument();
        firstPage.addPage(document.getPage(0));

        // 새로운 파일로 저장
        firstPage.save("firstPage.pdf");

        document.close();
        firstPage.close();
    }
}

위의 코드는 Apache PDFBox를 사용하여 PDF를 입력으로 받고, 첫 번째 페이지만을 포함하는 새로운 PDF 파일을 생성합니다.

마치며

이번 포스트에서는 Apache PDFBox를 사용하여 Java로 PDF 파일을 분할하는 기본적인 방법을 살펴보았습니다. PDF 파일을 분할하는 다른 방법과 더 많은 기능에 대해 더 알고 싶다면 PDFBox 문서를 참고하십시오.

Apache PDFBox를 사용하여 PDF 파일을 다루는 방법을 익힘으로써 실제 프로젝트에서 PDF 파일을 자유롭게 다룰 수 있는 능력을 키울 수 있을 것입니다.