[java] Apache POI를 이용한 PowerPoint 파일 읽기

Apache POI는 Java에서 Microsoft Office 파일 포맷을 다룰 수 있는 라이브러리입니다. 이번 포스트에서는 Apache POI를 사용하여 PowerPoint 파일 (PPTX)을 읽어오는 방법에 대해 알아보겠습니다.

1. Apache POI 라이브러리 추가하기

먼저, Apache POI를 프로젝트에 추가해야 합니다. Maven을 사용하는 경우, pom.xml 파일에 다음 의존성을 추가합니다:

<dependencies>
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>4.1.0</version>
    </dependency>
</dependencies>

Maven이 아닌 경우, Apache POI 다운로드 페이지에서 라이브러리를 다운로드하여 프로젝트에 추가합니다.

2. PowerPoint 파일 읽기

다음은 Apache POI를 사용하여 PowerPoint 파일을 읽어오는 간단한 예제입니다:

import org.apache.poi.xslf.usermodel.XMLSlideShow;
import org.apache.poi.xslf.usermodel.XSLFSlide;

import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;

public class PowerPointReader {

    public static void main(String[] args) {
        try {
            // PowerPoint 파일 읽기
            InputStream inputStream = new FileInputStream("example.pptx");
            XMLSlideShow ppt = new XMLSlideShow(inputStream);

            // 슬라이드 순회하기
            for (XSLFSlide slide : ppt.getSlides()) {
                System.out.println("슬라이드 번호: " + slide.getSlideNumber());
                // 슬라이드 내용 출력 등 추가 작업 수행
            }

            // 입력 스트림 닫기
            inputStream.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

위의 예제에서는 XMLSlideShow 클래스를 사용하여 PowerPoint 파일을 읽어옵니다. 파일 이름은 example.pptx로 가정하고, 이를 입력 스트림으로 변환하여 XMLSlideShow 객체를 생성합니다.

XMLSlideShow 객체를 통해 각 슬라이드에 접근할 수 있으며, 슬라이드 번호 및 내용 등의 작업을 수행할 수 있습니다.

결론

Apache POI를 사용하면 Java에서 PowerPoint 파일을 읽고 조작할 수 있습니다. 위의 예제를 기반으로 활용하여 프로젝트에 맞는 기능을 추가할 수 있습니다.