[java] Apache POI를 이용한 Word 문서 확인

먼저, Apache POI를 사용하기 위해 프로젝트에 해당 라이브러리를 추가해야 합니다. Maven을 사용하는 경우, pom.xml 파일에 다음 의존성을 추가해주세요:

<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi</artifactId>
    <version>4.1.2</version>
</dependency>

이제 Word 문서를 확인하는 예제 코드를 작성해보겠습니다. 아래 코드는 example.docx 파일을 읽어와서 문서의 내용을 출력하는 예제입니다.

import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import org.apache.poi.xwpf.usermodel.XWPFRun;

import java.io.FileInputStream;
import java.io.IOException;

public class WordDocumentReader {
    public static void main(String[] args) {
        try (FileInputStream fis = new FileInputStream("example.docx");
             XWPFDocument document = new XWPFDocument(fis)) {

            // 문서의 모든 Paragraph를 순회하며 내용 출력
            for (XWPFParagraph paragraph : document.getParagraphs()) {
                String text = paragraph.getText();
                System.out.println(text);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

위의 코드를 실행하면 example.docx 파일의 내용이 한 줄씩 출력됩니다.

Apache POI로 Word 문서를 확인하는 방법에 대해 알아보았습니다. 추가적으로 문서의 스타일, 표, 이미지 등을 더 자세히 다루고 싶다면, Apache POI의 공식 문서를 참조하시기 바랍니다.

참고 자료: