[java] Apache POI를 이용한 Word 파일 읽기

Microsoft Word 문서는 다양한 내용을 포함 할 수 있으며, Java 애플리케이션에서 이러한 문서를 읽는 것은 종종 필요합니다. Apache POI는 Java에서 Microsoft Office 파일을 조작하기위한 인기있는 라이브러리입니다. 이 라이브러리를 사용하여 Word 파일을 읽을 수 있습니다.

Apache POI 라이브러리 추가

먼저, Apache POI 라이브러리를 프로젝트에 추가해야합니다. Maven을 사용하는 경우 pom.xml 파일에 다음 종속성을 추가하세요.

<dependencies>
    <!-- Apache POI -->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi</artifactId>
        <version>4.1.2</version>
    </dependency>
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>4.1.2</version>
    </dependency>
</dependencies>

Gradle을 사용하는 경우 build.gradle 파일에 다음 종속성을 추가하세요.

dependencies {
    // Apache POI
    implementation 'org.apache.poi:poi:4.1.2'
    implementation 'org.apache.poi:poi-ooxml:4.1.2'
}

Word 파일 읽기

다음은 Apache POI를 사용하여 Word 파일을 읽는 Java 예제입니다.

import org.apache.poi.xwpf.usermodel.*;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

public class WordReader {

    public static void main(String[] args) {
        try {
            // Word 파일 경로
            String filePath = "example.docx";

            // Word 파일 열기
            FileInputStream fis = new FileInputStream(new File(filePath));
            XWPFDocument doc = new XWPFDocument(fis);

            // 문서 내용 읽기
            for (XWPFParagraph paragraph : doc.getParagraphs()) {
                String text = paragraph.getText();
                System.out.println(text);
            }

            // 닫기
            doc.close();
            fis.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

위의 예제는 example.docx라는 파일의 내용을 읽고 콘솔에 출력합니다. XWPFDocument를 사용하여 Word 파일을 열고, 각 문단에서 텍스트를 읽고 출력합니다.

결론

Apache POI를 사용하여 Java 애플리케이션에서 Word 파일을 읽을 수 있습니다. 위의 예제를 사용하여 Word 파일의 내용을 추출하고 필요한 작업을 수행 할 수 있습니다. 추가로 Apache POI 라이브러리에는 Word 파일을 작성하고 수정하는 기능도 제공됩니다. 자세한 내용은 Apache POI 공식 문서를 참조하시기 바랍니다.