[java] Apache POI를 이용한 Word 문서 삭제

Apache POI는 Java에서 Microsoft Office 파일을 조작하는데 사용되는 라이브러리입니다. 이 라이브러리를 사용하면 Java 코드를 통해 Word 문서를 생성, 편집 및 삭제할 수 있습니다.

이번에는 Apache POI를 사용하여 Word 문서에서 특정 내용을 삭제하는 방법을 알아보겠습니다.

필수 라이브러리 설치

먼저, Apache POI 라이브러리를 다음과 같이 Maven을 통해 프로젝트에 추가해야 합니다.

<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi</artifactId>
    <version>4.1.2</version>
</dependency>

이렇게 하면 Apache POI 라이브러리가 프로젝트에 추가되고 사용할 수 있게 됩니다.

Word 문서 삭제

다음은 Apache POI를 사용하여 Word 문서에서 특정 내용을 삭제하는 예제입니다.

import java.io.FileInputStream;
import java.io.FileOutputStream;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import org.apache.poi.xwpf.usermodel.XWPFRun;

public class WordDocumentDeletion {
    public static void main(String[] args) {
        try {
            // 원본 Word 문서 파일 로드
            FileInputStream fis = new FileInputStream("original.docx");
            XWPFDocument document = new XWPFDocument(fis);

            // 문서 내 모든 단락(Paragraph)을 가져옴
            for (XWPFParagraph paragraph : document.getParagraphs()) {
                // 단락 내 모든 텍스트 삭제
                for (XWPFRun run : paragraph.getRuns()) {
                    run.setText("", 0);
                }
            }

            // 수정된 문서를 새로운 파일로 저장
            FileOutputStream fos = new FileOutputStream("modified.docx");
            document.write(fos);

            // 자원 해제
            fos.close();
            fis.close();
            document.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

위의 예제 코드에서는 original.docx라는 원본 Word 문서 파일을 로드하고, 문서 내 모든 단락에서 텍스트를 삭제하는 작업을 수행합니다. 수정된 문서는 modified.docx라는 새로운 파일로 저장됩니다.

Apache POI를 사용하면 Java를 통해 Word 문서를 삭제하는 것이 가능해집니다. 이를 활용하여 자동화된 문서 처리 및 편집 작업을 수행할 수 있습니다.

결론

Apache POI를 사용하면 Java에서 Word 문서를 삭제하는 것이 간단하고 효율적으로 수행될 수 있습니다. 다양한 작업을 수행할 수 있는 이 라이브러리를 활용하여 Office 파일을 조작하는 기능을 개발해보세요.