[java] Jsoup을 사용하여 웹페이지 응답 데이터 복사하기

개요

이번 포스트에서는 Jsoup 라이브러리를 이용하여 Java 프로그램에서 웹페이지의 응답 데이터를 복사하는 방법에 대해 알아보겠습니다. Jsoup은 HTML Parsing과 DOM 조작을 위한 자바 라이브러리로 매우 강력하고 유연한 기능을 제공합니다.

Jsoup 라이브러리 추가

먼저, Jsoup 라이브러리를 프로젝트에 추가해야 합니다. Maven을 사용하는 경우, pom.xml 파일에 다음 의존성을 추가합니다.

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.13.1</version>
</dependency>

코드 예시

아래의 예시 코드를 통해 Jsoup을 사용하여 웹페이지의 응답 데이터를 복사하는 방법을 자세히 살펴보겠습니다.

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

public class WebScraper {

    public static void main(String[] args) {
        try {
            // 웹페이지에 접속하여 HTML 문서를 가져온다
            Document document = Jsoup.connect("https://www.example.com").get();

            // CSS Selector를 사용하여 원하는 데이터를 추출한다
            Elements elements = document.select(".content-container");

            // 추출한 데이터를 출력한다
            for (Element element : elements) {
                System.out.println(element.text());
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

위의 예시 코드에서는 Jsoup.connect() 메소드를 사용하여 웹페이지에 접속하고, get() 메소드로 HTML 문서를 가져옵니다. 그 후, CSS Selector를 사용하여 원하는 데이터를 추출하고, text() 메소드로 해당 데이터를 출력합니다.

실행 결과

위의 예시 코드를 실행하면 웹페이지에서 추출한 데이터가 출력됩니다.

Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Donec sit amet felis euismod, volutpat mauris nec, tincidunt diam.
Aliquam erat volutpat. Morbi malesuada nisl eu nunc faucibus ultrices.
...

결론

이제 Jsoup을 사용하여 웹페이지의 응답 데이터를 복사하는 방법을 알게 되었습니다. Jsoup은 웹 스크래핑 또는 웹 크롤링과 같은 작업에 매우 유용한 도구입니다. 다양한 기능과 유연한 API를 제공하므로 필요한 데이터를 쉽게 추출할 수 있습니다.

참고 자료