[java] Jsoup을 사용하여 웹페이지 내 특정 요소 보이기

웹 스크래핑을 위해 자바에서 Jsoup 라이브러리를 사용할 수 있습니다. Jsoup은 HTML 문서의 파싱 및 조작을 위한 간편한 API를 제공합니다. 이 라이브러리를 사용하여 웹페이지에서 특정 요소를 선택하고 보여주는 방법을 알아보겠습니다.

1. Jsoup 의존성 추가

먼저, 프로젝트의 의존성 관리 도구에 Jsoup을 추가해야 합니다. Maven을 사용하는 경우 pom.xml 파일에 다음과 같이 의존성을 추가합니다:

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.14.3</version>
</dependency>

Gradle을 사용하는 경우 build.gradle 파일에 다음과 같이 의존성을 추가합니다:

implementation 'org.jsoup:jsoup:1.14.3'

의존성을 추가한 후, 해당 프로젝트를 빌드하면 Jsoup을 사용할 수 있습니다.

2. 웹페이지에서 특정 요소 보이기

다음은 Jsoup을 사용하여 웹페이지에서 특정 요소를 선택하고 보여주는 예제입니다. 예를 들어, “https://example.com” 페이지에서 <title> 요소를 선택하여 출력하는 코드입니다:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupExample {
    public static void main(String[] args) {
        try {
            // 웹페이지 가져오기
            Document doc = Jsoup.connect("https://example.com").get();
            
            // 특정 요소 선택하기
            Element titleElement = doc.select("title").first();
            
            // 요소 출력하기
            if (titleElement != null) {
                System.out.println("Title: " + titleElement.text());
            } else {
                System.out.println("Title element not found.");
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

위의 코드를 실행하면 “https://example.com” 페이지의 <title> 요소의 내용이 출력됩니다. 만약 해당 요소가 존재하지 않으면 “Title element not found.”가 출력됩니다.

3. 참고 자료