[java] Jsoup을 사용하여 웹페이지 속성값 가져오기

Jsoup은 자바 언어로 작성된 HTML 파싱 라이브러리입니다. 이 라이브러리를 사용하여 웹 페이지의 속성값을 가져올 수 있습니다. 이 글에서는 Jsoup을 사용하여 웹 페이지에서 특정 속성값을 추출하는 방법에 대해 알아보겠습니다.

1. Jsoup 라이브러리 추가하기

먼저, 프로젝트에 Jsoup 라이브러리를 추가해야 합니다. Maven을 사용하는 경우, pom.xml 파일에 아래의 의존성을 추가합니다.

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.13.1</version>
</dependency>

Gradle을 사용하는 경우, build.gradle 파일에 아래의 의존성을 추가합니다.

dependencies {
    implementation 'org.jsoup:jsoup:1.13.1'
}

2. 웹 페이지에서 속성값 가져오기

아래의 예제 코드는 Jsoup을 사용하여 웹 페이지에서 특정 속성값을 가져오는 방법을 보여줍니다.

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class Main {
    public static void main(String[] args) {
        try {
            // 웹 페이지 로드
            Document doc = Jsoup.connect("https://example.com").get();

            // 웹 페이지에서 요소 선택
            Element element = doc.select("a[href]").first();

            // 선택한 요소의 속성값 가져오기
            String href = element.attr("href");

            System.out.println("속성값: " + href);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

위의 코드에서는 https://example.com 에 접속한 후, 첫 번째 <a> 태그의 href 속성값을 가져옵니다. attr() 메서드를 사용하여 해당 속성값을 가져올 수 있습니다. 결과는 콘솔에 출력됩니다.

3. 참고 자료

위의 참고 자료는 Jsoup을 더욱 자세히 배우고 싶은 경우에 도움이 될 수 있습니다.