[java] Jsoup을 사용하여 웹페이지 상태코드 추출하기

이번 포스트에서는 Jsoup 라이브러리를 사용하여 Java에서 웹페이지의 상태코드를 추출하는 방법에 대해 알아보겠습니다.

1. Jsoup 라이브러리 설치하기

Jsoup은 Java에서 HTML 파싱을 위한 라이브러리로, 다음과 같이 Maven을 통해 라이브러리를 추가할 수 있습니다.

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.13.1</version>
</dependency>

2. 웹페이지의 상태코드 추출하기

Jsoup을 사용하여 웹페이지의 상태코드를 추출하려면 다음과 같은 단계를 따릅니다.

2.1. Jsoup 객체 초기화하기

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.IOException;

public class WebPageStatus {
    public static void main(String[] args) {
        String url = "https://example.com"; // 추출할 웹페이지 URL
        try {
            Document document = Jsoup.connect(url).get();
            int statusCode = Jsoup.connect(url).execute().statusCode();
            System.out.println("상태코드: " + statusCode);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

2.2. 웹페이지의 상태코드 추출하기

위의 코드에서 Jsoup.connect(url).execute().statusCode() 를 사용하여 웹페이지의 상태코드를 추출할 수 있습니다. 이 메소드는 HTTP 요청을 보내고 응답을 받아 상태코드를 반환합니다.

3. 실행 결과 확인하기

위의 코드를 실행하면 아래와 같이 웹페이지의 상태코드가 출력됩니다.

상태코드: 200

결론

이번 포스트에서는 Jsoup을 사용하여 Java에서 웹페이지의 상태코드를 추출하는 방법을 알아보았습니다. Jsoup은 간편한 HTML 파싱을 제공하여 웹페이지에서 원하는 정보를 추출하는 데 유용한 라이브러리입니다. 추가적인 사용법은 Jsoup 공식 문서를 참고하시기 바랍니다.