[java] Jsoup을 사용하여 웹페이지 응답 데이터 형식 설정하기

웹 크롤링을 하거나 웹 페이지 데이터를 스크래핑하는 경우, Jsoup은 자바에서 매우 유용한 라이브러리입니다. Jsoup을 사용하면 웹페이지의 HTML 구조를 파싱하고, 원하는 데이터를 추출할 수 있습니다.

하지만 때때로 웹 페이지에서 반환되는 데이터 형식을 제어하고 싶을 때도 있습니다. 예를 들어, 웹 사이트에서 JSON 형식으로 데이터를 받고 싶거나, XML 형식으로 데이터를 요청하고 싶을 수 있습니다. 이런 경우에는 Jsoup을 사용하여 웹페이지 응답 데이터의 형식을 설정할 수 있습니다.

다음은 Jsoup을 사용하여 웹페이지 응답 데이터의 형식을 설정하는 예제입니다.

import org.jsoup.Connection;
import org.jsoup.Jsoup;

public class WebPageFetcher {
    public static void main(String[] args) {
        String url = "https://example.com";
        
        try {
            Connection.Response response = Jsoup.connect(url)
                                                .header("Content-Type", "application/json") // 원하는 데이터 형식으로 설정
                                                .ignoreContentType(true)
                                                .execute();

            String responseData = response.body();
            System.out.println(responseData);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

위의 예제에서는 Jsoup.connect(url)을 사용하여 웹페이지에 연결하고, header("Content-Type", "application/json")을 사용하여 원하는 데이터 형식인 JSON으로 설정하였습니다. ignoreContentType(true)를 호출하여 Jsoup이 컨텐츠 타입을 무시하도록 설정하였습니다.

그러면 Jsoup을 사용하여 웹페이지에서 반환되는 데이터 형식을 원하는 대로 설정할 수 있습니다. 위의 예제는 JSON 형식의 데이터를 설정한 예제이지만, 다른 데이터 형식을 사용하고 싶은 경우에도 비슷한 방법으로 설정할 수 있습니다.

더 자세한 정보를 원하시면, Jsoup 공식 문서를 참고하시기 바랍니다.