[java] Jsoup을 사용하여 웹페이지 URL 변경하기

웹 스크래핑을 위해 자바에서 Jsoup 라이브러리를 사용할 때, 때로는 웹페이지의 URL을 변경해야 할 때가 있습니다. 이 글에서는 Jsoup을 사용하여 웹페이지 URL을 변경하는 방법에 대해 알아보겠습니다.

Jsoup 사용하기

먼저, Jsoup을 사용하기 위해서는 먼저 Jsoup 라이브러리를 다운로드하고 클래스패스에 추가해야 합니다. Maven 프로젝트의 경우, Maven 종속성으로 Jsoup을 추가할 수 있습니다.

<dependency>
  <groupId>org.jsoup</groupId>
  <artifactId>jsoup</artifactId>
  <version>1.14.3</version>
</dependency>

웹페이지 URL 변경하기

Jsoup을 사용하여 웹페이지의 URL을 변경하기 위해선, connect() 메소드를 사용해 Jsoup Connection 객체를 생성하고, URL을 설정해주어야 합니다. 그러면 변경된 URL의 HTML 내용을 가져올 수 있습니다.

다음은 Jsoup을 사용하여 웹페이지의 URL을 변경하는 예제 코드입니다.

import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

public class URLChanger {

    public static void main(String[] args) {
        String url = "http://example.com";
        String newUrl = "http://newexample.com";

        try {
            // 기존 URL에 접속
            Connection connection = Jsoup.connect(url);
            Document document = connection.get();
            
            // 새로운 URL로 변경
            connection = Jsoup.connect(newUrl);
            document = connection.get();
            
            // 변경된 URL의 HTML 내용 출력
            System.out.println(document.html());
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

위의 예제 코드에서는 http://example.com에 접속한 후, http://newexample.com으로 URL을 변경하고, 변경된 URL의 HTML 내용을 출력합니다.

이제 위의 예제 코드를 실행하면 변경된 URL의 HTML 내용을 확인할 수 있습니다.

결론

Jsoup을 사용하여 웹페이지의 URL을 변경하는 것은 간단합니다. connect() 메소드를 사용하여 Jsoup Connection 객체를 생성하고, get() 메소드를 호출하여 HTML 내용을 가져오면 됩니다. 이를 응용하면 다양한 웹 스크래핑 작업을 수행할 수 있습니다.