[java] Jsoup을 사용하여 웹페이지 URL 변경하기
웹 스크래핑을 위해 자바에서 Jsoup 라이브러리를 사용할 때, 때로는 웹페이지의 URL을 변경해야 할 때가 있습니다. 이 글에서는 Jsoup을 사용하여 웹페이지 URL을 변경하는 방법에 대해 알아보겠습니다.
Jsoup 사용하기
먼저, Jsoup을 사용하기 위해서는 먼저 Jsoup 라이브러리를 다운로드하고 클래스패스에 추가해야 합니다. Maven 프로젝트의 경우, Maven 종속성으로 Jsoup을 추가할 수 있습니다.
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.14.3</version>
</dependency>
웹페이지 URL 변경하기
Jsoup을 사용하여 웹페이지의 URL을 변경하기 위해선, connect()
메소드를 사용해 Jsoup Connection
객체를 생성하고, URL을 설정해주어야 합니다. 그러면 변경된 URL의 HTML 내용을 가져올 수 있습니다.
다음은 Jsoup을 사용하여 웹페이지의 URL을 변경하는 예제 코드입니다.
import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class URLChanger {
public static void main(String[] args) {
String url = "http://example.com";
String newUrl = "http://newexample.com";
try {
// 기존 URL에 접속
Connection connection = Jsoup.connect(url);
Document document = connection.get();
// 새로운 URL로 변경
connection = Jsoup.connect(newUrl);
document = connection.get();
// 변경된 URL의 HTML 내용 출력
System.out.println(document.html());
} catch (Exception e) {
e.printStackTrace();
}
}
}
위의 예제 코드에서는 http://example.com
에 접속한 후, http://newexample.com
으로 URL을 변경하고, 변경된 URL의 HTML 내용을 출력합니다.
이제 위의 예제 코드를 실행하면 변경된 URL의 HTML 내용을 확인할 수 있습니다.
결론
Jsoup을 사용하여 웹페이지의 URL을 변경하는 것은 간단합니다. connect()
메소드를 사용하여 Jsoup Connection
객체를 생성하고, get()
메소드를 호출하여 HTML 내용을 가져오면 됩니다. 이를 응용하면 다양한 웹 스크래핑 작업을 수행할 수 있습니다.