[java] Jsoup을 사용하여 웹페이지 내 특정 요소 ID 변경하기

웹 크롤링 및 데이터 추출 작업을 위해 Jsoup이라는 자바 라이브러리가 많이 사용됩니다. Jsoup은 HTML 문서를 파싱하고 조작하는 데 사용되며, 웹페이지에서 특정 요소를 선택하여 내용을 수정할 수도 있습니다. 이번 블로그 포스트에서는 Jsoup을 사용하여 웹페이지 내 특정 요소의 ID를 변경하는 방법을 알아보겠습니다.

필요한 라이브러리 추가

먼저 프로젝트에 Jsoup 라이브러리를 추가해야 합니다. Maven을 사용하는 경우, pom.xml 파일에 다음 의존성을 추가합니다:

<dependency>
  <groupId>org.jsoup</groupId>
  <artifactId>jsoup</artifactId>
  <version>1.14.1</version>
</dependency>

Gradle을 사용하는 경우, build.gradle 파일에 다음 의존성을 추가합니다:

implementation 'org.jsoup:jsoup:1.14.1'

웹페이지 내 특정 요소 ID 변경하기

  1. Jsoup를 사용하여 웹페이지를 연결합니다:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class HtmlParser {
  public static void main(String[] args) {
    try {
      // 웹페이지 연결
      String url = "https://example.com";
      Document doc = Jsoup.connect(url).get();
      
      // 특정 요소 ID 변경
      Element element = doc.getElementById("targetElementId");
      element.attr("id", "newElementId");
      
      // 변경된 HTML 출력
      System.out.println(doc.html());
      
    } catch (Exception e) {
      e.printStackTrace();
    }
  }
}
  1. 위의 코드에서 “targetElementId”를 웹페이지에서 실제로 변경하고자 하는 요소의 ID로 대체합니다.

  2. 변경된 HTML을 출력하면 수정된 웹페이지 내용을 확인할 수 있습니다.

결론

Jsoup을 사용하여 웹페이지 내 특정 요소 ID를 변경하는 방법에 대해 알아보았습니다. Jsoup은 웹 크롤링 및 데이터 추출 작업에 매우 편리한 도구이므로, 다양한 웹페이지 조작 작업을 수행할 수 있습니다. Jsoup 공식 문서를 참조하여 더 자세한 사용법을 확인해보세요.

참고 자료