[java] Jsoup을 사용하여 웹페이지 내 특정 요소 보이기
웹 스크래핑을 위해 자바에서 Jsoup 라이브러리를 사용할 수 있습니다. Jsoup은 HTML 문서의 파싱 및 조작을 위한 간편한 API를 제공합니다. 이 라이브러리를 사용하여 웹페이지에서 특정 요소를 선택하고 보여주는 방법을 알아보겠습니다.
1. Jsoup 의존성 추가
먼저, 프로젝트의 의존성 관리 도구에 Jsoup을 추가해야 합니다. Maven을 사용하는 경우 pom.xml
파일에 다음과 같이 의존성을 추가합니다:
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.14.3</version>
</dependency>
Gradle을 사용하는 경우 build.gradle
파일에 다음과 같이 의존성을 추가합니다:
implementation 'org.jsoup:jsoup:1.14.3'
의존성을 추가한 후, 해당 프로젝트를 빌드하면 Jsoup을 사용할 수 있습니다.
2. 웹페이지에서 특정 요소 보이기
다음은 Jsoup을 사용하여 웹페이지에서 특정 요소를 선택하고 보여주는 예제입니다. 예를 들어, “https://example.com” 페이지에서 <title>
요소를 선택하여 출력하는 코드입니다:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupExample {
public static void main(String[] args) {
try {
// 웹페이지 가져오기
Document doc = Jsoup.connect("https://example.com").get();
// 특정 요소 선택하기
Element titleElement = doc.select("title").first();
// 요소 출력하기
if (titleElement != null) {
System.out.println("Title: " + titleElement.text());
} else {
System.out.println("Title element not found.");
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
위의 코드를 실행하면 “https://example.com” 페이지의 <title>
요소의 내용이 출력됩니다. 만약 해당 요소가 존재하지 않으면 “Title element not found.”가 출력됩니다.