[java] Jsoup을 사용하여 웹페이지 속성값 가져오기
Jsoup은 자바 언어로 작성된 HTML 파싱 라이브러리입니다. 이 라이브러리를 사용하여 웹 페이지의 속성값을 가져올 수 있습니다. 이 글에서는 Jsoup을 사용하여 웹 페이지에서 특정 속성값을 추출하는 방법에 대해 알아보겠습니다.
1. Jsoup 라이브러리 추가하기
먼저, 프로젝트에 Jsoup 라이브러리를 추가해야 합니다. Maven을 사용하는 경우, pom.xml 파일에 아래의 의존성을 추가합니다.
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.13.1</version>
</dependency>
Gradle을 사용하는 경우, build.gradle 파일에 아래의 의존성을 추가합니다.
dependencies {
implementation 'org.jsoup:jsoup:1.13.1'
}
2. 웹 페이지에서 속성값 가져오기
아래의 예제 코드는 Jsoup을 사용하여 웹 페이지에서 특정 속성값을 가져오는 방법을 보여줍니다.
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class Main {
public static void main(String[] args) {
try {
// 웹 페이지 로드
Document doc = Jsoup.connect("https://example.com").get();
// 웹 페이지에서 요소 선택
Element element = doc.select("a[href]").first();
// 선택한 요소의 속성값 가져오기
String href = element.attr("href");
System.out.println("속성값: " + href);
} catch (Exception e) {
e.printStackTrace();
}
}
}
위의 코드에서는 https://example.com 에 접속한 후, 첫 번째 <a>
태그의 href
속성값을 가져옵니다. attr()
메서드를 사용하여 해당 속성값을 가져올 수 있습니다. 결과는 콘솔에 출력됩니다.
3. 참고 자료
- Jsoup 공식 문서: https://jsoup.org/
- Jsoup 다운로드 페이지: https://jsoup.org/download
위의 참고 자료는 Jsoup을 더욱 자세히 배우고 싶은 경우에 도움이 될 수 있습니다.