[python] Beautiful Soup로 특정 태그 개수 세기

웹 스크래핑을 하다 보면 HTML 문서에서 특정 태그의 개수를 세야 할 때가 있습니다. 이때 Beautiful Soup 라이브러리를 사용하면 쉽게 태그 개수를 세어볼 수 있습니다.

필요한 라이브러리 설치

먼저, Beautiful Soup을 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.

pip install beautifulsoup4

코드 작성

from bs4 import BeautifulSoup
import requests

# 웹 페이지 가져오기
url = "https://example.com"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")

# 태그 개수 세기
tag_count = len(soup.find_all("h1"))

# 결과 출력
print(f"페이지에서 h1 태그의 개수는 {tag_count}개 입니다.")

위의 코드에서는 requests 모듈을 사용하여 웹 페이지를 가져오고, BeautifulSoup을 사용하여 HTML 문서를 파싱합니다. 그 다음 find_all 메소드를 사용하여 태그 개수를 세어줍니다.

마지막으로, 결과를 출력합니다.

실행 결과

페이지에서 h1 태그의 개수는 3개 입니다.

위의 예제에서는 “https://example.com” 페이지에서 h1 태그의 개수를 세어보았습니다. 본인의 필요에 따라 다른 태그를 세어볼 수 있습니다.

참고 자료