[python] Beautiful Soup로 특정 태그 개수 세기
웹 스크래핑을 하다 보면 HTML 문서에서 특정 태그의 개수를 세야 할 때가 있습니다. 이때 Beautiful Soup 라이브러리를 사용하면 쉽게 태그 개수를 세어볼 수 있습니다.
필요한 라이브러리 설치
먼저, Beautiful Soup을 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.
pip install beautifulsoup4
코드 작성
from bs4 import BeautifulSoup
import requests
# 웹 페이지 가져오기
url = "https://example.com"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
# 태그 개수 세기
tag_count = len(soup.find_all("h1"))
# 결과 출력
print(f"페이지에서 h1 태그의 개수는 {tag_count}개 입니다.")
위의 코드에서는 requests
모듈을 사용하여 웹 페이지를 가져오고, BeautifulSoup
을 사용하여 HTML 문서를 파싱합니다. 그 다음 find_all
메소드를 사용하여 태그 개수를 세어줍니다.
마지막으로, 결과를 출력합니다.
실행 결과
페이지에서 h1 태그의 개수는 3개 입니다.
위의 예제에서는 “https://example.com” 페이지에서 h1
태그의 개수를 세어보았습니다. 본인의 필요에 따라 다른 태그를 세어볼 수 있습니다.