[python] 파이썬 BeautifulSoup으로 HTML 태그 가져오기
BeautifulSoup은 파이썬에서 HTML 웹 페이지를 파싱하고 분석하는 라이브러리입니다. BeautifulSoup을 사용하면 HTML 문서에서 원하는 태그를 쉽게 가져올 수 있습니다.
설치하기
먼저, BeautifulSoup을 설치해야 합니다. 아래의 명령어를 사용하여 pip를 사용하여 설치할 수 있습니다.
pip install beautifulsoup4
사용법
- 필요한 패키지를 임포트합니다.
from bs4 import BeautifulSoup
- HTML 문서를 파싱합니다.
html = """
<html>
<head>
<title>BeautifulSoup Example</title>
</head>
<body>
<h1>파이썬 BeautifulSoup 사용법 예제</h1>
<div class="content">
<p>HTML 태그 가져오기</p>
</div>
</body>
</html>
"""
soup = BeautifulSoup(html, 'html.parser')
- 원하는 태그를 가져옵니다.
# 원하는 태그를 한 개 가져오기
h1_tag = soup.find('h1')
print(h1_tag.text)
# 원하는 태그를 여러 개 가져오기
div_tags = soup.find_all('div')
for div in div_tags:
print(div.text)
실행 결과는 다음과 같습니다:
파이썬 BeautifulSoup 사용법 예제
HTML 태그 가져오기
BeautifulSoup를 사용하면 HTML 문서에서 원하는 태그를 손쉽게 가져올 수 있습니다. 보다 자세한 내용은 BeautifulSoup 공식 문서를 참조하시기 바랍니다.