[python] 파이썬 BeautifulSoup으로 HTML 태그 가져오기

04 Dec 2023

python

BeautifulSoup은 파이썬에서 HTML 웹 페이지를 파싱하고 분석하는 라이브러리입니다. BeautifulSoup을 사용하면 HTML 문서에서 원하는 태그를 쉽게 가져올 수 있습니다.

설치하기

먼저, BeautifulSoup을 설치해야 합니다. 아래의 명령어를 사용하여 pip를 사용하여 설치할 수 있습니다.

pip install beautifulsoup4

사용법

필요한 패키지를 임포트합니다.

from bs4 import BeautifulSoup

HTML 문서를 파싱합니다.

html = """
<html>
  <head>
    <title>BeautifulSoup Example</title>
  </head>
  <body>
    <h1>파이썬 BeautifulSoup 사용법 예제</h1>
    <div class="content">
      <p>HTML 태그 가져오기</p>
    </div>
  </body>
</html>
"""

soup = BeautifulSoup(html, 'html.parser')

원하는 태그를 가져옵니다.

# 원하는 태그를 한 개 가져오기
h1_tag = soup.find('h1')
print(h1_tag.text)

# 원하는 태그를 여러 개 가져오기
div_tags = soup.find_all('div')
for div in div_tags:
  print(div.text)

실행 결과는 다음과 같습니다:

파이썬 BeautifulSoup 사용법 예제
HTML 태그 가져오기

BeautifulSoup를 사용하면 HTML 문서에서 원하는 태그를 손쉽게 가져올 수 있습니다. 보다 자세한 내용은 BeautifulSoup 공식 문서를 참조하시기 바랍니다.