[python] Beautiful Soup로 웹 페이지에서 다중 조건으로 찾기

30 Nov 2023

python

웹 페이지에서 다양한 조건을 사용하여 원하는 정보를 찾는 경우가 많습니다. 이를 위해 파이썬의 Beautiful Soup 라이브러리를 사용할 수 있습니다. Beautiful Soup는 HTML 및 XML에서 원하는 요소를 쉽게 추출할 수 있는 강력한 도구입니다.

Beautiful Soup 설치하기

Beautiful Soup는 pip를 사용하여 간단하게 설치할 수 있습니다. 아래의 명령을 사용하여 설치하세요.

pip install beautifulsoup4

Beautiful Soup로 HTML 파싱하기

Beautiful Soup를 사용하여 HTML을 파싱하려면 먼저 HTML을 가져와야 합니다. requests 라이브러리를 사용하여 웹 페이지의 HTML을 가져올 수 있습니다. 다음은 requests 라이브러리를 사용하여 웹 페이지의 HTML을 가져오는 예제입니다.

import requests

url = "https://example.com"
response = requests.get(url)
html = response.text

이제 Beautiful Soup를 사용하여 HTML을 파싱할 수 있습니다. 아래는 Beautiful Soup를 사용하여 특정 태그와 클래스를 기반으로 원하는 요소를 찾는 예제입니다.

from bs4 import BeautifulSoup

# Beautiful Soup 객체 생성
soup = BeautifulSoup(html, 'html.parser')

# 원하는 요소를 찾기 위한 조건 설정
tag = "div"
class_ = "content"

# find_all 메서드를 사용하여 다중 조건으로 요소 찾기
elements = soup.find_all(tag, class_=class_)

# 찾은 요소를 출력
for element in elements:
    print(element.text)

위의 예제에서 tag 변수에 찾으려는 태그 이름을, class_ 변수에 찾으려는 클래스 이름을 지정하면 됩니다. find_all 메서드는 조건을 만족하는 모든 요소를 반환하므로, 이를 반복문을 사용하여 출력할 수 있습니다.

Beautiful Soup는 다양한 조건을 사용하여 웹 페이지에서 원하는 정보를 찾는데 매우 유용한 도구입니다. 위의 예제를 참고하여 원하는 조건을 설정하여 데이터를 추출해보세요.

Beautiful Soup 설치하기

Beautiful Soup로 HTML 파싱하기

참고 자료