[python] Beautiful Soup로 웹 페이지에서 특정 텍스트로 찾기

Beautiful Soup은 웹 스크래핑에 사용되는 파이썬 라이브러리로, HTML과 XML 문서를 파싱하고 원하는 내용을 추출할 수 있습니다. 이번에는 Beautiful Soup을 사용하여 웹 페이지에서 특정 텍스트를 찾는 방법에 대해 알아보겠습니다.

Beautiful Soup 설치하기

Beautiful Soup를 사용하려면 먼저 라이브러리를 설치해야 합니다. 아래의 명령어를 사용하여 Beautiful Soup를 설치할 수 있습니다.

pip install beautifulsoup4

예제 코드

다음은 Beautiful Soup를 사용하여 웹 페이지에서 특정 텍스트를 찾는 예제 코드입니다.

import requests
from bs4 import BeautifulSoup

# 웹 페이지 가져오기
response = requests.get('http://example.com')
html = response.text

# BeautifulSoup 객체 생성
soup = BeautifulSoup(html, 'html.parser')

# 원하는 텍스트 찾기
text = 'Hello, world!'
result = soup.find(text=text)

if result:
    print('텍스트를 찾았습니다:', result)
else:
    print('텍스트를 찾을 수 없습니다.')

위의 예제 코드에서는 requests 라이브러리를 사용하여 웹 페이지를 가져옵니다. 가져온 HTML을 BeautifulSoup 객체로 변환한 후, find() 메서드를 사용하여 원하는 텍스트를 찾습니다. find() 메서드는 주어진 텍스트와 정확히 일치하는 첫 번째 요소를 반환하며, 텍스트를 찾지 못할 경우 None을 반환합니다.

참고 자료