[python] Beautiful Soup로 웹 페이지에서 특정 텍스트로 찾기
Beautiful Soup은 웹 스크래핑에 사용되는 파이썬 라이브러리로, HTML과 XML 문서를 파싱하고 원하는 내용을 추출할 수 있습니다. 이번에는 Beautiful Soup을 사용하여 웹 페이지에서 특정 텍스트를 찾는 방법에 대해 알아보겠습니다.
Beautiful Soup 설치하기
Beautiful Soup를 사용하려면 먼저 라이브러리를 설치해야 합니다. 아래의 명령어를 사용하여 Beautiful Soup를 설치할 수 있습니다.
pip install beautifulsoup4
예제 코드
다음은 Beautiful Soup를 사용하여 웹 페이지에서 특정 텍스트를 찾는 예제 코드입니다.
import requests
from bs4 import BeautifulSoup
# 웹 페이지 가져오기
response = requests.get('http://example.com')
html = response.text
# BeautifulSoup 객체 생성
soup = BeautifulSoup(html, 'html.parser')
# 원하는 텍스트 찾기
text = 'Hello, world!'
result = soup.find(text=text)
if result:
print('텍스트를 찾았습니다:', result)
else:
print('텍스트를 찾을 수 없습니다.')
위의 예제 코드에서는 requests 라이브러리를 사용하여 웹 페이지를 가져옵니다. 가져온 HTML을 BeautifulSoup 객체로 변환한 후, find()
메서드를 사용하여 원하는 텍스트를 찾습니다. find()
메서드는 주어진 텍스트와 정확히 일치하는 첫 번째 요소를 반환하며, 텍스트를 찾지 못할 경우 None
을 반환합니다.