[python] Beautiful Soup로 웹 페이지에서 특정 숫자 추출하기

Beautiful Soup은 파이썬의 HTML, XML 파싱 라이브러리입니다. 이 라이브러리를 사용하면 웹 페이지의 HTML 요소를 쉽게 추출하고 조작할 수 있습니다. 이번에는 Beautiful Soup을 사용하여 웹 페이지에서 특정 숫자를 추출하는 방법에 대해 알아보겠습니다.

Beautiful Soup 설치

먼저, Beautiful Soup을 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.

pip install beautifulsoup4

웹 페이지에서 특정 숫자 추출하기

이제 Beautiful Soup을 이용하여 웹 페이지에서 특정 숫자를 추출하는 방법을 알아보겠습니다.

  1. 필요한 라이브러리를 import 합니다.
from bs4 import BeautifulSoup
import requests
  1. 웹 페이지의 HTML 소스 코드를 가져옵니다.
url = "웹 페이지 URL"
response = requests.get(url)
html = response.text
  1. Beautiful Soup을 이용하여 HTML 요소를 파싱합니다.
soup = BeautifulSoup(html, 'html.parser')
  1. 원하는 숫자가 있는 HTML 요소를 선택합니다. 예를 들어, <span> 태그 안에 있는 숫자를 추출하고 싶다면 다음과 같이 작성할 수 있습니다.
number = soup.find('span').text
  1. 추출한 숫자를 출력하거나 다른 용도로 활용합니다.
print(number)

예제 코드

다음은 Beautiful Soup을 사용하여 웹 페이지에서 특정 숫자를 추출하는 예제 코드입니다.

from bs4 import BeautifulSoup
import requests

url = "웹 페이지 URL"
response = requests.get(url)
html = response.text

soup = BeautifulSoup(html, 'html.parser')
number = soup.find('span').text

print(number)

결론

Beautiful Soup을 사용하면 웹 페이지의 HTML 요소를 쉽게 추출하고 조작할 수 있습니다. 이번 예제에서는 특정 숫자를 추출하는 방법을 알아보았습니다. 해당 방법을 응용하여 다양한 웹 스크래핑 작업을 수행할 수 있습니다.

참고 자료