[python] Beautiful Soup로 웹 페이지에서 특정 숫자 추출하기
Beautiful Soup은 파이썬의 HTML, XML 파싱 라이브러리입니다. 이 라이브러리를 사용하면 웹 페이지의 HTML 요소를 쉽게 추출하고 조작할 수 있습니다. 이번에는 Beautiful Soup을 사용하여 웹 페이지에서 특정 숫자를 추출하는 방법에 대해 알아보겠습니다.
Beautiful Soup 설치
먼저, Beautiful Soup을 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.
pip install beautifulsoup4
웹 페이지에서 특정 숫자 추출하기
이제 Beautiful Soup을 이용하여 웹 페이지에서 특정 숫자를 추출하는 방법을 알아보겠습니다.
- 필요한 라이브러리를 import 합니다.
from bs4 import BeautifulSoup
import requests
- 웹 페이지의 HTML 소스 코드를 가져옵니다.
url = "웹 페이지 URL"
response = requests.get(url)
html = response.text
- Beautiful Soup을 이용하여 HTML 요소를 파싱합니다.
soup = BeautifulSoup(html, 'html.parser')
- 원하는 숫자가 있는 HTML 요소를 선택합니다. 예를 들어,
<span>
태그 안에 있는 숫자를 추출하고 싶다면 다음과 같이 작성할 수 있습니다.
number = soup.find('span').text
- 추출한 숫자를 출력하거나 다른 용도로 활용합니다.
print(number)
예제 코드
다음은 Beautiful Soup을 사용하여 웹 페이지에서 특정 숫자를 추출하는 예제 코드입니다.
from bs4 import BeautifulSoup
import requests
url = "웹 페이지 URL"
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
number = soup.find('span').text
print(number)
결론
Beautiful Soup을 사용하면 웹 페이지의 HTML 요소를 쉽게 추출하고 조작할 수 있습니다. 이번 예제에서는 특정 숫자를 추출하는 방법을 알아보았습니다. 해당 방법을 응용하여 다양한 웹 스크래핑 작업을 수행할 수 있습니다.