[python] 파이썬 웹 크롤링 예제: 쇼핑몰 상품 정보 크롤링하기
최근에 웹 크롤링 기술은 많은 분야에서 활용되고 있습니다. 특히, 쇼핑몰의 상품 정보를 수집하여 분석하는 경우가 많은데, 파이썬을 사용하여 이를 수행하는 방법에 대해 알아보겠습니다.
필요한 라이브러리 설치하기
먼저, 웹 크롤링을 위해 필요한 라이브러리를 설치해야 합니다. requests
와 beautifulsoup4
라이브러리를 사용하여 웹 사이트에서 데이터를 가져오고 파싱할 것입니다.
pip install requests beautifulsoup4
웹 사이트에서 데이터 가져오기
다음으로, requests
라이브러리를 사용하여 웹 사이트에서 데이터를 가져오겠습니다. 원하는 쇼핑몰 사이트의 URL을 지정하고 get
메서드를 사용하여 데이터를 가져옵니다.
import requests
url = 'https://www.example.com/products'
response = requests.get(url)
데이터 파싱하기
이제, beautifulsoup4
라이브러리를 사용하여 웹 사이트에서 가져온 데이터를 파싱하고, 필요한 정보를 추출할 수 있습니다.
from bs4 import BeautifulSoup
soup = BeautifulSoup(response.text, 'html.parser')
products = soup.find_all('div', class_='product')
for product in products:
name = product.find('h2', class_='product-name').text
price = product.find('span', class_='product-price').text
print(name, price)
위의 예제를 통해, 파이썬을 사용하여 쇼핑몰의 상품 정보를 크롤링하는 방법을 알아보았습니다. 데이터를 가져오고 파싱하여 필요한 정보를 추출하는 과정을 통해 다양한 분석 및 응용이 가능합니다.
더 자세한 내용은 여기에서 beautifulsoup4
라이브러리에 대해 더 알아볼 수 있습니다.