[python] 파이썬 웹 크롤링 예제: 쇼핑몰 상품 정보 크롤링하기

최근에 웹 크롤링 기술은 많은 분야에서 활용되고 있습니다. 특히, 쇼핑몰의 상품 정보를 수집하여 분석하는 경우가 많은데, 파이썬을 사용하여 이를 수행하는 방법에 대해 알아보겠습니다.

필요한 라이브러리 설치하기

먼저, 웹 크롤링을 위해 필요한 라이브러리를 설치해야 합니다. requestsbeautifulsoup4 라이브러리를 사용하여 웹 사이트에서 데이터를 가져오고 파싱할 것입니다.

pip install requests beautifulsoup4

웹 사이트에서 데이터 가져오기

다음으로, requests 라이브러리를 사용하여 웹 사이트에서 데이터를 가져오겠습니다. 원하는 쇼핑몰 사이트의 URL을 지정하고 get 메서드를 사용하여 데이터를 가져옵니다.

import requests

url = 'https://www.example.com/products'
response = requests.get(url)

데이터 파싱하기

이제, beautifulsoup4 라이브러리를 사용하여 웹 사이트에서 가져온 데이터를 파싱하고, 필요한 정보를 추출할 수 있습니다.

from bs4 import BeautifulSoup

soup = BeautifulSoup(response.text, 'html.parser')
products = soup.find_all('div', class_='product')
for product in products:
    name = product.find('h2', class_='product-name').text
    price = product.find('span', class_='product-price').text
    print(name, price)

위의 예제를 통해, 파이썬을 사용하여 쇼핑몰의 상품 정보를 크롤링하는 방법을 알아보았습니다. 데이터를 가져오고 파싱하여 필요한 정보를 추출하는 과정을 통해 다양한 분석 및 응용이 가능합니다.

더 자세한 내용은 여기에서 beautifulsoup4 라이브러리에 대해 더 알아볼 수 있습니다.