[파이썬] requests-html 사용 사례: 주식 데이터 스크레이핑

06 Sep 2023

requests-html

주식 시장에서 데이터를 스크레이핑하여 분석하는 것은 투자자에게 중요한 정보를 제공합니다. 이번 블로그 게시물에서는 Python의 requests-html 라이브러리를 사용하여 주식 데이터를 스크레이핑하는 방법을 알아보겠습니다. requests-html는 HTTP 요청 및 HTML 파싱을 간편하게 할 수 있는 강력한 도구입니다.

1. requests-html 설치하기

먼저, requests-html 라이브러리를 설치해야 합니다. 터미널 또는 명령 프롬프트에서 다음 명령어를 실행하여 라이브러리를 설치합니다.

pip install requests-html

2. 주식 데이터 스크레이핑 예제 코드

다음은 requests-html를 사용하여 주식 데이터를 스크레이핑하는 예제 코드입니다.

from requests_html import HTMLSession

# HTMLSession 객체 생성
session = HTMLSession()

# 주식 데이터 스크레이핑할 웹 페이지 URL
url = "https://www.example.com/stock-data"

# 웹 페이지 요청 및 HTML 파싱
r = session.get(url)

# 주식 데이터 추출
stock_data = r.html.find("#stock-data", first=True).text

# 추출된 데이터 출력
print(stock_data)

위의 예제 코드에서는 HTMLSession 객체를 생성하고, get() 메서드를 사용하여 주식 데이터를 스크레이핑할 웹 페이지에 HTTP 요청을 보냅니다. 그리고 html 속성을 사용하여 응답받은 HTML을 파싱합니다.

파싱된 HTML에서 필요한 주식 데이터를 추출하기 위해 find() 메서드를 사용합니다. find() 메서드는 CSS 선택자를 통해 특정 요소를 찾아줍니다. 추출된 데이터는 .text 속성을 통해 텍스트 형태로 얻을 수 있습니다.

마지막으로, 추출된 주식 데이터를 출력하는 예제입니다.

3. 요약

이번 블로그 게시물에서는 requests-html를 사용하여 주식 데이터를 스크레이핑하는 방법을 알아보았습니다. requests-html은 강력하고 사용하기 쉬운 도구로서, 주식 데이터 스크레이핑을 포함한 다양한 웹 스크레이핑 작업에 유용하게 활용될 수 있습니다.