[파이썬] `requests-html` 설치하기
Python에서 웹 스크래핑을 할 때, requests-html은 매우 유용한 도구입니다. requests-html은 BeautifulSoup과 requests를 결합한 라이브러리로, HTML 문서를 쉽게 가져오고 파싱할 수 있습니다. 이제 requests-html을 설치하는 방법에 대해 알아보겠습니다.
파이썬 가상환경 설정하기 (선택사항)
먼저, 파이썬 가상환경을 설정하는 것이 좋습니다. 가상환경을 설정하면 다른 프로젝트와 충돌하지 않고, 프로젝트마다 필요한 패키지를 독립적으로 설치할 수 있습니다. 가상환경을 설정하기 위해 다음 명령어를 사용합니다:
python3 -m venv myenv
위 명령어를 실행하면 myenv
라는 이름의 가상환경이 생성됩니다.
requests-html
설치하기
가상환경을 설정하신 경우, 가상환경을 활성화 시킵니다:
source myenv/bin/activate
requests-html은 pip를 통해 설치할 수 있습니다. 다음 명령어를 사용하여 설치합니다:
pip install requests-html
설치가 완료되면, 다음과 같이 예제 코드를 사용하여 requests-html을 사용할 수 있습니다:
from requests_html import HTMLSession
# HTMLSession 객체 생성
session = HTMLSession()
# 웹사이트에 GET 요청을 보내고 페이지를 가져옵니다
r = session.get('https://www.example.com')
# 가져온 페이지를 파싱합니다
r.html.render()
# CSS 선택자를 사용하여 요소를 찾습니다
title_element = r.html.find('h1', first=True)
# 요소의 텍스트를 출력합니다
print(title_element.text)
위 예제 코드에서는 requests_html을 사용하여 웹사이트에서 페이지를 가져오고, 페이지를 렌더링한 후 CSS 선택자를 사용하여 요소를 찾고 요소의 텍스트를 출력합니다.
이제 requests-html을 설치하고 사용하는 방법을 이해하셨습니다. 웹 스크래핑을 할 때 유용한 도구로 requests-html을 활용해 보세요!