[python] Requests-HTML로 웹 페이지의 스타일 시트 추출하기
이번에는 Python의 Requests-HTML 라이브러리를 사용하여 웹 페이지의 스타일 시트(CSS)를 추출하는 방법에 대해 알아보겠습니다.
1. Requests-HTML 라이브러리 설치하기
먼저, Requests-HTML 라이브러리를 설치해야 합니다. 아래의 명령어를 사용하여 설치합니다.
pip install requests-html
2. 웹 페이지의 스타일 시트 추출하기
웹 페이지의 스타일 시트를 추출하기 위해 다음 코드를 사용할 수 있습니다.
from requests_html import HTMLSession
# 세션 생성
session = HTMLSession()
# 웹 페이지 로드
response = session.get("https://example.com")
# 스타일 시트 추출
stylesheets = response.html.xpath("//link[@rel='stylesheet']/@href")
print(stylesheets)
위 코드에서는 HTMLSession
객체를 생성하고, get
메서드를 사용하여 웹 페이지를 로드합니다. 그리고 xpath
메서드를 사용하여 <link rel="stylesheet">
태그의 href
속성을 추출합니다. 추출된 스타일 시트의 URL이 리스트로 반환됩니다.
추출된 스타일 시트를 사용하려면 해당 URL에 다시 요청을 보내 스타일 시트를 가져와 사용할 수 있습니다.
3. 참고 자료
- Requests-HTML 문서: https://docs.python-requests.org/projects/requests-html/
- XPath 문법: https://www.w3schools.com/xml/xpath_intro.asp
위의 코드를 사용하여 Requests-HTML 라이브러리를 통해 웹 페이지의 스타일 시트를 추출해 보세요. 이를 통해 웹 페이지의 스타일 시트를 활용하여 다양한 작업을 수행할 수 있습니다.