[python] Requests-HTML로 웹 페이지의 스타일 시트 추출하기

이번에는 Python의 Requests-HTML 라이브러리를 사용하여 웹 페이지의 스타일 시트(CSS)를 추출하는 방법에 대해 알아보겠습니다.

1. Requests-HTML 라이브러리 설치하기

먼저, Requests-HTML 라이브러리를 설치해야 합니다. 아래의 명령어를 사용하여 설치합니다.

pip install requests-html

2. 웹 페이지의 스타일 시트 추출하기

웹 페이지의 스타일 시트를 추출하기 위해 다음 코드를 사용할 수 있습니다.

from requests_html import HTMLSession

# 세션 생성
session = HTMLSession()

# 웹 페이지 로드
response = session.get("https://example.com")

# 스타일 시트 추출
stylesheets = response.html.xpath("//link[@rel='stylesheet']/@href")

print(stylesheets)

위 코드에서는 HTMLSession 객체를 생성하고, get 메서드를 사용하여 웹 페이지를 로드합니다. 그리고 xpath 메서드를 사용하여 <link rel="stylesheet"> 태그의 href 속성을 추출합니다. 추출된 스타일 시트의 URL이 리스트로 반환됩니다.

추출된 스타일 시트를 사용하려면 해당 URL에 다시 요청을 보내 스타일 시트를 가져와 사용할 수 있습니다.

3. 참고 자료

위의 코드를 사용하여 Requests-HTML 라이브러리를 통해 웹 페이지의 스타일 시트를 추출해 보세요. 이를 통해 웹 페이지의 스타일 시트를 활용하여 다양한 작업을 수행할 수 있습니다.