[python] Requests-HTML로 웹 페이지의 폰트 추출하기
웹 페이지에서 폰트를 추출하는 것은 웹 크롤링 및 데이터 분석과 같은 다양한 작업에 유용할 수 있습니다. 이번 포스트에서는 Requests-HTML
라이브러리를 사용하여 웹 페이지의 폰트를 추출하는 방법을 알아보겠습니다.
1. Requests-HTML 설치하기
먼저, Requests-HTML
라이브러리를 설치해야 합니다. 다음 명령어를 사용하여 설치할 수 있습니다:
pip install requests-html
2. 폰트 추출하기
아래 코드는 Requests-HTML
라이브러리를 사용하여 웹 페이지의 모든 폰트를 추출하는 예제입니다.
from requests_html import HTMLSession
# 웹 페이지 URL
url = "https://example.com"
# HTMLSession 객체 생성
session = HTMLSession()
# 웹 페이지 가져오기
response = session.get(url)
# 모든 폰트 가져오기
fonts = response.html.xpath("//link[@rel='stylesheet']/@href")
# 폰트 출력
for font in fonts:
print(font)
위 코드에서는 HTMLSession
클래스를 사용하여 웹 페이지를 가져오고, xpath
메서드를 사용하여 웹 페이지에서 폰트를 추출합니다. 결과는 각 폰트의 URL을 출력합니다.
3. 실행하기
위 코드를 복사하여 파이썬 파일에 붙여넣고 실행하면, 웹 페이지의 폰트가 추출되어 출력됩니다.
결론
이번 포스트에서는 Requests-HTML
라이브러리를 사용하여 웹 페이지의 폰트를 추출하는 방법을 알아보았습니다. 폰트 추출은 웹 크롤링 및 데이터 분석 작업에서 유용하게 사용될 수 있으며, 이를 통해 다양한 정보를 수집하고 분석할 수 있습니다.
참고자료
- Requests-HTML 공식 문서: https://requests-html.kennethreitz.org/