[python] Requests-HTML로 웹 페이지의 폰트 추출하기

01 Dec 2023

python

웹 페이지에서 폰트를 추출하는 것은 웹 크롤링 및 데이터 분석과 같은 다양한 작업에 유용할 수 있습니다. 이번 포스트에서는 Requests-HTML 라이브러리를 사용하여 웹 페이지의 폰트를 추출하는 방법을 알아보겠습니다.

1. Requests-HTML 설치하기

먼저, Requests-HTML 라이브러리를 설치해야 합니다. 다음 명령어를 사용하여 설치할 수 있습니다:

pip install requests-html

2. 폰트 추출하기

아래 코드는 Requests-HTML 라이브러리를 사용하여 웹 페이지의 모든 폰트를 추출하는 예제입니다.

from requests_html import HTMLSession

# 웹 페이지 URL
url = "https://example.com"

# HTMLSession 객체 생성
session = HTMLSession()

# 웹 페이지 가져오기
response = session.get(url)

# 모든 폰트 가져오기
fonts = response.html.xpath("//link[@rel='stylesheet']/@href")

# 폰트 출력
for font in fonts:
    print(font)

위 코드에서는 HTMLSession 클래스를 사용하여 웹 페이지를 가져오고, xpath 메서드를 사용하여 웹 페이지에서 폰트를 추출합니다. 결과는 각 폰트의 URL을 출력합니다.

3. 실행하기

위 코드를 복사하여 파이썬 파일에 붙여넣고 실행하면, 웹 페이지의 폰트가 추출되어 출력됩니다.

결론

이번 포스트에서는 Requests-HTML 라이브러리를 사용하여 웹 페이지의 폰트를 추출하는 방법을 알아보았습니다. 폰트 추출은 웹 크롤링 및 데이터 분석 작업에서 유용하게 사용될 수 있으며, 이를 통해 다양한 정보를 수집하고 분석할 수 있습니다.

참고자료

Requests-HTML 공식 문서: https://requests-html.kennethreitz.org/