[python] Requests-HTML로 웹 페이지의 이미지 다운로드하기

01 Dec 2023

python

웹 페이지에서 이미지를 다운로드하는 것은 웹 스크래핑 작업 중 필요한 작업입니다. 이를 위해 Python의 Requests-HTML 라이브러리를 사용하여 이미지를 다운로드하는 방법을 알아보겠습니다.

1. `Requests-HTML` 라이브러리 설치하기

먼저, Requests-HTML 라이브러리를 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.

pip install requests-html

2. 이미지 다운로드 코드 작성하기

이제 이미지를 다운로드하기 위한 코드를 작성해보겠습니다. 아래의 코드는 Requests-HTML를 사용하여 웹 페이지에서 이미지를 가져오고 저장하는 예제입니다.

from requests_html import HTMLSession

# 웹 페이지 URL
url = 'https://example.com'

# HTML 세션 생성
session = HTMLSession()

# 웹 페이지 요청
r = session.get(url)

# 이미지 링크 추출
image_links = r.html.xpath('//img/@src')

# 이미지 다운로드
for link in image_links:
    image_request = session.get(link)
    image_data = image_request.content
    filename = link.split('/')[-1]
    
    with open(filename, 'wb') as f:
        f.write(image_data)

위의 코드에서는 HTMLSession을 사용하여 웹 페이지를 요청합니다. 그리고 웹 페이지에서 이미지 링크를 추출하고, 각 이미지를 다운로드하여 파일로 저장합니다.

3. 실행 결과 확인하기

위의 코드를 실행하면 현재 웹 페이지에서 이미지를 다운로드할 수 있습니다. 이미지 파일은 코드가 실행되는 위치에 저장됩니다.

마무리

이번에는 Requests-HTML을 사용하여 웹 페이지에서 이미지를 다운로드하는 방법에 대해 알아보았습니다. 이를 응용하여 다른 웹 사이트에서도 이미지를 다운로드할 수 있습니다. 컴퓨터 비전, 데이터 수집 등 다양한 분야에서 유용하게 사용할 수 있습니다.

더 자세한 사용법에 대해서는 Requests-HTML 공식 문서를 참조하시기 바랍니다.

Requests-HTML 공식 문서

1. Requests-HTML 라이브러리 설치하기

2. 이미지 다운로드 코드 작성하기

3. 실행 결과 확인하기

마무리

1. `Requests-HTML` 라이브러리 설치하기