[python] Requests-HTML로 웹 페이지의 이미지 다운로드하기
웹 페이지에서 이미지를 다운로드하는 것은 웹 스크래핑 작업 중 필요한 작업입니다. 이를 위해 Python의 Requests-HTML
라이브러리를 사용하여 이미지를 다운로드하는 방법을 알아보겠습니다.
1. Requests-HTML
라이브러리 설치하기
먼저, Requests-HTML
라이브러리를 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.
pip install requests-html
2. 이미지 다운로드 코드 작성하기
이제 이미지를 다운로드하기 위한 코드를 작성해보겠습니다. 아래의 코드는 Requests-HTML
를 사용하여 웹 페이지에서 이미지를 가져오고 저장하는 예제입니다.
from requests_html import HTMLSession
# 웹 페이지 URL
url = 'https://example.com'
# HTML 세션 생성
session = HTMLSession()
# 웹 페이지 요청
r = session.get(url)
# 이미지 링크 추출
image_links = r.html.xpath('//img/@src')
# 이미지 다운로드
for link in image_links:
image_request = session.get(link)
image_data = image_request.content
filename = link.split('/')[-1]
with open(filename, 'wb') as f:
f.write(image_data)
위의 코드에서는 HTMLSession
을 사용하여 웹 페이지를 요청합니다. 그리고 웹 페이지에서 이미지 링크를 추출하고, 각 이미지를 다운로드하여 파일로 저장합니다.
3. 실행 결과 확인하기
위의 코드를 실행하면 현재 웹 페이지에서 이미지를 다운로드할 수 있습니다. 이미지 파일은 코드가 실행되는 위치에 저장됩니다.
마무리
이번에는 Requests-HTML
을 사용하여 웹 페이지에서 이미지를 다운로드하는 방법에 대해 알아보았습니다. 이를 응용하여 다른 웹 사이트에서도 이미지를 다운로드할 수 있습니다. 컴퓨터 비전, 데이터 수집 등 다양한 분야에서 유용하게 사용할 수 있습니다.
더 자세한 사용법에 대해서는 Requests-HTML
공식 문서를 참조하시기 바랍니다.