[python] Beautiful Soup로 이미지 다운로드하기

이번 포스트에서는 Python 언어를 사용하여 Beautiful Soup 라이브러리를 활용해 웹페이지에서 이미지를 다운로드하는 방법을 알아보겠습니다.

Beautiful Soup이란?

Beautiful Soup은 웹스크래핑과 크롤링을 위해 사용되는 파이썬 라이브러리입니다. HTML, XML과 같은 마크업 언어를 파싱하여 원하는 정보를 가져올 수 있습니다.

Beautiful Soup 설치하기

Beautiful Soup을 설치하기 위해서는 pip 명령어를 사용합니다.

pip install beautifulsoup4

이미지 다운로드하는 코드 작성하기

먼저 해당 이미지를 포함한 웹페이지의 HTML 소스코드를 가져옵니다. 이를 위해 requests 라이브러리를 사용합니다.

import requests
from bs4 import BeautifulSoup

# 웹페이지의 HTML 소스코드 가져오기
url = "https://example.com"
response = requests.get(url)
html = response.text

# BeautifulSoup 객체 생성
soup = BeautifulSoup(html, "html.parser")

이제 웹페이지의 이미지 태그를 찾아 해당 이미지의 URL을 가져옵니다.

# 이미지 태그 찾기
image_tags = soup.find_all("img")

# 이미지 URL 가져오기
image_urls = []
for image in image_tags:
    image_urls.append(image["src"])

이미지 URL 리스트에서 이미지를 다운로드합니다.

# 이미지 다운로드
for url in image_urls:
    response = requests.get(url)
    image_data = response.content

    # 이미지 파일 저장
    with open("image.jpg", "wb") as file:
        file.write(image_data)

위의 코드에서는 이미지를 image.jpg라는 파일 이름으로 저장합니다. 필요에 따라 파일 이름을 변경할 수 있습니다.

마무리

지금까지 Python의 Beautiful Soup 라이브러리를 사용하여 웹페이지에서 이미지를 다운로드하는 방법을 알아보았습니다. Beautiful Soup은 웹스크래핑과 크롤링에 큰 도움을 주는 강력한 도구이니, 자유롭게 활용해보세요.

참고 문서