[python] Beautiful Soup로 이미지 URL 추출하기

데이터 스크래핑 작업을 수행할 때, 웹 페이지에서 이미지 URL을 추출하는 일이 종종 발생합니다. 이를 위해 Python의 BeautifulSoup 라이브러리를 사용하면 편리하게 수행할 수 있습니다.

BeautifulSoup 설치

먼저, BeautifulSoup 라이브러리를 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.

pip install beautifulsoup4

이미지 URL 추출하기

다음은 Beautiful Soup를 사용하여 이미지 URL을 추출하는 간단한 예제입니다.

from bs4 import BeautifulSoup
import requests

# 이미지 URL을 추출할 웹 페이지의 URL
url = "https://www.example.com"  # 원하는 웹 페이지의 URL로 변경해주세요

# 웹 페이지에 접속하여 내용을 가져옴
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")

# img 태그를 찾아 이미지 URL을 가져옴
images = soup.find_all("img")
for image in images:
    img_url = image["src"]
    print(img_url)

위의 코드에서 url 변수에는 이미지 URL을 추출할 웹 페이지의 URL을 입력해야 합니다. requests 라이브러리를 사용하여 해당 URL의 웹 페이지에 접속하고, BeautifulSoup 객체를 생성하여 HTML 내용을 파싱합니다. 그리고 find_all 메소드를 사용하여 모든 img 태그를 찾은 후, 각 이미지의 URL을 출력합니다.

참고 자료