[python] 파이썬 BeautifulSoup으로 웹 사이트 비디오 추가

파이썬 BeautifulSoup 라이브러리는 웹 스크래핑에 유용한 도구입니다. 이 라이브러리를 사용하면 웹 사이트에서 비디오를 추출하고 다른 웹 사이트에 추가할 수 있습니다. 이번 포스트에서는 BeautifulSoup을 사용하여 웹 사이트에서 비디오를 추출한 후 다른 웹 사이트에 추가하는 방법에 대해 알아보겠습니다.

1. BeautifulSoup 설치

먼저 BeautifulSoup을 설치해야 합니다. 다음 명령어를 사용하여 BeautifulSoup을 설치하세요.

pip install beautifulsoup4

2. 웹 사이트에서 비디오 추출

BeautifulSoup을 사용하여 웹 사이트에서 비디오를 추출하는 방법을 알아보겠습니다. 예를 들어, “https://www.example.com” 이라는 웹 사이트에서 비디오를 추출한다고 가정해 보겠습니다.

from bs4 import BeautifulSoup
import requests

# 웹 사이트의 HTML 가져오기
url = "https://www.example.com"
response = requests.get(url)
html_content = response.text

# BeautifulSoup을 사용하여 HTML 파싱
soup = BeautifulSoup(html_content, "html.parser")

# 비디오 태그 선택하기
video_tags = soup.find_all("video")

# 비디오 URL 추출하기
video_urls = []
for video_tag in video_tags:
    video_url = video_tag["src"]
    video_urls.append(video_url)

# 추출한 비디오 URL 출력하기
for video_url in video_urls:
    print(video_url)

위의 코드는 웹 사이트에서 비디오 태그를 선택하고, 각 비디오 태그에서 URL을 추출하여 출력하는 간단한 예제입니다.

3. 다른 웹 사이트에 비디오 추가

이제 추출한 비디오를 다른 웹 사이트에 추가하는 방법을 알아보겠습니다. 예를 들어, “https://www.example2.com” 이라는 웹 사이트에 비디오를 추가한다고 가정해 보겠습니다.

from bs4 import BeautifulSoup
import requests

# 비디오 추가할 웹 사이트의 HTML 가져오기
url = "https://www.example2.com"
response = requests.get(url)
html_content = response.text

# BeautifulSoup을 사용하여 HTML 파싱
soup = BeautifulSoup(html_content, "html.parser")

# 비디오 추가를 위한 HTML 코드 생성
video_html = """
<video src="{}" controls>
    Your browser does not support the video tag.
</video>
"""

# 추출한 비디오 URL을 웹 사이트에 추가하기
for video_url in video_urls:
    video_element = BeautifulSoup(video_html.format(video_url), "html.parser")
    soup.body.append(video_element)

# 변경된 HTML을 파일로 저장하기
with open("output.html", "w") as file:
    file.write(str(soup))

위의 코드는 다른 웹 사이트의 HTML을 가져와서 BeautifulSoup을 사용하여 파싱한 후, 추출한 비디오 URL을 웹 사이트에 추가하는 예제입니다. 변경된 HTML은 “output.html” 파일로 저장됩니다.

이제 파이썬 BeautifulSoup을 사용하여 웹 사이트에서 비디오를 추출하고, 다른 웹 사이트에 추가하는 방법에 대해 알아보았습니다. 이 예제 코드를 활용하여 웹 스크래핑 작업을 수행해 보세요.

참고 자료