[python] 파이썬 웹 크롤링 예제: 유튜브 동영상 메타데이터 크롤링하기
인터넷에는 많은 데이터가 있다. 그 중에서 유용한 정보를 가져오기 위해 웹 크롤링 기술이 사용된다. 이번 포스트에서는 파이썬을 사용하여 유튜브 동영상의 메타데이터를 크롤링하는 방법을 알아보겠다.
라이브러리 설치하기
먼저, Requests와 BeautifulSoup 라이브러리를 설치해야 한다. 다음 명령어를 사용하여 설치할 수 있다.
pip install requests
pip install beautifulsoup4
코드 작성하기
다음은 크롤링을 위한 파이썬 코드의 예시이다. 크롤링할 URL은 유튜브 동영상 페이지이다.
import requests
from bs4 import BeautifulSoup
url = '유튜브 동영상 URL 주소'
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
# 원하는 데이터 추출
title = soup.find('title').text
views = soup.find('meta', itemprop='interactionCount').get('content')
print('제목:', title)
print('조회수:', views)
결과 확인하기
이제 코드를 실행하여 유튜브 동영상의 제목과 조회수 등의 메타데이터를 출력할 수 있다.
물론, 웹 사이트의 이용 약관을 준수하고, 크롤링 대상의 저작권을 존중하는 것이 중요하다.
이렇게 하여, 파이썬을 사용하여 유튜브 동영상의 메타데이터를 크롤링하는 방법을 알아보았다.
참고 자료: Requests 라이브러리, BeautifulSoup 라이브러리