[python] 파이썬 웹 크롤링 예제: 네이버 실시간 검색어 크롤링하기

15 Dec 2023

python

인터넷에는 많은 웹 데이터가 존재하며, 이 중에서도 네이버와 같은 포털 사이트에는 다양한 정보가 실시간으로 업데이트됩니다. 이번 포스트에서는 파이썬을 사용하여 네이버의 실시간 검색어를 크롤링하는 방법에 대해 알아보겠습니다.

라이브러리 설치

첫 번째 단계는 필요한 라이브러리를 설치하는 것입니다. 이번 예제에서는 requests와 BeautifulSoup 라이브러리를 사용할 것이므로, 다음과 같이 명령어를 입력하여 각각의 라이브러리를 설치합니다.

pip install requests
pip install beautifulsoup4

파이썬 코드 작성

이제 실제로 파이썬으로 네이버 실시간 검색어를 크롤링해보겠습니다.

import requests
from bs4 import BeautifulSoup

url = 'https://www.naver.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

realtime_keywords = soup.select('.ah_roll_area > .ah_l > .ah_item > .ah_a > .ah_k')

for keyword in realtime_keywords:
    print(keyword.text)

위 코드에서는 requests 라이븸러리를 사용하여 네이버의 실시간 검색어 페이지에 접근하고, BeautifulSoup를 사용하여 HTML을 파싱합니다. 그리고 그 결과에서 CSS selector를 사용하여 실시간 검색어를 추출하고 각 검색어를 출력합니다.

이를 실행하면 네이버의 실시간 검색어 목록을 파이썬 콘솔에서 확인할 수 있습니다.

이상으로 파이썬을 사용하여 네이버의 실시간 검색어를 크롤링하는 간단한 예제를 살펴보았습니다.

라이브러리 설치

파이썬 코드 작성

참고 자료