[python] 웹 페이지에서 링크 클릭하기
웹 스크래핑 작업을 할 때, 웹 페이지에서 특정 링크를 클릭해야 하는 경우가 종종 있습니다. 이번 블로그 포스트에서는 Python을 사용하여 웹 페이지에서 링크를 클릭하는 방법을 알아보겠습니다.
라이브러리 설치
먼저, 라이브러리를 설치해야 합니다. Python의 requests
와 beautifulsoup4
라이브러리를 사용하여 웹 페이지에 접속하고 HTML을 파싱할 수 있습니다. 아래 명령을 사용하여 두 라이브러리를 설치합니다.
pip install requests beautifulsoup4
링크 클릭하기
다음은 Python으로 웹 페이지에서 링크를 클릭하는 예제 코드입니다.
import requests
from bs4 import BeautifulSoup
# 웹 페이지에 접속
response = requests.get("https://example.com")
# HTML 파싱
soup = BeautifulSoup(response.content, "html.parser")
# 원하는 링크를 찾기 위해 CSS 선택자를 사용
link = soup.select_one("a.link-class")
# 링크 주소 가져오기
link_url = link["href"]
# 링크 클릭
response = requests.get(link_url)
# 클릭한 링크 페이지의 HTML 파싱
clicked_page = BeautifulSoup(response.content, "html.parser")
# 클릭한 링크 페이지에서 원하는 정보 추출
# ...
# 결과 출력
print(clicked_page)
위 코드에서는 requests.get()
을 사용하여 웹 페이지에 접속하고, BeautifulSoup
을 사용하여 HTML을 파싱합니다. soup.select_one()
함수를 사용하여 원하는 링크를 찾습니다. 그 후, 클릭한 링크의 주소를 가져와 requests.get()
을 다시 사용하여 링크를 클릭합니다. 마지막으로 클릭한 링크 페이지에서 원하는 정보를 추출합니다.