[python] Beautiful Soup로 웹 페이지에서 마지막 태그 찾기

30 Nov 2023

python

Python에서 Beautiful Soup 패키지를 사용하면 웹 페이지에서 쉽게 원하는 데이터를 추출할 수 있습니다. 이번 포스트에서는 Beautiful Soup을 사용하여 웹 페이지에서 마지막 태그를 찾는 방법에 대해 알아보겠습니다.

먼저 Beautiful Soup을 설치해야 합니다. 다음 명령을 사용하여 설치할 수 있습니다.

pip install beautifulsoup4

설치가 완료되었다면, 웹 페이지의 HTML을 불러와 Beautiful Soup 객체를 생성합니다. 아래는 예시입니다.

from bs4 import BeautifulSoup
import requests

# 웹 페이지 URL
url = "http://example.com"

# 웹 페이지 요청
response = requests.get(url)

# HTML 파싱
soup = BeautifulSoup(response.text, 'html.parser')

Beautiful Soup 객체를 생성하였다면, find_all 메서드를 사용하여 원하는 태그를 모두 찾을 수 있습니다. 하지만 우리는 마지막 태그를 찾기 위해 find_all 메서드 대신 find 메서드를 사용할 것입니다. 아래는 예시입니다.

# 모든 <a> 태그를 찾음
links = soup.find_all('a')

# 마지막 <a> 태그를 찾음
last_link = soup.find('a', recursive=True)

# 결과 출력
print(last_link)

위의 코드에서 find 메서드에 recursive=True 옵션을 주었습니다. 이는 모든 하위 태그를 검색하도록 설정하는 옵션입니다.

이제 Beautiful Soup을 사용하여 웹 페이지에서 마지막 태그를 찾는 방법을 알게 되었습니다. 이를 응용하여 다양한 웹 스크래핑 작업을 수행할 수 있습니다.

참고 링크:

Beautiful Soup 공식 문서