[python] Beautiful Soup로 웹 페이지의 모든 테이블 데이터 수정하기
Beautiful Soup은 파이썬의 라이브러리로, 웹 스크레이핑과 HTML/XML 데이터 파싱에 사용됩니다. 이번 글에서는 Beautiful Soup을 사용하여 웹 페이지의 모든 테이블 데이터를 수정하는 방법을 알아보겠습니다.
Beautiful Soup 설치하기
먼저 Beautiful Soup을 설치해야 합니다. 아래의 명령을 사용하여 Beautiful Soup을 설치할 수 있습니다.
pip install beautifulsoup4
웹 페이지에서 테이블 데이터 가져오기
Beautiful Soup을 사용하여 웹 페이지에서 테이블 데이터를 가져오려면, 먼저 웹 페이지의 HTML을 가져와야 합니다. 예를 들어, 다음과 같이 requests 라이브러리를 사용하여 웹 페이지의 HTML을 가져올 수 있습니다.
import requests
URL = "https://example.com"
response = requests.get(URL)
html = response.text
테이블 데이터 수정하기
이제 Beautiful Soup을 사용하여 HTML에서 테이블 데이터를 추출하고, 수정할 수 있습니다. 아래의 예제 코드를 참고하세요.
from bs4 import BeautifulSoup
# HTML 파싱하기
soup = BeautifulSoup(html, "html.parser")
# 모든 테이블 태그 선택하기
tables = soup.find_all("table")
# 테이블 데이터 수정하기
for table in tables:
for row in table.find_all("tr"):
for cell in row.find_all("td"):
# 테이블 데이터 수정 코드 작성
cell.string = "수정된 데이터"
# 수정된 HTML 출력하기
print(soup.prettify())
위의 코드에서는 find_all
메서드를 사용하여 모든 테이블 태그를 선택하고, find_all
메서드를 중첩하여 각 테이블의 행과 셀을 선택합니다. 그리고 cell.string
을 사용하여 테이블 데이터를 수정합니다.
결론
Beautiful Soup을 사용하면 웹 페이지의 테이블 데이터를 쉽게 가져와 수정할 수 있습니다. HTML 파싱과 데이터 추출, 수정 과정을 숙지하고 활용하면 다양한 웹 스크레이핑 작업에서 유용하게 사용할 수 있습니다. Beautiful Soup에 대해 더 자세한 내용은 공식 문서를 참고하세요.