[python] Beautiful Soup로 웹 페이지의 모든 테이블 데이터 수정하기

Beautiful Soup은 파이썬의 라이브러리로, 웹 스크레이핑과 HTML/XML 데이터 파싱에 사용됩니다. 이번 글에서는 Beautiful Soup을 사용하여 웹 페이지의 모든 테이블 데이터를 수정하는 방법을 알아보겠습니다.

Beautiful Soup 설치하기

먼저 Beautiful Soup을 설치해야 합니다. 아래의 명령을 사용하여 Beautiful Soup을 설치할 수 있습니다.

pip install beautifulsoup4

웹 페이지에서 테이블 데이터 가져오기

Beautiful Soup을 사용하여 웹 페이지에서 테이블 데이터를 가져오려면, 먼저 웹 페이지의 HTML을 가져와야 합니다. 예를 들어, 다음과 같이 requests 라이브러리를 사용하여 웹 페이지의 HTML을 가져올 수 있습니다.

import requests

URL = "https://example.com"
response = requests.get(URL)
html = response.text

테이블 데이터 수정하기

이제 Beautiful Soup을 사용하여 HTML에서 테이블 데이터를 추출하고, 수정할 수 있습니다. 아래의 예제 코드를 참고하세요.

from bs4 import BeautifulSoup

# HTML 파싱하기
soup = BeautifulSoup(html, "html.parser")

# 모든 테이블 태그 선택하기
tables = soup.find_all("table")

# 테이블 데이터 수정하기
for table in tables:
    for row in table.find_all("tr"):
        for cell in row.find_all("td"):
            # 테이블 데이터 수정 코드 작성
            cell.string = "수정된 데이터"

# 수정된 HTML 출력하기
print(soup.prettify())

위의 코드에서는 find_all 메서드를 사용하여 모든 테이블 태그를 선택하고, find_all 메서드를 중첩하여 각 테이블의 행과 셀을 선택합니다. 그리고 cell.string을 사용하여 테이블 데이터를 수정합니다.

결론

Beautiful Soup을 사용하면 웹 페이지의 테이블 데이터를 쉽게 가져와 수정할 수 있습니다. HTML 파싱과 데이터 추출, 수정 과정을 숙지하고 활용하면 다양한 웹 스크레이핑 작업에서 유용하게 사용할 수 있습니다. Beautiful Soup에 대해 더 자세한 내용은 공식 문서를 참고하세요.