[python] Beautiful Soup로 웹 페이지의 모든 폼 데이터 삭제하기

웹 스크래핑을 할 때 종종 Beautiful Soup 라이브러리를 사용합니다. 이 라이브러리는 HTML과 XML 문서를 파싱하고 조작하는 데 유용합니다. 웹 페이지에 있는 폼 데이터를 삭제하는 방법을 알아보겠습니다.

1. 라이브러리 설치

먼저, Beautiful Soup를 설치해야 합니다. 아래의 명령어로 설치할 수 있습니다.

pip install beautifulsoup4

2. 필요한 패키지 가져오기

from bs4 import BeautifulSoup
import requests

3. 웹 페이지 데이터 가져오기

url = "http://example.com"
response = requests.get(url)
data = response.text

4. Beautiful Soup로 폼 데이터 삭제하기

soup = BeautifulSoup(data, "html.parser")
forms = soup.find_all("form")

for form in forms:
    form.decompose()

new_data = str(soup)

위의 코드에서는 웹 페이지에 있는 모든 form 요소를 찾고, decompose() 함수를 사용하여 폼 데이터를 삭제합니다. 그리고 수정된 HTML 코드를 new_data 변수에 저장합니다.

5. 수정된 데이터로 웹 페이지 업데이트하기

with open("updated_page.html", "w") as file:
    file.write(new_data)

위의 코드는 수정된 HTML 코드를 파일로 저장하는 예시입니다. 필요에 따라서 데이터를 원래 웹 페이지에 업데이트할 수도 있습니다.

참고 자료