[python] Beautiful Soup로 웹 페이지의 모든 폼 데이터 삭제하기
웹 스크래핑을 할 때 종종 Beautiful Soup 라이브러리를 사용합니다. 이 라이브러리는 HTML과 XML 문서를 파싱하고 조작하는 데 유용합니다. 웹 페이지에 있는 폼 데이터를 삭제하는 방법을 알아보겠습니다.
1. 라이브러리 설치
먼저, Beautiful Soup를 설치해야 합니다. 아래의 명령어로 설치할 수 있습니다.
pip install beautifulsoup4
2. 필요한 패키지 가져오기
from bs4 import BeautifulSoup
import requests
3. 웹 페이지 데이터 가져오기
url = "http://example.com"
response = requests.get(url)
data = response.text
4. Beautiful Soup로 폼 데이터 삭제하기
soup = BeautifulSoup(data, "html.parser")
forms = soup.find_all("form")
for form in forms:
form.decompose()
new_data = str(soup)
위의 코드에서는 웹 페이지에 있는 모든 form
요소를 찾고, decompose()
함수를 사용하여 폼 데이터를 삭제합니다. 그리고 수정된 HTML 코드를 new_data
변수에 저장합니다.
5. 수정된 데이터로 웹 페이지 업데이트하기
with open("updated_page.html", "w") as file:
file.write(new_data)
위의 코드는 수정된 HTML 코드를 파일로 저장하는 예시입니다. 필요에 따라서 데이터를 원래 웹 페이지에 업데이트할 수도 있습니다.