[python] Beautiful Soup로 웹 페이지에서 특정 폼 데이터 수정하기
웹 스크래핑을 할 때 종종 웹 페이지의 특정 폼 데이터를 수정해야 할 때가 있습니다. 이때 Beautiful Soup 라이브러리를 사용하면 간단하게 폼 데이터를 수정할 수 있습니다. 이번 포스트에서는 Beautiful Soup을 사용하여 웹 페이지에서 특정 폼 데이터를 수정하는 방법에 대해 알아보겠습니다.
필요한 라이브러리 설치하기
먼저 Beautiful Soup을 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.
pip install beautifulsoup4
또한, 웹 페이지를 다운로드하고 파싱하는데 사용할 requests
라이브러리도 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.
pip install requests
웹 페이지 다운로드 및 파싱하기
다음으로, 웹 페이지를 다운로드하고 Beautiful Soup을 사용하여 파싱해야 합니다. 아래의 코드 예제를 참고하세요.
import requests
from bs4 import BeautifulSoup
# 웹 페이지 다운로드
url = 'http://example.com'
response = requests.get(url)
# Beautiful Soup으로 HTML 파싱
soup = BeautifulSoup(response.text, 'html.parser')
# 수정할 폼 데이터 선택
form = soup.find('form')
input_field = form.find('input', {'name': 'input_field'})
# 폼 데이터 수정
input_field['value'] = '새로운 값'
수정된 데이터 확인하기
수정한 폼 데이터가 제대로 반영되었는지 확인하기 위해 웹 페이지를 출력해보세요.
# 수정된 데이터 확인
print(soup.prettify())
수정 내용 저장하기
마지막으로, 수정한 내용을 파일로 저장하거나 다른 곳에 활용할 수 있습니다. 아래의 코드 예제를 참고하세요.
# 수정된 내용을 파일로 저장
with open('modified_page.html', 'w') as file:
file.write(str(soup))
수정된 웹 페이지는 modified_page.html
파일에 저장됩니다.
마무리
Beautiful Soup을 사용하여 웹 페이지의 특정 폼 데이터를 수정하는 방법에 대해 알아보았습니다. 이를 활용하면 웹 스크래핑 작업에서 필요한 데이터를 손쉽게 수정할 수 있습니다. Beautiful Soup의 다양한 기능과 사용법을 익히면 웹 스크래핑 작업을 보다 효율적으로 수행할 수 있을 것입니다.