[python] Beautiful Soup로 웹 페이지에서 특정 폼 요소 값 검색하기

이번에는 Python의 Beautiful Soup 라이브러리를 사용하여 웹 페이지에서 특정 폼 요소의 값을 검색하는 방법에 대해 알아보겠습니다.

1. Beautiful Soup 설치

Beautiful Soup를 사용하기 위해서는 먼저 패키지를 설치해야 합니다. 아래의 명령어를 사용하여 Beautiful Soup를 설치할 수 있습니다.

pip install beautifulsoup4

2. 웹 페이지 읽어오기

Beautiful Soup를 사용하여 웹 페이지의 HTML 코드를 가져오기 위해서는 requests 모듈을 사용합니다. 아래의 코드를 참고하여 웹 페이지의 HTML 코드를 가져옵니다.

import requests

url = "https://example.com"
response = requests.get(url)
html_code = response.text

3. HTML 파싱하기

Beautiful Soup를 사용하여 HTML 코드를 파싱하고 원하는 요소를 선택합니다. 웹 폼의 값을 가져오기 위해서는 폼 요소의 name 속성이 필요하므로 해당 속성을 사용하여 원하는 폼 요소를 선택합니다.

from bs4 import BeautifulSoup

soup = BeautifulSoup(html_code, "html.parser")
form_element = soup.find("input", {"name": "username"})

if form_element:
    form_value = form_element["value"]
    print("폼 요소의 값:", form_value)
else:
    print("폼 요소를 찾을 수 없습니다.")

위의 코드에서 input 요소 중에서 name 속성이 "username"인 요소를 찾고 해당 요소의 value 속성 값을 가져옵니다.

결과 확인하기

위의 코드를 실행하면 웹 페이지에서 지정된 폼 요소의 값을 출력합니다. 폼 요소를 찾을 수 없는 경우 “폼 요소를 찾을 수 없습니다.”라는 메시지가 출력됩니다.

이제 웹 페이지에서 특정 폼 요소의 값을 검색하는 과정을 알아봤습니다. Beautiful Soup를 사용하면 HTML 코드를 쉽게 파싱하여 원하는 요소를 선택할 수 있습니다. 이를 통해 웹 스크래핑이나 데이터 수집 작업 등 다양한 웹 프로젝트에 활용할 수 있습니다.

참고 자료