[python] Beautiful Soup로 웹 페이지에서 특정 폼 요소 값 검증하기

30 Nov 2023

여러분은 웹 스크래핑을 위해 Beautiful Soup라는 파이썬 라이브러리를 사용하실 수 있을 것입니다. Beautiful Soup는 웹 페이지의 HTML을 파싱하고, 특정 요소를 추출하기 위해 사용됩니다.

이번 블로그 포스트에서는 Beautiful Soup를 사용하여 웹 페이지에서 특정 폼 요소의 값을 검증하는 방법에 대해 알아보겠습니다.

1. Beautiful Soup 설치하기

Beautiful Soup를 사용하기 위해서는 먼저 라이브러리를 설치해야 합니다. 다음 명령을 사용하여 Beautiful Soup를 설치할 수 있습니다.

pip install beautifulsoup4

Beautiful Soup를 사용하기 위해 먼저 웹 페이지의 HTML을 가져와야 합니다. requests 라이브러리를 사용하여 웹 페이지의 HTML을 가져올 수 있습니다.

import requests

url = "https://www.example.com"
response = requests.get(url)
html = response.text

위의 코드에서는 requests.get() 함수를 사용하여 주어진 URL의 웹 페이지를 요청하고, response.text로 서버로부터 받은 응답을 문자열 형태로 가져옵니다.

이제 Beautiful Soup를 사용하여 HTML을 파싱해보겠습니다. 다음 코드를 사용하여 생성한 html 변수의 값을 파싱할 수 있습니다.

from bs4 import BeautifulSoup

soup = BeautifulSoup(html, "html.parser")

위의 코드에서는 Beautiful Soup의 BeautifulSoup 클래스를 사용하여 html 변수의 값을 파싱한 후, soup 객체에 저장합니다.

이제 Beautiful Soup를 사용하여 원하는 폼 요소의 값을 찾을 수 있습니다. 예를 들어, 사용자의 이름을 입력하는 <input> 요소의 값을 찾는다고 가정해봅시다.

name_input = soup.find("input", {"name": "name"})
name_value = name_input["value"]

print("사용자 이름:", name_value)

위의 코드에서 soup.find() 함수를 사용하여 name 속성이 "name"인 <input> 요소를 찾은 후, name_value 변수에 해당 요소의 value 속성 값을 저장합니다.

마지막으로, 찾은 폼 요소의 값을 검증할 수 있습니다. 예를 들어, 사용자의 이름이 비어있는지 확인하는 코드를 작성해보겠습니다.

if name_value.strip() == "":
    print("이름이 비어있습니다.")
else:
    print("사용자 이름:", name_value)

위의 코드에서는 name_value.strip() 메서드를 사용하여 사용자의 이름 값에 대하여 앞뒤 공백을 제거한 후, 빈 문자열인지 확인합니다. 빈 문자열인 경우 “이름이 비어있습니다.”라는 메시지를 출력하고, 그렇지 않은 경우 사용자의 이름을 출력합니다.

이제 여러분은 Beautiful Soup를 사용하여 웹 페이지에서 특정 폼 요소의 값을 검증하는 방법을 알게 되었습니다. 이를 응용하여 웹 스크래핑을 더욱 효과적으로 수행할 수 있습니다.