[python] Beautiful Soup로 웹 페이지에서 특정 폼 액션 추출하기
Beautiful Soup은 파이썬에서 웹 스크래핑을 간편하게 할 수 있는 라이브러리입니다. 이번에는 Beautiful Soup을 사용하여 웹 페이지에서 특정 폼 액션을 추출하는 방법을 알아보겠습니다.
1. 라이브러리 설치하기
Beautiful Soup을 사용하기 위해서는 먼저 라이브러리를 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.
pip install beautifulsoup4
2. HTML 파싱하기
Beautiful Soup을 사용하여 HTML을 파싱해야 합니다. 먼저 웹 페이지의 HTML을 가져와서 BeautifulSoup
객체로 변환합니다.
from bs4 import BeautifulSoup
import requests
url = "http://example.com" # 웹 페이지 URL 설정
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
3. 폼 액션 추출하기
Beautiful Soup에서는 HTML의 구조를 이용하여 원하는 요소를 추출할 수 있습니다. 폼 액션을 추출하기 위해 find
메서드를 사용합니다.
form = soup.find('form') # 폼 요소 추출
action = form.get('action') # 폼 액션 추출
이제 action
변수에는 처음 폼 요소에서 추출한 액션 값이 저장됩니다.
4. 결과 확인하기
추출한 폼 액션 값을 출력하여 확인해봅시다.
print(action)
위의 코드를 실행하면 웹 페이지에서 추출한 폼 액션 값을 확인할 수 있습니다.
마무리
이제 Beautiful Soup을 사용하여 웹 페이지에서 특정 폼 액션을 추출하는 방법을 알게 되었습니다. Beautiful Soup을 활용하면 웹 스크래핑 작업을 편리하게 수행할 수 있습니다. 더 많은 기능과 사용법은 Beautiful Soup 문서를 참고하시기 바랍니다.