[python] 파이썬 BeautifulSoup으로 특정 요소 내용 가져오기

04 Dec 2023

python

먼저, BeautifulSoup을 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.

pip install beautifulsoup4

다음은 특정 요소의 내용을 가져오는 예제 코드입니다.

from bs4 import BeautifulSoup
import requests

# 웹 페이지에서 HTML 코드 가져오기
url = "https://www.example.com"
response = requests.get(url)
html_content = response.text

# BeautifulSoup으로 HTML 파싱하기
soup = BeautifulSoup(html_content, 'html.parser')

# 특정 요소 가져오기
element = soup.select_one('.classname')  # 클래스 이름으로 요소 선택
# element = soup.select_one('#idname')  # 아이디 이름으로 요소 선택
# element = soup.select_one('tagname')  # 태그 이름으로 요소 선택

# 요소의 내용 출력
print(element.text)

위의 코드에서는 requests 모듈을 사용하여 웹 페이지의 HTML 코드를 가져옵니다. 이후 BeautifulSoup 모듈을 사용하여 HTML 코드를 파싱한 뒤, select_one 메서드를 사용하여 원하는 요소를 선택합니다. 선택된 요소의 내용은 text 속성을 통해 가져올 수 있습니다.

위의 코드는 클래스 이름으로 요소를 선택하는 예제입니다. 필요에 따라 아이디 이름이나 태그 이름으로 요소를 선택하여 내용을 가져올 수도 있습니다.

이제 BeautifulSoup을 사용하여 특정 요소의 내용을 가져오는 방법을 알게되었습니다. 이를 응용하여 웹 스크래핑 작업을 진행할 수 있습니다.

참고 문서:

BeautifulSoup 공식 문서: https://www.crummy.com/software/BeautifulSoup/bs4/doc/