[python] Beautiful Soup로 웹 페이지에서 태그 복제하기
웹 스크래핑을 위해 Beautiful Soup 라이브러리는 매우 유용한 도구입니다. 이 라이브러리를 사용하면 웹 페이지의 HTML 코드를 구문 분석하고 태그를 조작할 수 있습니다. 이번에는 Beautiful Soup를 사용하여 웹 페이지에서 태그를 복제하는 방법을 알아보겠습니다.
Beautiful Soup 설치
Beautiful Soup는 pip를 사용하여 설치할 수 있습니다. 다음 명령어를 사용하여 Beautiful Soup를 설치합니다.
pip install beautifulsoup4
웹 페이지에서 태그 복제하기
다음은 Beautiful Soup를 사용하여 웹 페이지에서 태그를 복제하는 예제 코드입니다.
from bs4 import BeautifulSoup
import requests
# 웹 페이지 가져오기
url = "https://www.example.com"
response = requests.get(url)
html = response.content
# Beautiful Soup로 HTML 구문 분석
soup = BeautifulSoup(html, 'html.parser')
# 복제할 태그 선택
tag_to_clone = soup.find('div', {'class': 'my-class'})
# 복제된 태그 생성
cloned_tag = tag_to_clone.clone()
# 복제된 태그 다시 삽입
tag_to_clone.insert_after(cloned_tag)
위의 코드에서는 requests
모듈을 사용하여 웹 페이지의 HTML 코드를 가져오고, BeautifulSoup
객체를 생성하여 HTML 코드를 구문 분석합니다. 웹 페이지에서 복제할 태그를 선택한 후, clone()
메서드를 사용하여 해당 태그를 복제합니다. 마지막으로, insert_after()
메서드를 사용하여 복제된 태그를 원본 태그 뒤에 삽입합니다.
이제 웹 페이지에서 태그를 복제하는 방법을 알았습니다. Beautiful Soup의 다양한 기능을 활용하여 웹 스크래핑 작업을 수행할 수 있습니다. 자세한 내용은 Beautiful Soup 공식 문서를 참조하시기 바랍니다.