[python] Beautiful Soup로 웹 페이지에서 태그 복제하기

30 Nov 2023

python

웹 스크래핑을 위해 Beautiful Soup 라이브러리는 매우 유용한 도구입니다. 이 라이브러리를 사용하면 웹 페이지의 HTML 코드를 구문 분석하고 태그를 조작할 수 있습니다. 이번에는 Beautiful Soup를 사용하여 웹 페이지에서 태그를 복제하는 방법을 알아보겠습니다.

Beautiful Soup 설치

Beautiful Soup는 pip를 사용하여 설치할 수 있습니다. 다음 명령어를 사용하여 Beautiful Soup를 설치합니다.

pip install beautifulsoup4

웹 페이지에서 태그 복제하기

다음은 Beautiful Soup를 사용하여 웹 페이지에서 태그를 복제하는 예제 코드입니다.

from bs4 import BeautifulSoup
import requests

# 웹 페이지 가져오기
url = "https://www.example.com"
response = requests.get(url)
html = response.content

# Beautiful Soup로 HTML 구문 분석
soup = BeautifulSoup(html, 'html.parser')

# 복제할 태그 선택
tag_to_clone = soup.find('div', {'class': 'my-class'})

# 복제된 태그 생성
cloned_tag = tag_to_clone.clone()

# 복제된 태그 다시 삽입
tag_to_clone.insert_after(cloned_tag)

위의 코드에서는 requests 모듈을 사용하여 웹 페이지의 HTML 코드를 가져오고, BeautifulSoup 객체를 생성하여 HTML 코드를 구문 분석합니다. 웹 페이지에서 복제할 태그를 선택한 후, clone() 메서드를 사용하여 해당 태그를 복제합니다. 마지막으로, insert_after() 메서드를 사용하여 복제된 태그를 원본 태그 뒤에 삽입합니다.

이제 웹 페이지에서 태그를 복제하는 방법을 알았습니다. Beautiful Soup의 다양한 기능을 활용하여 웹 스크래핑 작업을 수행할 수 있습니다. 자세한 내용은 Beautiful Soup 공식 문서를 참조하시기 바랍니다.