[python] Beautiful Soup로 웹 페이지의 모든 태그 속성값 변경하기

Beautiful Soup은 파이썬 패키지로, 웹 페이지를 파싱하고 데이터를 추출할 수 있는 강력한 도구입니다. 이번 예제에서는 Beautiful Soup을 사용하여 웹 페이지의 모든 태그의 속성값을 변경하는 방법을 알아보겠습니다.

필요한 패키지 설치하기

먼저 Beautiful Soup를 설치해야 합니다. 다음 명령어를 사용하여 설치할 수 있습니다.

pip install beautifulsoup4

예제 코드

이제 아래의 예제 코드를 통해 Beautiful Soup을 사용하여 웹 페이지의 모든 태그 속성값을 변경하는 방법을 살펴보겠습니다.

from bs4 import BeautifulSoup

# HTML 코드 예시
html_code = "<html><body><div class='container'><h1>Hello, World!</h1></div></body></html>"

# Beautiful Soup 객체 생성
soup = BeautifulSoup(html_code, 'html.parser')

# 모든 태그 가져오기
tags = soup.find_all()

# 속성값 변경하기
for tag in tags:
    tag['class'] = 'new-class'

# 변경된 HTML 코드 출력
print(soup.prettify())

위의 코드는 예시로 주어진 HTML 코드에서 모든 태그의 class 속성값을 new-class로 변경하고, 변경된 HTML 코드를 출력합니다.

실행 결과

위의 예제 코드를 실행하면 아래와 같은 결과를 얻을 수 있습니다.

<html>
 <body>
  <div class="new-class">
   <h1 class="new-class">
    Hello, World!
   </h1>
  </div>
 </body>
</html>

위 결과에서 볼 수 있듯이, 웹 페이지의 모든 태그의 class 속성값이 new-class로 변경되었습니다.

결론

Beautiful Soup을 사용하면 간편하게 웹 페이지를 파싱하고 데이터를 추출할 수 있습니다. 이번 예제에서는 Beautiful Soup을 사용하여 웹 페이지의 모든 태그의 속성값을 변경하는 방법을 알아보았습니다. 여러분들도 이를 응용하여 웹 스크래핑 등 다양한 프로젝트에서 활용해보시기 바랍니다.

참고 자료