[python] 웹 스크래핑을 활용한 외국어 문장 자동 번역
반갑습니다! 이번에는 Python을 사용해서 웹 스크래핑으로 외국어 문장을 가져오고, 자동으로 번역하는 방법에 대해 알아보겠습니다. 이 프로젝트는 BeautifulSoup와 Google Translate API를 사용하여 외국어 문장을 가져오고 번역하는 방법을 실습하게 됩니다.
목차
BeautifulSoup을 이용한 웹 스크래핑
먼저, Python 라이브러리인 BeautifulSoup을 사용하여 웹 페이지에서 외국어 문장을 가져오겠습니다. 이 라이브러리를 사용하면 HTML 및 XML 파일에서 데이터를 추출할 수 있습니다. 웹 페이지에서 특정 요소(예: <p>
태그)를 식별하고 해당 내용을 추출하여 외국어 문장을 가져올 수 있습니다.
from bs4 import BeautifulSoup
import requests
url = '웹 페이지 URL'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
foreign_sentence = soup.find('태그명', class_='클래스명').text
Google Translate API를 이용한 문장 번역
다음으로, Google Translate API를 사용하여 가져온 외국어 문장을 자동으로 번역할 것입니다. 이 API를 사용하면 프로그래밍 방식으로 텍스트를 다른 언어로 번역할 수 있습니다.
from googletrans import Translator
translator = Translator()
translated_sentence = translator.translate(foreign_sentence, dest='ko').text
print(translated_sentence)
코드 예시
위의 방법을 결합하여 외국어 문장을 웹 스크래핑하고 자동으로 번역하는 예시 코드입니다.
from bs4 import BeautifulSoup
import requests
from googletrans import Translator
url = '웹 페이지 URL'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
foreign_sentence = soup.find('태그명', class_='클래스명').text
translator = Translator()
translated_sentence = translator.translate(foreign_sentence, dest='ko').text
print("번역된 문장:", translated_sentence)
참고 자료
- BeautifulSoup 공식 문서: https://www.crummy.com/software/BeautifulSoup/bs4/doc/
- Google Translate API 공식 문서: https://cloud.google.com/translate
이번 포스트에서는 Python의 BeautifulSoup과 Google Translate API를 활용하여 외국어 문장을 자동으로 번역하는 방법에 대해 알아보았습니다. 웹 스크래핑과 API를 사용하여 다양한 언어로 된 콘텐츠를 쉽게 이해할 수 있게 되었습니다.