[python] 파이썬 웹 클라이언트에서 웹 사이트의 뉴스 요약 서비스를 활용하는 방법은 무엇인가요?
웹 사이트의 뉴스를 요약하는데는 TextRank 알고리즘과 BeautifulSoup 라이브러리를 활용하여 웹 사이트의 컨텐츠를 가져온 뒤, 자연어 처리를 통해 핵심 문장을 추출하고 이를 요약하는 방법을 사용할 수 있습니다. 아래는 간단한 예제 코드입니다.
필요한 라이브러리
import requests
from bs4 import BeautifulSoup
from summa import summarizer
웹 사이트에서 뉴스 컨텐츠 가져오기
def get_news_content(url):
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.content, 'html.parser')
content = ' '.join([p.text for p in soup.find_all('p')])
return content
뉴스 요약
def summarize_news(content):
summary = summarizer.summarize(content)
return summary
이 예제 코드에서는 requests를 사용하여 웹 페이지의 HTML 내용을 요청하고, BeautifulSoup를 사용하여 필요한 컨텐츠를 가져옵니다. 그런 다음, Summa의 summarizer 모듈을 사용하여 컨텐츠를 요약합니다.
이 코드를 사용하여 파이썬 웹 클라이언트에서 웹 사이트의 뉴스 요약 서비스를 활용할 수 있습니다.