[python] PySimpleGUI에서 웹 크롤링 기능 사용하기

PySimpleGUI는 파이썬에서 GUI 애플리케이션을 쉽게 개발할 수 있도록 도와주는 라이브러리입니다. 이 라이브러리를 사용하면 간단한 GUI를 만들고 웹 크롤링과 같은 기능을 추가할 수 있습니다. 이번 포스트에서는 PySimpleGUI를 사용하여 웹 크롤링을 수행하는 방법을 알아보겠습니다.

라이브러리 설치하기

먼저, PySimpleGUI를 설치해야 합니다. 아래의 명령어를 사용하여 PySimpleGUI를 설치할 수 있습니다.

pip install PySimpleGUI

이제 필요한 라이브러리가 설치되었으니, 웹 크롤링 기능을 추가할 준비가 되었습니다.

웹 크롤링 기능 추가하기

PySimpleGUI에서 웹 크롤링을 수행하기 위해서는 웹 사이트의 HTML 코드를 가져오는 기능이 필요합니다. 이를 위해 requests 라이브러리를 사용할 수 있습니다. 아래의 명령어를 사용하여 requests 라이브러리를 설치합니다.

pip install requests

이제 웹 사이트의 HTML 코드를 가져오는 함수를 작성해보겠습니다. 예를 들어, https://example.com 이라는 웹 사이트의 HTML 코드를 가져오는 함수는 다음과 같습니다.

import requests

def get_html(url):
    response = requests.get(url)
    return response.text

이제 PySimpleGUI를 사용하여 GUI를 만들고, 사용자가 입력한 URL에 대한 웹 사이트의 HTML 코드를 가져오는 기능을 추가해보겠습니다.

import PySimpleGUI as sg
import requests

def get_html(url):
    response = requests.get(url)
    return response.text

layout = [
    [sg.Text("URL: "), sg.Input(size=(50, 1), key="-URL-")],
    [sg.Button("크롤링 실행", key="-CRAWL-")],
    [sg.Output(size=(80, 20))],
]

window = sg.Window(title="웹 크롤링", layout=layout)

while True:
    event, values = window.read()
    
    if event == sg.WINDOW_CLOSED:
        break
    
    if event == "-CRAWL-":
        url = values["-URL-"]
        html = get_html(url)
        print(html)

window.close()

위의 코드를 실행하면 PySimpleGUI를 사용하여 URL을 입력하고 크롤링을 실행할 수 있는 GUI 창이 나타납니다. 사용자가 URL을 입력하고 “크롤링 실행” 버튼을 클릭하면 해당 URL의 웹 사이트 HTML 코드가 출력됩니다.

이렇게 PySimpleGUI를 사용하여 웹 크롤링 기능을 간단히 추가할 수 있습니다. 웹 크롤링을 더 복잡한 기능으로 확장하고 싶다면 BeautifulSoup 등 다른 라이브러리를 사용할 수도 있습니다.

결론

이번 포스트에서는 PySimpleGUI를 사용하여 웹 크롤링 기능을 추가하는 방법을 알아보았습니다. PySimpleGUI를 사용하면 파이썬 GUI 애플리케이션을 쉽게 개발할 수 있으며, 다양한 기능을 추가할 수 있습니다. 웹 크롤링을 통해 웹 사이트의 데이터를 수집하고 분석할 수 있는 강력한 도구를 만들 수 있습니다.