[python] 응답 본문에서 데이터 추출하기

웹 페이지나 API와의 통신을 통해 받은 응답 본문에서 데이터를 추출하는 것은 데이터 분석 또는 웹 스크래핑 등 다양한 작업에서 자주 사용되는 일입니다. 이번 포스트에서는 Python에서 응답 본문에서 데이터를 추출하는 방법을 알아보겠습니다.

requests 라이브러리를 이용한 응답 받기

Python에서 외부 서버와의 통신을 위해 requests 라이브러리를 사용하는 것이 편리합니다. 다음은 requests 라이브러리를 사용하여 GET 요청을 보내고 응답을 받는 예시입니다.

import requests

response = requests.get('https://api.example.com/data')

위 코드에서 response 변수에는 외부 서버로부터 받은 응답이 담겨있습니다.

응답 본문에서 데이터 추출하기

응답 본문에서 데이터를 추출하기 위해서는 일반적으로 텍스트 처리 기술을 사용합니다. 예를 들어, JSON 형태의 데이터를 추출할 경우 json 모듈을 사용하면 편리합니다. 다음은 requests 라이브러리에서 받은 응답 본문에서 JSON 데이터를 추출하는 예시입니다.

import requests
import json

response = requests.get('https://api.example.com/data')
data = json.loads(response.text)

위 코드에서 response.text를 통해 응답 본문을 문자열로 가져온 후, json.loads() 함수를 사용하여 문자열을 파이썬 객체로 변환합니다. 이렇게 추출한 데이터는 변수 data에 저장됩니다.

만약 HTML 형식의 응답 본문에서 데이터를 추출하고 싶다면 beautifulsoup4 라이브러리 등을 사용하여 원하는 요소를 파싱할 수 있습니다. 자세한 내용은 해당 라이브러리의 공식 문서를 참고하시기 바랍니다.

정리

Python에서 응답 본문에서 데이터를 추출하는 방법을 알아보았습니다. requests 라이브러리를 사용하여 응답을 받은 후, 적절한 텍스트 처리 기술을 적용하여 원하는 데이터를 추출할 수 있습니다.

이를 통해 데이터 분석, 웹 스크래핑 등 다양한 작업에서 응답 본문을 활용하여 필요한 정보를 추출할 수 있습니다.