[python] 웹 페이지 상태 코드 확인하기

웹 스크래핑 작업을 수행하거나 웹 페이지의 상태를 확인해야 할 때, 파이썬에서 웹 페이지의 상태 코드를 확인하는 방법을 알아보겠습니다.

Requests 라이브러리 설치하기

먼저, Requests 라이브러리를 사용하여 웹 페이지에 요청을 보내고 상태 코드를 확인할 것입니다.

pip install requests

웹 페이지의 상태 코드 확인하기

다음은 파이썬 코드를 사용하여 웹 페이지의 상태 코드를 확인하는 예제입니다.

import requests

url = 'http://www.example.com'  # 상태 코드를 확인할 웹 페이지의 URL

response = requests.get(url)
status_code = response.status_code

print(f"URL: {url}")
print(f"Status Code: {status_code}")

위의 예제에서는 ‘http://www.example.com’ 이라는 URL로 요청을 보내고, 반환된 response 객체에서 status_code 속성을 확인하여 상태 코드를 출력합니다.

웹 페이지의 상태 코드는 다양한 값을 가질 수 있으며, 일반적인 상태 코드는 다음과 같습니다.

예외 처리하기

웹 페이지의 상태 코드를 확인할 때, 예외 상황을 고려해야 합니다. 만약 서버에 연결할 수 없거나 요청이 실패하는 등의 상황이 발생하면 예외가 발생할 수 있습니다. 따라서 예외 처리를 통해 이러한 상황을 처리하는 것이 좋습니다.

import requests

url = 'http://www.example.com'  # 상태 코드를 확인할 웹 페이지의 URL

try:
    response = requests.get(url)
    response.raise_for_status()  # 상태 코드가 200 이외의 값이라면 예외 발생
except requests.exceptions.HTTPError as errh:
    print("HTTP Error:", errh)
except requests.exceptions.ConnectionError as errc:
    print("Error Connecting:", errc)
except requests.exceptions.Timeout as errt:
    print("Timeout Error:", errt)
except requests.exceptions.RequestException as err:
    print("Oops! Something went wrong:", err)

status_code = response.status_code
print(f"URL: {url}")
print(f"Status Code: {status_code}")

위의 예제에서는 예외 처리를 위해 try-except 구문을 사용하였습니다. 요청이 실패한 경우에는 requests.exceptions 모듈의 예외 클래스를 통해 예외를 처리하고, 예외 메시지를 출력합니다.

참고 자료