[python] 웹 페이지 상태 코드 확인하기
웹 스크래핑 작업을 수행하거나 웹 페이지의 상태를 확인해야 할 때, 파이썬에서 웹 페이지의 상태 코드를 확인하는 방법을 알아보겠습니다.
Requests 라이브러리 설치하기
먼저, Requests 라이브러리를 사용하여 웹 페이지에 요청을 보내고 상태 코드를 확인할 것입니다.
pip install requests
웹 페이지의 상태 코드 확인하기
다음은 파이썬 코드를 사용하여 웹 페이지의 상태 코드를 확인하는 예제입니다.
import requests
url = 'http://www.example.com' # 상태 코드를 확인할 웹 페이지의 URL
response = requests.get(url)
status_code = response.status_code
print(f"URL: {url}")
print(f"Status Code: {status_code}")
위의 예제에서는 ‘http://www.example.com’ 이라는 URL로 요청을 보내고, 반환된 response 객체에서 status_code
속성을 확인하여 상태 코드를 출력합니다.
웹 페이지의 상태 코드는 다양한 값을 가질 수 있으며, 일반적인 상태 코드는 다음과 같습니다.
- 200: 성공적으로 요청을 처리함
- 404: 요청한 페이지를 찾을 수 없음
- 500: 서버 내부 오류 발생
예외 처리하기
웹 페이지의 상태 코드를 확인할 때, 예외 상황을 고려해야 합니다. 만약 서버에 연결할 수 없거나 요청이 실패하는 등의 상황이 발생하면 예외가 발생할 수 있습니다. 따라서 예외 처리를 통해 이러한 상황을 처리하는 것이 좋습니다.
import requests
url = 'http://www.example.com' # 상태 코드를 확인할 웹 페이지의 URL
try:
response = requests.get(url)
response.raise_for_status() # 상태 코드가 200 이외의 값이라면 예외 발생
except requests.exceptions.HTTPError as errh:
print("HTTP Error:", errh)
except requests.exceptions.ConnectionError as errc:
print("Error Connecting:", errc)
except requests.exceptions.Timeout as errt:
print("Timeout Error:", errt)
except requests.exceptions.RequestException as err:
print("Oops! Something went wrong:", err)
status_code = response.status_code
print(f"URL: {url}")
print(f"Status Code: {status_code}")
위의 예제에서는 예외 처리를 위해 try-except
구문을 사용하였습니다. 요청이 실패한 경우에는 requests.exceptions
모듈의 예외 클래스를 통해 예외를 처리하고, 예외 메시지를 출력합니다.