Seaborn을 활용한 공기 오염 데이터 시각화하기
소개
- Seaborn은 파이썬의 시각화 라이브러리 중 하나로, Matplotlib보다 간편하고 세련된 그래프를 그릴 수 있는 도구입니다.
- 이번 포스트에서는 Seaborn을 사용하여 공기 오염 데이터를 시각화하는 방법을 알아보겠습니다.
데이터 로드
- 먼저, 공기 오염 데이터셋을 로드해야합니다. 이 예제에서는 “air_pollution.csv” 파일을 사용하겠습니다.
import pandas as pd
data = pd.read_csv("air_pollution.csv")
데이터 탐색 및 전처리
- 데이터를 로드한 후, 이를 살펴보고 필요한 전처리를 수행해야합니다.
- 예를 들어, 날짜와 시간이 포함된 “datetime” 열을 datetime 형식으로 변환할 수 있습니다.
data["datetime"] = pd.to_datetime(data["datetime"])
그래프 그리기
- 이제 Seaborn을 사용하여 데이터를 시각화할 수 있습니다.
- 가장 간단한 예로, 날짜별 미세먼지 농도를 선 그래프로 그려보겠습니다.
import seaborn as sns
import matplotlib.pyplot as plt
sns.lineplot(x="datetime", y="pm2.5", data=data)
plt.title("PM 2.5 levels by date")
plt.xlabel("Date")
plt.ylabel("PM 2.5 concentration")
plt.show()
추가적인 시각화
- Seaborn은 여러 가지 그래프 유형을 지원하므로, 다양한 시각화를 실험해볼 수 있습니다.
- 예를 들어, 요일별 미세먼지 농도를 바이올린 그래프로 그려보겠습니다.
sns.violinplot(x="weekday", y="pm2.5", data=data)
plt.title("PM 2.5 levels by weekday")
plt.xlabel("Weekday")
plt.ylabel("PM 2.5 concentration")
plt.show()
결론
- Seaborn은 공기 오염 데이터를 시각화하기 위한 강력한 도구입니다.
- 다양한 그래프 유형을 사용하여 데이터를 탐색하고 패턴을 발견할 수 있습니다.
- 이를 통해 환경 상태를 쉽게 이해할 수 있으며, 문제를 해결할 수 있는 통찰력을 얻을 수 있습니다.
참고 자료
#데이터시각화 #Seaborn