Seaborn을 사용하여 자동차 성능 데이터 시각화하기

Seaborn은 Python의 데이터 시각화 라이브러리로, Matplotlib의 기능을 보완하고 편리한 인터페이스를 제공합니다. 이번 예제에서는 Seaborn을 사용하여 자동차 성능 데이터를 시각화하는 방법을 알아보겠습니다.

데이터셋 준비

먼저, 자동차 성능 데이터셋을 준비해야 합니다. 예제 코드에서는 seaborn 라이브러리에 내장된 “mpg”라는 데이터셋을 사용하겠습니다. 이 데이터셋은 자동차의 연비, 마력, 실린더 수, 배기량 등의 정보를 담고 있습니다.

import seaborn as sns

# 데이터셋 로드
mpg_dataset = sns.load_dataset("mpg")

# 데이터셋 확인
print(mpg_dataset.head())

Scatter Plot 그리기

Scatter plot은 두 개의 변수 간의 관계를 시각화하는데 유용한 그래프입니다. 예제 코드에서는 배기량과 연비의 관계를 Scatter plot으로 그려보겠습니다.

import matplotlib.pyplot as plt

# Scatter plot 그리기
sns.scatterplot(x="displacement", y="mpg", data=mpg_dataset)

# 그래프 제목 설정
plt.title("Displacement vs. MPG")

# x축 라벨 설정
plt.xlabel("Displacement")

# y축 라벨 설정
plt.ylabel("MPG")

# 그래프 출력
plt.show()

Box Plot 그리기

Box plot은 데이터의 분포와 이상치를 한눈에 확인할 수 있는 그래프입니다. 예제 코드에서는 실린더 수에 따른 마력 분포를 Box plot으로 그려보겠습니다.

# Box plot 그리기
sns.boxplot(x="cylinders", y="horsepower", data=mpg_dataset)

# 그래프 제목 설정
plt.title("Horsepower Distribution by Cylinders")

# x축 라벨 설정
plt.xlabel("Cylinders")

# y축 라벨 설정
plt.ylabel("Horsepower")

# 그래프 출력
plt.show()

Conclusion

이제 Seaborn을 사용하여 자동차 성능 데이터를 Scatter plot과 Box plot 등의 시각화 방법으로 표현하는 방법을 알아보았습니다. Seaborn은 다양한 형태의 그래프를 간편하게 그릴 수 있는 강력한 도구입니다. 자세한 사용법은 Seaborn 공식 문서를 참고하시기 바랍니다.

해시태그

#Seaborn #시각화