Seaborn을 사용하여 자동차 성능 데이터 시각화하기

Seaborn은 Python에서 데이터 시각화를 위한 인기 있는 라이브러리입니다. 이번 포스트에서는 Seaborn을 사용하여 자동차 성능 데이터를 시각화하는 방법을 알아보겠습니다.

1. 데이터셋 불러오기

먼저, Seaborn에 내장된 자동차 성능 데이터셋을 불러옵니다. 이 데이터셋은 “mpg”라는 변수를 가지고 있으며, 자동차의 연비 정보를 담고 있습니다.

import seaborn as sns

df = sns.load_dataset('mpg')

2. 데이터 살펴보기

다음으로, 불러온 데이터의 구조와 내용을 살펴봅니다.

print(df.head())  # 첫 5개의 행 출력
print(df.info())  # 데이터프레임의 요약 정보 출력

3. 시각화하기

이제 Seaborn을 사용하여 자동차 성능 데이터를 시각화해보겠습니다.

산점도

산점도는 두 변수 간의 관계를 시각화하는데 유용합니다. 예를 들어, 연비와 마력 간의 관계를 산점도로 시각화할 수 있습니다.

sns.scatterplot(x='mpg', y='horsepower', data=df)

박스 플롯

박스 플롯은 데이터의 분포와 이상치를 확인하는데 사용됩니다. 예를 들어, 연료 종류에 따른 연비를 박스 플롯으로 시각화할 수 있습니다.

sns.boxplot(x='fuel_type', y='mpg', data=df)

히스토그램

히스토그램은 변수의 분포를 보여주는데에 사용됩니다. 예를 들어, 자동차의 무게 분포를 히스토그램으로 시각화할 수 있습니다.

sns.histplot(x='weight', data=df)

마무리

이렇게 Seaborn을 사용하여 자동차 성능 데이터를 시각화하는 방법을 알아보았습니다. Seaborn은 다양한 시각화 옵션을 제공하여 데이터 분석 작업을 더욱 효과적으로 할 수 있도록 도와줍니다.

추가로 자세한 내용을 알고 싶다면, Seaborn 공식 문서를 참조해보세요.

#python #시각화