[파이썬] `seaborn`과 `pandas` 연동하기

seaborn은 데이터 시각화를 위한 강력한 도구입니다. pandas는 데이터 분석을 위한 인기 있는 라이브러리입니다. 이 두 라이브러리를 함께 사용하면 데이터를 쉽게 시각화할 수 있습니다. 이번 블로그 포스트에서는 seabornpandas를 연동하는 방법에 대해 알아보겠습니다.

seabornpandas 설치하기

먼저, seabornpandas를 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.

pip install seaborn pandas

seaborn 데이터 셋 활용하기

seaborn에는 여러 가지 예제 데이터 셋이 내장되어 있습니다. 이 데이터 셋을 활용하여 seabornpandas를 연동해보겠습니다.

import seaborn as sns
import pandas as pd

# `seaborn`의 내장 데이터 셋인 'tips' 데이터를 가져옵니다.
tips = sns.load_dataset('tips')

# `pandas` 데이터프레임으로 변환합니다.
tips_df = pd.DataFrame(tips)

# 데이터 셋 확인하기
print(tips_df.head())

위의 코드는 seaborn 내장 데이터 셋인 ‘tips’ 데이터를 가져와서 pandas 데이터프레임으로 변환하는 예제입니다. tips_df.head()를 통해 데이터를 확인할 수 있습니다.

데이터 시각화하기

이제 seabornpandas를 연동하여 데이터를 시각화해보겠습니다. 아래의 예제 코드는 ‘tips’ 데이터의 요일(day)별 식사 비용(total_bill)의 분포를 시각화하는 예제입니다.

import seaborn as sns
import pandas as pd

# `seaborn`의 내장 데이터 셋인 'tips' 데이터를 가져옵니다.
tips = sns.load_dataset('tips')

# `pandas` 데이터프레임으로 변환합니다.
tips_df = pd.DataFrame(tips)

# 데이터 시각화
sns.boxplot(x='day', y='total_bill', data=tips_df)

위의 코드는 seabornboxplot 함수를 사용하여 요일 별 식사 비용의 분포를 시각화합니다. x='day'는 x축의 값으로 요일을 사용하고, y='total_bill'은 y축의 값으로 식사 비용을 사용합니다.

seabornpandas로 데이터 분석하기

seabornpandas를 연동하여 데이터를 시각화할 뿐만 아니라, 데이터 분석에도 활용할 수 있습니다. 아래의 예제 코드는 ‘tips’ 데이터에서 흡연 여부(smoker)에 따른 식사 비용(total_bill)의 평균을 계산하는 예제입니다.

import seaborn as sns
import pandas as pd

# `seaborn`의 내장 데이터 셋인 'tips' 데이터를 가져옵니다.
tips = sns.load_dataset('tips')

# `pandas` 데이터프레임으로 변환합니다.
tips_df = pd.DataFrame(tips)

# `seaborn`과 `pandas`로 데이터 분석하기
average_bill_by_smoker = tips_df.groupby('smoker')['total_bill'].mean()
print(average_bill_by_smoker)

위의 코드는 pandasgroupby 함수와 mean 함수를 사용하여 흡연 여부에 따른 식사 비용의 평균을 계산합니다. tips_df.groupby('smoker')['total_bill'].mean()을 통해 계산된 평균 값을 확인할 수 있습니다.

이처럼 seabornpandas를 연동하여 데이터를 시각화하고 분석하는 방법에 대해 알아보았습니다. 이제 여러분은 데이터를 보다 쉽게 이해하고 분석할 수 있는 강력한 도구를 사용할 수 있게 되었습니다. Happy coding!