seaborn
은 데이터 시각화를 위한 강력한 도구입니다. pandas
는 데이터 분석을 위한 인기 있는 라이브러리입니다. 이 두 라이브러리를 함께 사용하면 데이터를 쉽게 시각화할 수 있습니다. 이번 블로그 포스트에서는 seaborn
과 pandas
를 연동하는 방법에 대해 알아보겠습니다.
seaborn
과 pandas
설치하기
먼저, seaborn
과 pandas
를 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.
pip install seaborn pandas
seaborn
데이터 셋 활용하기
seaborn
에는 여러 가지 예제 데이터 셋이 내장되어 있습니다. 이 데이터 셋을 활용하여 seaborn
과 pandas
를 연동해보겠습니다.
import seaborn as sns
import pandas as pd
# `seaborn`의 내장 데이터 셋인 'tips' 데이터를 가져옵니다.
tips = sns.load_dataset('tips')
# `pandas` 데이터프레임으로 변환합니다.
tips_df = pd.DataFrame(tips)
# 데이터 셋 확인하기
print(tips_df.head())
위의 코드는 seaborn
내장 데이터 셋인 ‘tips’ 데이터를 가져와서 pandas
데이터프레임으로 변환하는 예제입니다. tips_df.head()
를 통해 데이터를 확인할 수 있습니다.
데이터 시각화하기
이제 seaborn
과 pandas
를 연동하여 데이터를 시각화해보겠습니다. 아래의 예제 코드는 ‘tips’ 데이터의 요일(day)별 식사 비용(total_bill)의 분포를 시각화하는 예제입니다.
import seaborn as sns
import pandas as pd
# `seaborn`의 내장 데이터 셋인 'tips' 데이터를 가져옵니다.
tips = sns.load_dataset('tips')
# `pandas` 데이터프레임으로 변환합니다.
tips_df = pd.DataFrame(tips)
# 데이터 시각화
sns.boxplot(x='day', y='total_bill', data=tips_df)
위의 코드는 seaborn
의 boxplot
함수를 사용하여 요일 별 식사 비용의 분포를 시각화합니다. x='day'
는 x축의 값으로 요일을 사용하고, y='total_bill'
은 y축의 값으로 식사 비용을 사용합니다.
seaborn
과 pandas
로 데이터 분석하기
seaborn
과 pandas
를 연동하여 데이터를 시각화할 뿐만 아니라, 데이터 분석에도 활용할 수 있습니다. 아래의 예제 코드는 ‘tips’ 데이터에서 흡연 여부(smoker)에 따른 식사 비용(total_bill)의 평균을 계산하는 예제입니다.
import seaborn as sns
import pandas as pd
# `seaborn`의 내장 데이터 셋인 'tips' 데이터를 가져옵니다.
tips = sns.load_dataset('tips')
# `pandas` 데이터프레임으로 변환합니다.
tips_df = pd.DataFrame(tips)
# `seaborn`과 `pandas`로 데이터 분석하기
average_bill_by_smoker = tips_df.groupby('smoker')['total_bill'].mean()
print(average_bill_by_smoker)
위의 코드는 pandas
의 groupby
함수와 mean
함수를 사용하여 흡연 여부에 따른 식사 비용의 평균을 계산합니다. tips_df.groupby('smoker')['total_bill'].mean()
을 통해 계산된 평균 값을 확인할 수 있습니다.
이처럼 seaborn
과 pandas
를 연동하여 데이터를 시각화하고 분석하는 방법에 대해 알아보았습니다. 이제 여러분은 데이터를 보다 쉽게 이해하고 분석할 수 있는 강력한 도구를 사용할 수 있게 되었습니다. Happy coding!