Seaborn을 활용한 박스 플롯 그리기

Seaborn은 파이썬의 데이터 시각화 라이브러리 중 하나로, Matplotlib을 기반으로 만들어진 강력하고 아름다운 그래프를 그리는 도구입니다. 이번에는 Seaborn을 사용하여 데이터의 분포를 시각화하는 박스 플롯(Box Plot)을 그려보겠습니다.

1. 필요한 라이브러리 설치하기

먼저, Seaborn을 사용하기 위해 필요한 라이브러리를 설치해야 합니다. 아래 명령어를 사용하여 설치할 수 있습니다.

pip install seaborn

2. 데이터 준비하기

Box Plot을 그리기 위해 필요한 데이터를 준비해야 합니다. 예를 들어, 다음과 같은 형식의 데이터를 사용해보겠습니다.

import pandas as pd

data = pd.DataFrame({
    'Group': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
    'Value': [3, 5, 8, 9, 2, 4, 6, 7]
})

위 코드는 ‘Group’이라는 열에는 그룹을 나타내는 값을, ‘Value’라는 열에는 해당 그룹의 데이터 값을 포함하는 DataFrame을 생성하는 예시입니다.

3. 박스 플롯 그리기

이제 Seaborn을 사용하여 데이터의 분포를 시각화하는 박스 플롯을 그려봅시다.

import seaborn as sns
import matplotlib.pyplot as plt

sns.boxplot(x='Group', y='Value', data=data)
plt.show()

위 코드는 ‘Group’ 열을 x축으로, ‘Value’ 열을 y축으로 설정한 박스 플롯을 그리는 예시입니다. 데이터는 앞서 준비한 DataFrame인 data를 사용합니다. 그린 박스 플롯을 보여주기 위해 plt.show() 함수를 사용합니다.

4. 그래프 커스터마이징

박스 플롯의 모양과 스타일을 조정하여 그래프를 더욱 아름답게 만들 수 있습니다. 예를 들어, 아래 코드를 사용하여 박스의 색상을 변경하고, 그룹 간의 간격을 늘릴 수 있습니다.

sns.boxplot(x='Group', y='Value', data=data, color='skyblue', width=0.5)
plt.show()

위 코드에서 color 매개변수를 사용하여 박스의 색상을 skyblue로 변경하고, width 매개변수를 사용하여 박스의 너비를 조정하였습니다.

요약

이제 Seaborn을 사용하여 박스 플롯을 그리고 맞춤화하는 방법을 알게 되었습니다. 더 다양한 그래프를 그려보고, Seaborn의 다른 기능을 탐색해보세요!

#seaborn #데이터시각화