[python] Seaborn을 사용한 데이터 시각화 점 크기 설정

데이터 시각화는 데이터의 패턴을 파악하고 이해하기 위해 중요한 도구입니다. Seaborn은 파이썬의 데이터 시각화 라이브러리 중 하나로, Matplotlib를 기반으로 하며 보다 간편하게 고품질의 그래프를 생성할 수 있습니다. 이번 포스트에서는 Seaborn을 사용하여 점 크기를 설정하는 방법에 대해 알아보겠습니다.

1. 라이브러리 설치 및 임포트

Seaborn을 사용하기 위해 우선 라이브러리를 설치해야 합니다. 아래 명령어를 사용하여 Seaborn을 설치할 수 있습니다.

pip install seaborn

설치가 완료되면, 다음과 같이 Seaborn을 임포트할 수 있습니다.

import seaborn as sns

2. 데이터 준비

데이터 시각화를 위해 적절한 데이터를 준비해야 합니다. 여기서는 Seaborn에 내장된 “tips” 데이터셋을 사용하겠습니다. “tips” 데이터셋은 식당에서 팁을 받은 손님들의 정보와 관련된 데이터가 포함되어 있습니다.

tips_data = sns.load_dataset("tips")

3. 점 크기 설정

Seaborn에서는 scatterplot을 사용하여 점으로 데이터를 표현할 수 있습니다. scatterplot 함수를 호출할 때, size 매개변수를 사용하여 점의 크기를 설정할 수 있습니다.

sns.scatterplot(data=tips_data, x="total_bill", y="tip", size="size")

위 예제에서는 “total_bill”과 “tip”을 x축과 y축으로 사용하고, “size”를 size 매개변수로 지정하여 점의 크기를 설정하였습니다.

4. 추가 설정

점의 크기를 설정하는 것 외에도, Seaborn을 통해 그래프의 다양한 요소를 설정할 수 있습니다. 예를 들어, 점의 색상이나 스타일을 변경하거나, 축의 레이블을 추가할 수 있습니다.

sns.scatterplot(data=tips_data, x="total_bill", y="tip", size="size", hue="smoker", style="time")
plt.xlabel("Total Bill")
plt.ylabel("Tip")
plt.title("Tips by Total Bill")

위 예제에서는 hue 매개변수를 사용하여 “smoker” 열의 값에 따라 점의 색상을 설정하고, style 매개변수를 사용하여 “time” 열의 값에 따라 점의 스타일을 설정하였습니다. xlabel, ylabel, title 함수를 사용하여 축의 레이블과 제목을 추가하였습니다.

이와 같이 Seaborn을 사용하여 데이터 시각화를 할 때, 점의 크기를 설정하는 방법을 알아보았습니다. Seaborn은 다양한 인터페이스와 설정 옵션을 제공하여 보다 편리하고 다양한 스타일의 그래프를 생성할 수 있습니다. 더 많은 정보는 Seaborn 공식 문서를 참고하시기 바랍니다.