소개
산점도(Scatter plot)는 데이터의 분포를 시각화하는 데 사용되는 그래프입니다. 산점도는 두 변수 간의 관계를 파악하거나 이상치를 확인하는 데 유용합니다. 이번 블로그에서는 Python에서 산점도를 그리는 방법에 대해 알아보겠습니다.
matplotlib 라이브러리
Python에서 데이터 시각화를 위해 많이 사용되는 라이브러리 중 하나는 matplotlib입니다. matlpotlib는 다양한 그래프를 그리는 데 사용되며, 산점도를 그리는 데에도 유용하게 쓰일 수 있습니다.
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
plt.scatter(x, y)
plt.show()
위의 예제는 x와 y 좌표를 사용하여 산점도를 그리는 간단한 코드입니다. plt.scatter(x, y)
함수를 사용하여 산점도를 그린 후, plt.show()
함수를 사용하여 그림을 표시합니다.
산점도 옵션
산점도를 그릴 때 추가적인 옵션을 사용하여 그래프를 더욱 개선할 수 있습니다. 예를 들어, 산점도 점의 색상, 크기, 투명도 등을 변경할 수 있습니다.
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
colors = ['red', 'green', 'blue', 'yellow', 'orange']
sizes = [20, 40, 60, 80, 100]
plt.scatter(x, y, c=colors, s=sizes, alpha=0.5)
plt.show()
위의 예제에서는 c
옵션을 사용하여 점의 색상을 지정하고, s
옵션을 사용하여 점의 크기를 지정합니다. 또한 alpha
옵션을 사용하여 투명도를 조절할 수 있습니다.
결과
아래는 산점도 그래프의 예시입니다.
위의 예시에서는 x와 y가 각각 1부터 5까지의 값이며, 색상은 [‘red’, ‘green’, ‘blue’, ‘yellow’, ‘orange’]로 지정되었습니다. 점의 크기는 [20, 40, 60, 80, 100]으로 지정되었고, 투명도는 0.5입니다.
결론
Python의 matplotlib 라이브러리를 사용하면 간단하게 산점도(스캐터 플롯)를 그릴 수 있습니다. 산점도 그래프는 데이터의 분포를 시각화하고, 두 변수 간의 관계를 파악하기 위해 유용합니다. 색상, 크기, 투명도 등의 옵션을 사용하여 그래프를 더욱 다양하게 표현할 수 있습니다.