데이터 시각화는 기계 학습과 데이터 분석 작업에서 매우 중요합니다. 이 중에서도 시계열 데이터는 시간에 따른 변화를 시각적으로 이해하기 위해 시각화하는 데 특히 유용합니다.
Python의 Matplotlib 라이브러리는 데이터 시각화에 널리 사용되는 도구로, 시계열 데이터 시각화를 위한 강력한 기능을 제공합니다. 이 블로그 포스트에서는 Matplotlib을 사용하여 시계열 데이터를 시각화하는 방법에 대해 알아보겠습니다.
1. 라이브러리 설치
먼저 Matplotlib 라이브러리를 설치해야 합니다. 다음 명령어를 사용하여 설치할 수 있습니다:
pip install matplotlib
2. 시계열 데이터 가져오기
시각화할 시계열 데이터를 가져옵니다. 예를 들어, 주식 가격 데이터를 사용해보겠습니다.
import pandas as pd
# 데이터 파일 읽기
df = pd.read_csv('stock_prices.csv')
# 데이터 확인
print(df.head())
3. 데이터 시각화
Matplotlib의 pyplot
모듈을 사용하여 시계열 데이터를 시각화할 수 있습니다.
import matplotlib.pyplot as plt
# 날짜 데이터를 인덱스로 설정
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)
# 주식 가격 시계열 데이터 그래프 그리기
plt.figure(figsize=(12, 6))
plt.plot(df.index, df['Close'], color='blue')
plt.title('Stock Prices over Time')
plt.xlabel('Date')
plt.ylabel('Price')
plt.show()
위의 코드는 주식 가격 데이터의 종가를 시간에 따라 그래프로 그립니다. plt.plot
함수를 사용하여 선 그래프를 그리는데, X축은 날짜 데이터이고 Y축은 주식 가격입니다.
시각화 결과는 plt.show
함수를 호출하여 출력됩니다.
4. 추가적인 시각화 요소
Matplotlib을 사용하면 그래프에 다양한 시각적 요소를 추가할 수 있습니다.
선 스타일 변경하기
plt.plot(df.index, df['Close'], color='blue', linestyle='--', linewidth=2)
위의 코드는 선의 색상, 스타일 및 두께를 설정하는 예입니다.
축 범위 설정하기
plt.xlim(['2017-01-01', '2017-12-31'])
plt.ylim([0, 200])
위의 코드는 X축 및 Y축의 범위를 설정하는 예입니다.
축 레이블 및 제목 설정하기
plt.title('Stock Prices over Time', fontsize=14)
plt.xlabel('Date', fontsize=12)
plt.ylabel('Price', fontsize=12)
위의 코드는 그래프의 제목과 축 레이블의 텍스트 및 글꼴 크기를 설정하는 예입니다.
이렇게 Matplotlib을 사용하여 시계열 데이터를 시각화하는 방법을 알아보았습니다. Matplotlib의 다양한 기능을 사용하면 데이터의 시간적 변화를 더 잘 이해할 수 있습니다. 다양한 시각화 기법을 실험해보고 데이터 분석 작업에 최적인 시각화 방법을 찾아보세요.