[파이썬] matplotlib 시계열 데이터 시각화

데이터 시각화는 기계 학습과 데이터 분석 작업에서 매우 중요합니다. 이 중에서도 시계열 데이터는 시간에 따른 변화를 시각적으로 이해하기 위해 시각화하는 데 특히 유용합니다.

Python의 Matplotlib 라이브러리는 데이터 시각화에 널리 사용되는 도구로, 시계열 데이터 시각화를 위한 강력한 기능을 제공합니다. 이 블로그 포스트에서는 Matplotlib을 사용하여 시계열 데이터를 시각화하는 방법에 대해 알아보겠습니다.

1. 라이브러리 설치

먼저 Matplotlib 라이브러리를 설치해야 합니다. 다음 명령어를 사용하여 설치할 수 있습니다:

pip install matplotlib

2. 시계열 데이터 가져오기

시각화할 시계열 데이터를 가져옵니다. 예를 들어, 주식 가격 데이터를 사용해보겠습니다.

import pandas as pd

# 데이터 파일 읽기
df = pd.read_csv('stock_prices.csv')

# 데이터 확인
print(df.head())

3. 데이터 시각화

Matplotlib의 pyplot 모듈을 사용하여 시계열 데이터를 시각화할 수 있습니다.

import matplotlib.pyplot as plt

# 날짜 데이터를 인덱스로 설정
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)

# 주식 가격 시계열 데이터 그래프 그리기
plt.figure(figsize=(12, 6))
plt.plot(df.index, df['Close'], color='blue')
plt.title('Stock Prices over Time')
plt.xlabel('Date')
plt.ylabel('Price')
plt.show()

위의 코드는 주식 가격 데이터의 종가를 시간에 따라 그래프로 그립니다. plt.plot 함수를 사용하여 선 그래프를 그리는데, X축은 날짜 데이터이고 Y축은 주식 가격입니다.

시각화 결과는 plt.show 함수를 호출하여 출력됩니다.

4. 추가적인 시각화 요소

Matplotlib을 사용하면 그래프에 다양한 시각적 요소를 추가할 수 있습니다.

선 스타일 변경하기

plt.plot(df.index, df['Close'], color='blue', linestyle='--', linewidth=2)

위의 코드는 선의 색상, 스타일 및 두께를 설정하는 예입니다.

축 범위 설정하기

plt.xlim(['2017-01-01', '2017-12-31'])
plt.ylim([0, 200])

위의 코드는 X축 및 Y축의 범위를 설정하는 예입니다.

축 레이블 및 제목 설정하기

plt.title('Stock Prices over Time', fontsize=14)
plt.xlabel('Date', fontsize=12)
plt.ylabel('Price', fontsize=12)

위의 코드는 그래프의 제목과 축 레이블의 텍스트 및 글꼴 크기를 설정하는 예입니다.

이렇게 Matplotlib을 사용하여 시계열 데이터를 시각화하는 방법을 알아보았습니다. Matplotlib의 다양한 기능을 사용하면 데이터의 시간적 변화를 더 잘 이해할 수 있습니다. 다양한 시각화 기법을 실험해보고 데이터 분석 작업에 최적인 시각화 방법을 찾아보세요.