[python] Jupyter Notebook에서 데이터 분석 및 조작법

Jupyter Notebook은 데이터 분석과 시각화를 위한 인기 있는 환경 중 하나입니다. 이번 글에서는 Jupyter Notebook에서 데이터를 분석하고 조작하는 방법에 대해 알아보겠습니다.

목차

  1. 데이터 불러오기
  2. 데이터 조작
  3. 데이터 시각화

데이터 불러오기

Jupyter Notebook에서 데이터를 불러오는 가장 일반적인 방법은 pandas 라이브러리의 read_csv 함수를 사용하는 것입니다. 다음은 예시 코드입니다.

import pandas as pd

# 데이터 불러오기
data = pd.read_csv('data.csv')

데이터 조작

pandas 라이브러리를 사용하면 데이터를 쉽게 조작할 수 있습니다. 예를 들어, 데이터프레임의 열을 선택하거나 조건에 맞는 행을 필터링하는 등 다양한 작업이 가능합니다.

# 열 선택
selected_data = data['column_name']

# 조건에 맞는 행 필터링
filtered_data = data[data['column_name'] > 100]

데이터 시각화

Jupyter Notebook에서 데이터를 시각화하는 방법 중 하나는 matplotlib 라이브러리를 사용하는 것입니다. 아래는 간단한 선 그래프를 그리는 예시입니다.

import matplotlib.pyplot as plt

# 선 그래프 그리기
plt.plot(data['x'], data['y'])
plt.show()

이렇게 Jupyter Notebook을 사용하여 데이터를 불러오고 조작하며 시각화할 수 있습니다.

참고 자료