[python] Jupyter Notebook에서 데이터 분석 및 조작법
Jupyter Notebook은 데이터 분석과 시각화를 위한 인기 있는 환경 중 하나입니다. 이번 글에서는 Jupyter Notebook에서 데이터를 분석하고 조작하는 방법에 대해 알아보겠습니다.
목차
데이터 불러오기
Jupyter Notebook에서 데이터를 불러오는 가장 일반적인 방법은 pandas 라이브러리의 read_csv
함수를 사용하는 것입니다. 다음은 예시 코드입니다.
import pandas as pd
# 데이터 불러오기
data = pd.read_csv('data.csv')
데이터 조작
pandas 라이브러리를 사용하면 데이터를 쉽게 조작할 수 있습니다. 예를 들어, 데이터프레임의 열을 선택하거나 조건에 맞는 행을 필터링하는 등 다양한 작업이 가능합니다.
# 열 선택
selected_data = data['column_name']
# 조건에 맞는 행 필터링
filtered_data = data[data['column_name'] > 100]
데이터 시각화
Jupyter Notebook에서 데이터를 시각화하는 방법 중 하나는 matplotlib 라이브러리를 사용하는 것입니다. 아래는 간단한 선 그래프를 그리는 예시입니다.
import matplotlib.pyplot as plt
# 선 그래프 그리기
plt.plot(data['x'], data['y'])
plt.show()
이렇게 Jupyter Notebook을 사용하여 데이터를 불러오고 조작하며 시각화할 수 있습니다.