[pandas] DataFrame 기본

DataFrame

DataFrameSeries의 집합으로 구성된다. 각각의 columnSeries에 해당한다. 또한 2차원이다.

Dictionary를 이용한 DataFrame 생성

dictionary의 key값이 column이 된다. 다음의 예를 봐보자.

import numpy as np
import pandas as pd

data = {'name' : ['홍길동','김연아','홍길동','강감찬','이순신'],
        'year' : [2015, 2019, 2020, 2013, 2017],
        'point': [3.5, 1.5, 2.0, 3.4, 4.0]  }

# DataFrame 생성
df = pd.DataFrame(data)
print(df)
#  name  year  point
# 0  홍길동  2015    3.5
# 1  김연아  2019    1.5
# 2  홍길동  2020    2.0
# 3  강감찬  2013    3.4
# 4  이순신  2017    4.0  

dict_dataframe

CSV파일을 이용한 DataFrame 생성

csv 파일을 이용해서 pandas.DataFrame을 만들 수 있다. root directory가 c:/notebook_dir

이고 data파일들을 c:/notebook_dir/data 에서 관리하므로 이 폴더안에 student.csv를 생성한다.

참고 : csv파일의 data는 ,로 구분한다.
참고 : 자료의 크기가 클때 display(df.head())display(df.tail()) 을 이용해 위에서 5개, 아래에서 5개 자료를 확인할 수 있다.

Database를 이용한 DataFrame 생성