[pandas] DataFrame row

기본 DataFrame row

Dataframe의 rowcolumn 처리 방법에는 어느정도 차이가 존재한다.

대부분의 예제로 다음의 data를 사용한다.

import pandas as pd
import numpy as np

data = {'이름':['이지은', '박동훈', '홍길동', '강감찬', '오해영'],
        '학과':['컴퓨터', '기계','철학', '컴퓨터', '철학'],
        '학년':[1, 2, 2, 4, 3],
        '학점':[1.5, 2.0, 3.1, 1.1, 2.7]
       }
df = pd.DataFrame(data, 
                  columns = ['학과', '이름', '학점', '학년', '등급'],
                  index = ['one', 'two', 'three', 'four', 'five'])

display(df)

dataFrame_detail

기본적인 column 추출 방법

print(df['one'])   # Error
print(df[0])	   # Error
display(df['one':'three'])

image-20200912015639818

display(df[0:3])   # 위와 동일한 값을 추출한다.(column에 대해서 하지 않는다.)

image-20200912015724200

display(df[[0,2]])   # Error