[Python데이터분석] 3. Pandas 주요 자료구조 소개
Series
- 1차원 데이터를 표현
- Index
- 리스트/튜플의 Index, 사전의 key와 유사
- 같은 값의 index를 중복 지정 가능
- 리스트/튜플의 Index를 활용하여 생성
- 사전의 key를 활용해서 생성
Dataframe
- 2차원 데이터를 표현
- 엑셀의 Worksheet와 유사 > 차트없이 데이터만 표현
- list/tuple/사전의 2차원 데이터로부터의 생성 지원
- 엑셀파일, CSV파일, 데이터베이스 등으로부터의 생성 지원
- Index: 행에서의 index, Columns: 열에서의 index
정리
- 주로 DataFrame을 통해 데이터 처리
- Series만을 단독으로 생성하여 사용할 일은 거의 없으면, 대개 DataFrame내 데이터를 행 단위, 컬럼 단위로 접근할 때 Series 자료구조로 접근