[파이썬] pandas에서 기본 데이터 탐색 (head, tail)
파이썬 데이터 분석 라이브러리인 pandas는 데이터 탐색과 전처리를 위한 강력한 기능을 제공합니다. 이 중에서 데이터의 첫 부분과 마지막 부분을 살펴볼 수 있는 head()
와 tail()
함수에 대해서 알아보겠습니다.
head() 함수
head()
함수는 데이터프레임의 첫 부분을 반환해주는 함수입니다. 기본적으로 첫 5개의 행을 반환하지만, 괄호 안에 숫자를 지정하여 반환할 행의 수를 조절할 수 있습니다.
import pandas as pd
# 샘플 데이터프레임 생성
data = {'이름': ['John', 'Jane', 'Alex', 'Emily', 'Michael'],
'나이': [28, 24, 32, 27, 29],
'성별': ['남', '여', '남', '여', '남'],
'직업': ['학생', '회사원', '의사', '교사', '연구원']}
df = pd.DataFrame(data)
# 첫 5개 행 출력
print(df.head())
위의 코드를 실행하면 다음과 같은 결과가 출력됩니다.
이름 | 나이 | 성별 | 직업 | |
---|---|---|---|---|
0 | John | 28 | 남 | 학생 |
1 | Jane | 24 | 여 | 회사원 |
2 | Alex | 32 | 남 | 의사 |
3 | Emily | 27 | 여 | 교사 |
4 | Michael | 29 | 남 | 연구원 |
tail() 함수
tail()
함수는 데이터프레임의 마지막 부분을 반환해주는 함수입니다. 기본적으로 마지막 5개의 행을 반환하지만, 괄호 안에 숫자를 지정하여 반환할 행의 수를 조절할 수 있습니다.
import pandas as pd
# 샘플 데이터프레임 생성
data = {'이름': ['John', 'Jane', 'Alex', 'Emily', 'Michael'],
'나이': [28, 24, 32, 27, 29],
'성별': ['남', '여', '남', '여', '남'],
'직업': ['학생', '회사원', '의사', '교사', '연구원']}
df = pd.DataFrame(data)
# 마지막 3개 행 출력
print(df.tail(3))
위의 코드를 실행하면 다음과 같은 결과가 출력됩니다.
이름 | 나이 | 성별 | 직업 | |
---|---|---|---|---|
2 | Alex | 32 | 남 | 의사 |
3 | Emily | 27 | 여 | 교사 |
4 | Michael | 29 | 남 | 연구원 |
head()
와 tail()
함수를 사용하면 데이터프레임의 처음과 끝 부분을 빠르게 확인할 수 있습니다. 5개의 행만 보여주는 기본값 외에도 원하는 행의 수를 지정하여 원하는 양의 데이터를 확인할 수 있습니다. 데이터 탐색과 전처리 과정에서 이러한 함수들을 유용하게 활용해보세요.