[파이썬] pandas에서 기본 데이터 탐색 (head, tail)

파이썬 데이터 분석 라이브러리인 pandas는 데이터 탐색과 전처리를 위한 강력한 기능을 제공합니다. 이 중에서 데이터의 첫 부분과 마지막 부분을 살펴볼 수 있는 head()tail() 함수에 대해서 알아보겠습니다.

head() 함수

head() 함수는 데이터프레임의 첫 부분을 반환해주는 함수입니다. 기본적으로 첫 5개의 행을 반환하지만, 괄호 안에 숫자를 지정하여 반환할 행의 수를 조절할 수 있습니다.

import pandas as pd

# 샘플 데이터프레임 생성
data = {'이름': ['John', 'Jane', 'Alex', 'Emily', 'Michael'],
        '나이': [28, 24, 32, 27, 29],
        '성별': ['남', '여', '남', '여', '남'],
        '직업': ['학생', '회사원', '의사', '교사', '연구원']}

df = pd.DataFrame(data)

# 첫 5개 행 출력
print(df.head())

위의 코드를 실행하면 다음과 같은 결과가 출력됩니다.

  이름 나이 성별 직업
0 John 28 학생
1 Jane 24 회사원
2 Alex 32 의사
3 Emily 27 교사
4 Michael 29 연구원

tail() 함수

tail() 함수는 데이터프레임의 마지막 부분을 반환해주는 함수입니다. 기본적으로 마지막 5개의 행을 반환하지만, 괄호 안에 숫자를 지정하여 반환할 행의 수를 조절할 수 있습니다.

import pandas as pd

# 샘플 데이터프레임 생성
data = {'이름': ['John', 'Jane', 'Alex', 'Emily', 'Michael'],
        '나이': [28, 24, 32, 27, 29],
        '성별': ['남', '여', '남', '여', '남'],
        '직업': ['학생', '회사원', '의사', '교사', '연구원']}

df = pd.DataFrame(data)

# 마지막 3개 행 출력
print(df.tail(3))

위의 코드를 실행하면 다음과 같은 결과가 출력됩니다.

  이름 나이 성별 직업
2 Alex 32 의사
3 Emily 27 교사
4 Michael 29 연구원

head()tail() 함수를 사용하면 데이터프레임의 처음과 끝 부분을 빠르게 확인할 수 있습니다. 5개의 행만 보여주는 기본값 외에도 원하는 행의 수를 지정하여 원하는 양의 데이터를 확인할 수 있습니다. 데이터 탐색과 전처리 과정에서 이러한 함수들을 유용하게 활용해보세요.