[python] 판다스를 이용한 데이터 추출과 선택

판다스(pandas)는 파이썬에서 데이터 조작과 분석을 위한 라이브러리로, 데이터 프레임(DataFrame)이라는 자료구조를 제공합니다. 데이터 프레임은 엑셀 시트와 같은 형태로 데이터를 저장하고 조작할 수 있습니다. 이번 포스트에서는 판다스를 사용하여 데이터를 추출하고 선택하는 방법에 대해 알아보겠습니다.

데이터프레임 생성

판다스를 사용하기 위해서는 먼저 데이터프레임을 생성해야 합니다. 다음은 판다스에서 데이터프레임을 생성하는 예제입니다.

import pandas as pd

data = {'이름': ['철수', '영희', '영수', '미영'],
        '나이': [25, 30, 21, 27],
        '성별': ['남', '여', '남', '여']}

df = pd.DataFrame(data)
print(df)

데이터 추출

열 선택

데이터프레임에서 특정 열을 선택하려면 열의 이름을 사용합니다. 다음은 ‘이름’ 열을 선택하는 예제입니다.

names = df['이름']
print(names)

행 선택

데이터프레임에서 특정 행을 선택하려면 loc를 사용하여 인덱스를 지정합니다. 다음은 인덱스가 1인 행을 선택하는 예제입니다.

row = df.loc[1]
print(row)

특정 위치의 값 선택

iloc를 사용하여 데이터프레임에서 특정 위치의 값에 접근할 수 있습니다. 다음은 1행 1열의 값을 선택하는 예제입니다.

value = df.iloc[1, 1]
print(value)

조건에 따른 데이터 추출

특정 조건을 만족하는 데이터를 추출할 수도 있습니다. 다음은 나이가 25세 이상인 데이터를 추출하는 예제입니다.

above_25 = df[df['나이'] >= 25]
print(above_25)

결론

판다스를 사용하면 데이터프레임에서 필요한 데이터를 쉽게 추출하고 선택할 수 있습니다. 데이터 분석이나 가공 작업을 할 때 유용하게 활용할 수 있는 라이브러리입니다.

참고:

이상으로 판다스를 이용한 데이터 추출과 선택에 대해 알아보았습니다. 감사합니다!