[python] 파이썬 pandas의 주요 기능은 무엇인가요?
판다스(pandas)는 데이터 조작과 분석을 위한 파이썬 라이브러리로, 다음과 같은 주요 기능을 포함하고 있습니다:
1. 데이터 구조
- Series: 1차원 배열, 리스트 또는 스칼라 값으로 생성됩니다.
- DataFrame: 2차원 테이블로, 행과 열을 가지며 SQL 테이블이나 엑셀 스프레드시트와 유사합니다.
- Indexing: 데이터를 검색하고 선택하기 위한 다양한 인덱싱 옵션을 제공합니다.
2. 데이터 조작
- 데이터 로딩/저장: CSV, 엑셀, 데이터베이스 등 다양한 데이터 소스로부터 데이터를 로딩하고 저장할 수 있습니다.
- 데이터 정제: 결측값 처리, 이상치 제거, 중복 데이터 제거 등을 수행할 수 있습니다.
- 데이터 변환: 데이터 형식 변경, 컬럼 추가/삭제, 그룹화, 정렬 등 다양한 데이터 조작 기능을 제공합니다.
3. 데이터 분석
- 기술통계: 평균, 표준편차, 분위수 등의 통계량을 계산할 수 있습니다.
- 시각화: matplotlib과의 통합을 통해 데이터를 시각화할 수 있으며, seaborn과 같은 시각화 라이브러리를 지원합니다.
- 데이터 분석 도구: GroupBy, Pivot Table, 연산 등 데이터를 분석하기 위한 다양한 도구를 제공합니다.
판다스는 데이터 과학 및 기계 학습 분야에서 매우 인기 있는 도구로, 데이터 처리와 분석 작업을 효율적으로 수행하기 위한 다양한 기능을 제공합니다.
더 많은 정보는 판다스 공식 문서에서 확인할 수 있습니다.