[shell] 디렉토리를 이용한 데이터 분석 방법

26 Dec 2023

이 포스트에서는 디렉토리를 이용하여 데이터를 효율적으로 분석하는 방법에 대해 알아보겠습니다.

1. 디렉토리 구조 설계

데이터가 많을수록 효율적인 관리가 필요하며, 이를 위해 디렉토리 구조를 잘 설계해야 합니다. 예를 들어, 시간별, 주제별, 형식별로 디렉토리를 구분하여 데이터를 관리할 수 있습니다.

data/
|-- 2022/
|   |-- 01/
|   |   |-- sales.csv
|   |   |-- inventory.csv
|   |-- 02/
|-- 2023/

Python을 사용하여 디렉토리 내의 데이터를 불러올 때는 os 모듈을 사용하여 파일 경로를 동적으로 생성할 수 있습니다.

import os
import pandas as pd

data_dir = 'data/2022/01/'
sales_data = pd.read_csv(os.path.join(data_dir, 'sales.csv'))

데이터를 분석하고 처리할 때도 디렉토리를 잘 활용할 수 있습니다. 예를 들어, 드롭박스와 유사한 방식으로 분석된 데이터를 다른 디렉토리에 저장하고 관리할 수 있습니다.

output_dir = 'analysis/2022/01/'
analysis_result.to_csv(os.path.join(output_dir, 'result.csv'))

이처럼 디렉토리 구조를 활용하여 데이터를 효율적으로 관리하고 분석할 수 있습니다. 데이터 분석 작업을 진행할 때는 항상 디렉토리 설계에 신경써서 관리하도록 합시다.