[파이썬] 파일 객체의 반복 순회와 메모리 효율성

01 Sep 2023

python

파이썬에서 파일을 처리할때, 파일 객체를 반복적으로 순회하는 것은 매우 유용합니다. 파일을 한번에 메모리에 읽어들이지 않고, 한 줄씩 읽어들여서 처리할 수 있기 때문에 메모리 효율적입니다. 이번 블로그 포스트에서는 파일 객체의 반복 순회 방법과 메모리 효율성에 대해 알아보겠습니다.

파일 객체를 반복 순회하기

파이썬에서 파일을 열 때, 내장 함수인 open()을 사용합니다. 파일을 열면 파일 객체가 반환되며, 이 파일 객체는 반복 가능한 객체입니다. 따라서 for 문을 사용하여 파일 객체를 순회할 수 있습니다.

with open('myfile.txt', 'r') as file:
    for line in file:
        print(line)

위의 예시에서 myfile.txt라는 파일을 읽기 모드로 열고, file 변수에 파일 객체가 할당됩니다. 그리고 for 문을 사용하여 file 객체를 순회하면서 파일을 한 줄씩 읽어들여 line 변수에 할당하고 출력합니다.

메모리 효율성

파일 객체의 반복 순회는 메모리 효율적입니다. 왜냐하면 파일을 한번에 모두 메모리에 로드하지 않고, 한 줄씩 읽어들이기 때문입니다. 특히 대용량의 파일을 처리할 때 유용하며, 메모리 부족 에러를 방지할 수 있습니다.

또한, 파일 객체의 반복 순회는 파일 크기에 상관없이 동일한 방식으로 수행됩니다. 따라서 파일의 크기가 매우 클지라도 메모리 효율적인 방식으로 처리할 수 있습니다.

파일 객체를 이용한 데이터 처리

파일 객체를 이용하여 데이터를 처리할 때, 필요에 따라 추가적인 작업을 수행할 수 있습니다. 예를 들어, 문자열 데이터를 파싱하거나 특정 조건을 만족하는 데이터만 처리하는 등의 작업이 가능합니다.

with open('data.csv', 'r') as file:
    for line in file:
        # 데이터 파싱
        data = line.split(',')
        
        # 특정 조건을 만족하는 데이터만 처리
        if data[2] == 'Male':
            # 추가적인 작업 수행
            process_data(data)

위의 예시에서 data.csv라는 CSV 파일을 읽기 모드로 열고, 파일을 한 줄씩 읽어들여 line 변수에 할당합니다. 그리고 line을 쉼표로 분리하여 data라는 리스트에 저장합니다.

이후, if 문을 사용하여 data 리스트의 3번째 항목이 ‘Male’인 데이터만 처리합니다. 처리할 때에는 process_data() 함수를 호출하거나 필요한 작업을 수행할 수 있습니다.

위의 예시처럼 파일 객체의 반복 순회를 활용하면, 대용량의 파일을 효율적으로 처리할 수 있습니다.

결론

파일 객체의 반복 순회는 메모리 효율성을 갖고 있는 파일 처리 방법입니다. 대용량 파일의 처리나 메모리 부족 상황을 피하고자 할 때, 파일 객체를 반복 순회하여 한 줄씩 처리하는 방법을 사용할 수 있습니다. 이를 통해 파일 기반의 데이터 처리 작업을 효율적으로 수행할 수 있습니다.

프로그래머는 파일 처리 작업을 할 때, 반복적으로 사용되는 파일 객체의 반복 순회 방법과 메모리 효율성을 이해하고, 이를 활용하여 효과적인 코드를 작성할 수 있어야 합니다.