[python] PyYAML을 사용하여 YAML 파일의 데이터를 필터링하고 압축하기

YAML은 사람이 쉽게 읽고 쓸 수 있는 데이터 직렬화 형식입니다. PyYAML은 Python에서 YAML을 파싱하고 생성하기 위한 모듈입니다. 이 블로그 포스트에서는 PyYAML을 사용하여 YAML 파일의 데이터를 필터링하고 압축하는 방법을 알아보겠습니다.

필요한 라이브러리 설치하기

먼저, PyYAML 라이브러리를 설치해야 합니다. 다음 명령을 사용하여 설치할 수 있습니다.

pip install pyyaml

YAML 파일 파싱하기

다음으로, PyYAML을 사용하여 YAML 파일을 파싱해보겠습니다. 예시로 아래 YAML 파일을 사용하겠습니다.

# example.yaml
name: John
age: 25
city: New York

다음 코드를 사용하여 YAML 파일을 파싱합니다.

import yaml

with open('example.yaml', 'r') as file:
    data = yaml.load(file, Loader=yaml.FullLoader)

print(data)

데이터 필터링하기

이제 파싱한 데이터를 필터링해보겠습니다. 예를 들어, 나이 데이터만 가져와 보겠습니다. 다음 코드를 사용하면 됩니다.

age = data['age']
print(age)

압축하기

필요한 데이터를 추출한 후에는 필요에 따라 데이터를 압축할 수 있습니다. 예를 들어, 압축된 데이터를 JSON 형식으로 저장하려면 다음과 같이 코드를 작성할 수 있습니다.

import json

compressed_data = json.dumps(data)
print(compressed_data)

결론

이렇게 PyYAML을 사용하여 YAML 파일의 데이터를 필터링하고 압축하는 방법을 알아보았습니다. PyYAML은 YAML 데이터를 파싱하고 생성하는 간단하고 편리한 도구입니다. 추가로 PyYAML의 다른 기능들도 탐색해 보세요!

참고 자료