[python] PyYAML으로 다중 YAML 파일을 읽어와서 데이터를 합치기

YAML은 사람이 읽을 수 있는 데이터 직렬화 양식으로서, 많은 프로그래밍 언어에서 사용됩니다. PyYAML은 Python에서 YAML 형식의 데이터를 다룰 수 있는 모듈입니다.

여기서는 PyYAML을 사용하여 다중 YAML 파일을 읽어와서 데이터를 합치는 방법에 대해 알아보겠습니다.

1. PyYAML 설치하기

먼저, PyYAML을 설치해야 합니다. 아래의 명령어를 사용하여 PyYAML을 설치할 수 있습니다.

pip install pyyaml

2. 다중 YAML 파일 읽기

다음으로, 다중 YAML 파일을 읽어오는 방법에 대해 알아보겠습니다. 아래의 예제 코드를 참고하세요.

import yaml

def merge_yaml_files(file_paths):
    merged_data = {}

    for file_path in file_paths:
        with open(file_path, 'r') as file:
            data = yaml.safe_load(file)
            merged_data.update(data)

    return merged_data

file_paths = ['file1.yaml', 'file2.yaml', 'file3.yaml']
merged_data = merge_yaml_files(file_paths)

위의 코드는 merge_yaml_files 함수를 정의하고, 입력으로 다중 YAML 파일의 경로를 받습니다. 각 파일을 순회하면서 safe_load 함수를 사용하여 YAML 파일을 파싱하고, 해당 데이터를 merged_data 딕셔너리에 추가합니다. 마지막으로, 합쳐진 데이터를 반환합니다.

3. 합쳐진 데이터 활용하기

merge_yaml_files 함수를 사용하여 합쳐진 데이터를 얻은 후, 이를 원하는 대로 활용할 수 있습니다. 예를 들어, 합쳐진 데이터를 JSON 파일로 저장하거나, 특정 필드 값을 조회하는 등의 작업을 수행할 수 있습니다.

import json

# 데이터를 JSON 파일로 저장하기
with open('merged_data.json', 'w') as file:
    json.dump(merged_data, file)

# 특정 필드 값 조회하기
value = merged_data['field_name']

위의 예제 코드에서는 json.dump 함수를 사용하여 합쳐진 데이터를 JSON 형식으로 저장합니다. 또한, merged_data 딕셔너리를 통해 원하는 필드 값을 조회할 수 있습니다. 필드 이름은 실제 데이터에 따라 변경해주어야 합니다.

4. 결론

이제 PyYAML을 사용하여 다중 YAML 파일을 읽어와서 데이터를 합치는 방법을 알아보았습니다. 이를 통해 YAML 형식의 데이터를 효과적으로 다룰 수 있으며, 원하는 작업을 수행하기 위해 데이터를 활용할 수 있습니다.