[python] PyYAML로 YAML 파일의 데이터를 분석하여 특정 통계 정보 도출하기

PyYAML은 파이썬에서 YAML 파일을 처리하기 위한 라이브러리입니다. 이 라이브러리를 사용하여 YAML 파일의 데이터를 분석하고 특정 통계 정보를 도출해보겠습니다.

YAML 파일 예시

- name: John
  age: 25
  gender: male
- name: Jane
  age: 30
  gender: female
- name: Bob
  age: 35
  gender: male
- name: Alice
  age: 28
  gender: female

위의 예시는 YAML 파일로, 사람들의 이름, 나이, 성별 정보를 담고 있습니다. 이제 이 데이터를 분석하여 특정 통계 정보를 도출해보겠습니다.

코드 예시

import yaml

def analyze_yaml(file_path):
    with open(file_path, 'r') as file:
        data = yaml.safe_load(file)

    total_count = len(data)
    male_count = len([person for person in data if person['gender'] == 'male'])
    female_count = len([person for person in data if person['gender'] == 'female'])
    average_age = sum([person['age'] for person in data]) / total_count

    return {
        'total_count': total_count,
        'male_count': male_count,
        'female_count': female_count,
        'average_age': average_age
    }

file_path = 'people.yaml'
result = analyze_yaml(file_path)
print(result)

위의 코드는 PyYAML을 사용하여 YAML 파일을 분석하고, 사람들의 수, 남성 수, 여성 수, 평균 나이를 계산하여 결과를 출력하는 예시입니다.

출력 결과

{
    'total_count': 4,
    'male_count': 2,
    'female_count': 2,
    'average_age': 29.5
}

위의 결과는 예시 YAML 파일을 분석한 결과입니다. 총 4명의 사람 데이터가 있으며, 남성 2명, 여성 2명으로 구성되어 있습니다. 평균 나이는 29.5세입니다.

이처럼 PyYAML을 사용하면 YAML 파일의 데이터를 간편하게 분석하고 원하는 통계 정보를 도출할 수 있습니다.

참고 자료