[파이썬] `ggplot`을 활용한 인프라그래픽 제작

ggplot은 파이썬에서 데이터 시각화를 위한 강력한 패키지입니다. 이를 활용하면 인프라그래픽을 쉽게 제작할 수 있습니다.

데이터 준비

먼저 필요한 데이터를 준비해야 합니다. 인프라그래픽을 제작하기 위해서는 적절한 데이터가 필요합니다. 예를 들어, 서버의 CPU 사용률, 메모리 사용률, 디스크 용량 등을 수집하고 이를 데이터로 활용할 수 있습니다.

import pandas as pd

# 데이터 불러오기
data = pd.read_csv("infra_data.csv")

그래프 생성

다음으로 ggplot을 활용하여 그래프를 생성합니다. ggplot은 R의 ggplot2 패키지에서 영감을 받아 만들어진 패키지로, 매우 다양한 그래프를 제작할 수 있습니다.

from plotnine import *

# 그래프 생성
graph = (ggplot(data)
         + aes(x='datetime', y='cpu_usage')
         + geom_line()
         + theme_light()
         + labs(title="CPU Usage", x="Date", y="Usage (%)"))

# 그래프 출력
print(graph)

그래프 디자인

ggplot을 활용하면 그래프의 디자인을 자유롭게 설정할 수 있습니다. 예를 들어, 테마를 변경하거나 색상을 지정할 수 있습니다.

# 그래프 디자인 설정
graph = (graph
         + theme(axis_text_x=element_text(angle=45), 
                 plot_title=element_text(size=20, face="bold"),
                 legend_key=element_blank(),
                 panel_grid_major=element_blank(),
                 panel_grid_minor=element_blank())
         + scale_color_manual(values=["#FF0000", "#00FF00", "#0000FF"]))

# 그래프 출력
print(graph)

그래프 저장

그래프를 생성했다면, 이를 이미지 파일로 저장할 수도 있습니다. 다양한 형식으로 저장할 수 있으며, 예를 들어 PNG 파일로 저장하는 방법은 다음과 같습니다.

# 그래프 저장
graph.save("cpu_usage.png", height=6, width=8, dpi=300)

결론

이처럼 ggplot을 활용하면 파이썬을 사용하여 인프라그래픽을 제작하는 것이 가능합니다. 데이터를 준비하고 그래프를 생성하며, 그래프를 디자인하고 저장하는 과정을 숙지하면 다양한 인프라 정보를 시각화할 수 있습니다.