이번 포스트에서는 파이썬과 Kibana를 활용하여 공항 데이터를 분석하고 시각화하는 방법에 대해 알아보겠습니다. Kibana는 Elastic Stack의 하나로서 데이터 시각화 및 탐색 도구로 널리 사용되고 있습니다.
필수 요구사항
- Elasticsearch와 Kibana가 설치되어 있어야 합니다. Elasticsearch는 데이터를 저장할 수 있는 분산 검색 및 분석 엔진이며, Kibana는 Elasticsearch 데이터를 시각화하고 관리하는 데 사용됩니다.
- Python 3.x 버전이 설치되어 있어야 합니다.
- Elasticsearch와 Kibana에 접근할 수 있는 URL과 인증 정보가 있어야 합니다.
데이터 수집 및 Elasticsearch로 적재
먼저, 공항 데이터를 수집하여 Elasticsearch에 적재해야 합니다. 관련 데이터를 CSV 파일로 가지고 있는 경우, pandas 라이브러리를 사용하여 데이터를 처리하고 Elasticsearch로 적재할 수 있습니다. 다음은 예제 코드입니다.
import pandas as pd
from elasticsearch import Elasticsearch
# 공항 데이터 파일 경로
csv_file = 'airport_data.csv'
# 데이터 프레임으로 데이터 읽어오기
df = pd.read_csv(csv_file)
# Elasticsearch 클라이언트 생성
es = Elasticsearch('elasticsearch_url')
# 데이터 프레임을 Elasticsearch로 적재
for index, row in df.iterrows():
es.index(index='airport_data', body=row.to_dict())
위의 코드에서 csv_file
변수에는 CSV 파일의 경로를 지정해야 합니다. 그리고 elasticsearch_url
을 Elasticsearch가 실행되고 있는 URL로 변경해야 합니다. 데이터를 적재할 때, 데이터프레임을 이용하여 각 행을 Elasticsearch에 색인합니다.
Kibana에서 데이터 시각화
데이터가 Elasticsearch에 적재되었으므로 이제 Kibana를 사용하여 데이터를 시각화할 수 있습니다. 브라우저에서 Kibana에 접속하고, 인덱스 패턴을 생성하여 데이터를 시각화할 준비를 하겠습니다.
- Kibana 대시보드에서 “Management” 섹션으로 이동하고 “Index Patterns”을 선택합니다.
- “Create index pattern” 버튼을 클릭하고, Elasticsearch에 적재한 인덱스 이름을 입력합니다. 예를 들어, “airport_data”로 입력합니다.
- 필드를 구성하기 위해 “Next step”을 클릭합니다.
- 시간 필드를 선택하고 “Create index pattern”을 클릭하여 인덱스 패턴을 생성합니다.
이제 데이터를 시각화할 수 있는 준비가 완료되었습니다. Kibana 대시보드에서 원하는 시각화 작업을 수행할 수 있습니다. 예를 들어, 막대 그래프, 선 그래프, 원 그래프 등을 사용하여 데이터를 시각화할 수 있습니다.
마무리
이번 포스트에서는 파이썬과 Kibana를 활용하여 공항 데이터를 분석하고 시각화하는 방법에 대해 알아보았습니다. Elasticsearch에 데이터를 적재한 후, Kibana를 사용하여 데이터 시각화를 수행할 수 있습니다.
더 많은 Kibana 기능과 Elasticsearch의 데이터 분석 기능을 탐색해 보시기 바랍니다. #파이썬 #데이터시각화