파이썬을 사용한 Solr 검색 결과를 시각화하는 방법

13 Nov 2023

solr

Solr은 대규모 데이터 집합에서 빠르고 정확한 검색을 제공하는 강력한 검색 플랫폼입니다. 데이터를 검색하고 결과를 시각화하는 것은 데이터 분석의 중요한 부분입니다. 이번 블로그에서는 파이썬을 사용하여 Solr에서 검색 결과를 시각화하는 방법에 대해 알아보겠습니다.

필요한 라이브러리 설치

먼저, 파이썬에서 Solr 결과를 시각화하기 위해 필요한 라이브러리를 설치해야 합니다. pandas, matplotlib 및 requests 라이브러리가 필요합니다. 아래 명령을 사용하여 설치해주세요.

pip install pandas matplotlib requests

Solr에서 검색 결과 가져오기

Solr에서 검색 결과를 가져오기 위해 requests 라이브러리를 사용합니다. 아래의 코드는 Solr 서버로부터 JSON 형식의 검색 결과를 가져오는 간단한 예제입니다.

import requests

def search_solr(query):
    url = 'http://solr-server:8983/solr/collection/select?q=' + query
    response = requests.get(url)
    results = response.json()
    return results['response']['docs']

위의 코드에서 url 변수는 Solr 서버의 URL을 나타내며, response 변수는 요청을 보내고 응답을 받는 역할을 합니다. results 변수에는 JSON 형식의 검색 결과가 저장됩니다. 이제 이 코드를 사용하여 Solr에서 검색 결과를 가져올 수 있습니다.

데이터 시각화

검색 결과를 시각화하기 위해 pandas와 matplotlib 라이브러리를 사용할 수 있습니다. 아래 예제는 검색 결과에서 특정 필드의 값을 추출하고 막대 그래프로 시각화하는 코드입니다.

import pandas as pd
import matplotlib.pyplot as plt

def visualize_results(results, field):
    data = []
    for doc in results:
        data.append(doc[field])
        
    df = pd.DataFrame(data, columns=[field])
    
    plt.figure(figsize=(10, 6))
    plt.bar(df[field].unique(), df[field].value_counts())
    plt.xlabel(field)
    plt.ylabel('Count')
    plt.title('Results Visualization')
    plt.show()

위의 코드에서 results는 Solr에서 가져온 검색 결과가 저장된 리스트입니다. field 변수는 시각화할 필드의 이름을 나타냅니다. 필드의 값을 추출하여 data 리스트에 저장하고, 이를 pandas의 DataFrame으로 변환합니다. 그 후, matplotlib을 사용하여 막대 그래프로 시각화합니다.

예제 사용하기

앞서 정의한 함수를 사용하여 Solr에서 검색 결과를 가져오고 시각화할 수 있습니다. 아래 예제는 title 필드를 기준으로 Solr에서 검색한 결과를 시각화하는 코드입니다.

results = search_solr('keyword')
visualize_results(results, 'title')

위의 코드에서 keyword를 원하는 검색어로 바꿔주세요. 원하는 필드를 시각화하려면 visualize_results 함수의 field 매개변수를 수정하세요.

결론

이번 포스트에서는 파이썬을 사용하여 Solr에서 검색 결과를 시각화하는 방법을 살펴보았습니다. Solr에서 검색한 결과를 가져오고 pandas와 matplotlib 라이브러리를 사용하여 데이터를 시각화할 수 있습니다. 이를 통해 더 효과적인 데이터 분석과 시각화를 수행할 수 있습니다.