[python] 파이썬을 이용한 연관 규칙 분석

연관 규칙 분석은 항목 간의 연관성을 파악하여 어떤 상품이나 서비스가 함께 구매되는지 또는 이용되는지를 분석하는 데이터 마이닝의 한 방법입니다. 이것은 소매업체나 이커머스 플랫폼에서 상품 조합을 최적화하고, 광고 타겟을 설정하는 데 도움이 됩니다.

연관 규칙 분석의 핵심

데이터 집합에서의 연관 규칙은 “만약 A가 발생하면 B도 발생한다” 또는 “A를 가지고 있는 경우 B를 가질 가능성이 높다”와 같은 형태로 표현됩니다. 이를 통해 얼마나 강력한 연관성을 갖는지, 어떤 조건에서 이 규칙이 발생하는지 등을 알 수 있습니다.

파이썬을 이용한 연관 규칙 분석

파이썬에는 연관 규칙 분석을 위한 여러 라이브러리가 있습니다. 가장 대표적인 예는 mlxtendapriori 알고리즘입니다. 이 알고리즘은 데이터에서 연관규칙을 찾아내는 데 사용됩니다.

from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
import pandas as pd

# 데이터셋 로드
data = {'제품1': [1, 0, 1, 1, 0], '제품2': [0, 1, 1, 1, 1], '제품3': [1, 1, 0, 1, 0], '제품4': [1, 1, 0, 0, 0], '제품5': [0, 1, 1, 0, 0]}
df = pd.DataFrame(data, columns=['제품1', '제품2', '제품3', '제품4', '제품5'])

# 연관성 분석
frequent_itemsets = apriori(df, min_support=0.6, use_colnames=True)
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1.2)
print(rules)

위 코드 예제에서는 mlxtend를 사용하여 데이터셋으로부터 연관 규칙을 분석하는 과정을 보여줍니다.

연관 규칙 분석은 상품 추천 시스템, 광고 타겟 설정, 재고 관리 등 다양한 분야에서 응용되고 있으며, 파이썬을 통해 간편하게 구현할 수 있습니다.

요약

연관 규칙 분석은 항목 간의 연관성을 파악하는 데 사용되며, 파이썬의 mlxtend 라이브러리를 이용하여 쉽게 구현할 수 있습니다. 이를 통해 상품 추천 시스템이나 광고 타겟 설정 등에 활용할 수 있습니다.

참고문헌: