[R언어] R을 사용한 연관 규칙 학습

26 Dec 2023

R언어

본 포스트에서는 R을 사용하여 연관 규칙 학습을 수행하는 방법에 대해 알아보겠습니다. 연관 규칙 학습은 항목 간의 연관성을 발견하고 이를 통해 유용한 패턴을 찾는 데이터 마이닝의 기술입니다. R은 이를 위해 다양한 패키지와 기능을 제공하고 있습니다.

1. 연관 규칙 학습이란?

연관 규칙 학습은 대용량 데이터에서 규칙을 찾아내는 데 사용됩니다. 예를 들어, 소비자 구매 기록에서 특정 상품을 함께 구매하는 경향을 발견하거나 의료 기록에서 특정 증상이 특정 질병과 연관되어 있는지를 파악하는 데 활용될 수 있습니다.

2. 연관 규칙 학습을 위한 R 패키지

R에서는 연관 규칙 학습을 위한 여러 패키지를 제공하고 있습니다. 그 중에서도 가장 널리 사용되는 패키지로는 arules와 arulesViz가 있습니다.

install.packages("arules")
install.packages("arulesViz")

3. 연관 규칙 학습 예제

다음은 임의의 거래 데이터를 사용하여 연관 규칙을 학습하는 간단한 예제 코드입니다.

library(arules)
transactions <- read.transactions("transaction_data.csv", format = "single", sep = ",")
rules <- apriori(transactions, parameter = list(support = 0.1, confidence = 0.5))
inspect(rules)

위 코드에서는 먼저 arules 패키지를 불러오고, 거래 데이터를 읽어들인 뒤 apriori 함수를 사용하여 연관 규칙을 학습합니다. 이후 inspect 함수를 통해 학습된 규칙들을 확인할 수 있습니다.

4. 시각화

arulesViz 패키지를 사용하여 학습된 연관 규칙을 시각화할 수도 있습니다.

library(arulesViz)
plot(rules, method = "graph")

위 코드는 학습된 연관 규칙을 그래프로 시각화하는 예제입니다.

연관 규칙 학습은 데이터 분석과 패턴 발견에 유용한 기술이며, R을 사용하여 손쉽게 수행할 수 있습니다.

위에서 제공한 내용은 다음 자료를 참고하여 작성되었습니다.

Hahsler, M., Chelluboina, S., & Buchta, C. (2019). arules: Mining Association Rules and Frequent Itemsets. R package version 1.6-6.

감사합니다.