마케팅 전략상 유용한 결과가 나온 경우
ex) 주말을 위해, 목요일 소매점에 기저귀를 사러 온 아빠들은 맥주도 함께 구매 -> 주말에 football을 보면서 마심
기존의 마케팅 전략에 의해 연관성이 높게 나온 경우
ex) 정비 계약을 맺은 소비자들은 많은 설비를 구매 -> 정비 계약은 대개의 경우 따로 맺어지는 것이 아니라, 많은 설비 구입시 함께 제시
의미를 발견하기 위해 많은 고민이 필요한 경우
ex) 새로 철물점을 개업하면, 대개 화장실 문고리를 많이 구매 -> 어떤 의미가 있는지 고민 필요
빈발(frequent) 항목 집합들에 기초하여 후보 규칙들의 집합 결정
단일 항목 집합, 2개 항목집합, 3개 항목집합
통계적 유의성 ( statistic significance)
전체적인 거래 규모에 대한 값
값이 클수록 자주 발생하는 거래 ( 한 항목 거래 건수 / 총 항목 거래 건수)
지지도에 의해 결정
대표 알고리즘 : apriori 알고리즘
-> A와 B가 동시에 장바구니에 담길 확률 = support
규칙의 불확실성을 평가하기 위해서 신뢰도 사용
연관 규칙의 강도 ( rule strength )
선행항목 A를 포함하는 거래 중에서 후행항목 B가 포함된 거래의 비율
A를 구매한 경우, 이 중에서 얼마나 항목 B를 구매할 것인지를 의미
값이 클수록 A 구매시 B 구매율이 높음
최소 기준 신뢰도 값을 설정
-> A가 구매됬을 때 B를 구매하면 어떤 연관성이 있을까 = confidence
상대적 관련성은 실제 거래 발생 확률을 각 아이템의 거래가 독립적일 경우에 비해 그 거래가 동시에 발생할 예상기대확률로 나눈것
항목 B가 임의로 구매될 확률에 비해 항목 A를 구매한 후에 항목 B를 구매할 확률의 비율
항목 A와 B의 구매 패턴이 독립적인지, 서로 상관성이 있는지 파악
향상도 > 1
향상도 : 임의로 조합된 규칙과의 비교를 통해 해당 규칙이 얼마나 실제적인 연관성을 가지고 있는지 파악
Lift (A=>B) = c (A=>B) / s (A=>B)
= 항목 A가 구매된 이후 항목 B가 구매될 확률 / 항목 B가 구매될 확률
Lift | 의미 | 예 |
---|---|---|
<1 | 두 품목이 서로 음의 상관관계 | 지사제와 변비약 |
1 | 두 품목이 서로 독립적인 관계 | 과자와 후추 |
>1 | 두 품목이 서로 양의 상관관계 | 빵과 버터 |
연관규칙
{맥주 -> 콜라} : 지지도 = 50 , 신뢰도 = 1.00 향상도 1.50
지지도 : 맥주와 콜라를 동시에 구매한 사람은 전체 구매 중 절반이다. (50%)
신뢰도 : 맥주를 구매한 사람들은 모두 콜라도 같이 구매한다.(100%)
향상도 : 맥주 구매 시 콜라를 구매하게 될 가능성은 그냥 콜라를 구매할 때보다 1.5배나 높아진다.