Ch 06-2. Rule-based 협업필터링(feat. Association Rule)

Yeonghyeon·2022년 7월 28일

Association Rule Rule-based 모델기반 추천시스템

Ch 06. Model-based Collaborative Filtering

상호 연관관계

모델기반 협업필터링 feat. Association Rule

Association Rule Mining

1. Support

2. Confidence

3. Lift

Recommender System

목록 보기

14/33

본 포스팅은 Fastcampus 강의를 수강하며 일부 내용을 정리한 글임을 밝힙니다. 보다 자세한 내용은 아래 강의를 통해 확인해주세요.
참고 : Fastcampus 딥러닝을 활용한 추천시스템 구현 올인원 패키지 Online

Ch 06. Model-based Collaborative Filtering

모델 스스로 룰(패턴)을 배우느냐 아니면 사람이 직접 룰을 만들어주는 것의 차이일 뿐, 룰도 모델의 일종이라고 생각해볼 수 있다.

상호 연관관계

위 데이터 속에서 상호 연관관계 찾을 수 있음
- 여러 같이 등장한 아이템들을 보고 서로 연관관계가 있지 않을까 찾아볼 수 있다
- 구매목록: {우유, 샌드위치}, {아메리카노, 초콜렛}
- 영화 시청목록: {마이너리티 리포트, 미션임파서블}
상호 연관관계를 바탕으로 특정 룰을 만들고, 그 룰을 바탕으로 새로운 유저가 A 아이템을 구매했다면 A와 상호 연관관계인 B 아이템을 추천 가능

모델기반 협업필터링 feat. Association Rule

데이터의 모델
- 데이터의 관계, 접근과 흐름 파악을 위한 추상화된 모형
- 데이터 구조 결정
데이터의 여러 특징 파악해서 모형화 ➡️ 모델링
- 데이터 간의 연관 법칙을 찾는 data mining 기법 중 하나
기존 데이터를 기반으로 Association Rule(연관 규칙)을 만듦

Association Rule Mining

1. 정의

Minimum Support와 Minimum Confidence 값을 넘는 Rule 찾는 과정
데이터에서 흥미로운 관계 찾는 Rule-based machine learning 기법 중 하나
특정 measure 통해 interestingness를 평가 ➡️ Rules 중에서도 Strong Rules 찾는 과정

2. Association Rule의 Support(지지도)

데이터 관계 설정을 위해 아이템이 동시에 발생할 확률
전체 데이터 중 규칙 (A, B)를 포함하는 데이터 비율 (즉, 규칙 (A,B)가 몇 번 등장하는지 보자)

3. Association Rule의 Confidence(신뢰도)

특정 아이템 A가 선택된 상태에서 다른 아이템 B를 선택할 확률(다른 아이템 C, D 등이 아닌)
(A, B)의 관계를 가정하고, A를 선택한 사람이 B를 선택한 비율

4. Association Rule의 Lift(향상도)

(A, B)의 관계를 직접적으로 나타내는 measurement
1보다 큼: 이어서 B를 선택할 확률이 높음
1보다 작음: 확률이 높지 않음

1. Support

$support(A→B)=\frac{\#of(A\cap B)}{\# of data(rows)}$

0과 1 사이의 값
1에 가까울수록 A와 B 관계가 중요
0에 가까운 연관관계 먼저 제거 ➡️ 자주 발생하지 않는다는 것
중요한 단점: $support(A→B)$ 와 $support(B→A)$ 의 차이점 파악 불가능
- A와 B가 함께 등장하는 것을 카운트하는 것이기때문에 A➡️B인지 B➡️A인지가 중요한 것이 아니라 그 둘이 얼마나 같이 등장하는 것인지가 더 중요
  - 그래서 등장한 것이 Confidence

2. Confidence

$confidence(A→B)=\frac{\#of(A\cap B)}{\# of A}$

0과 1사이의 값
A를 선택했을 때 B를 선택할 확률 (반대로 B를 선택했을 때 A를 선택할 확률은 달라질 수 있는 것!)
1에 가까울수록 A는 B에 많은 영향 받음 ➡️ minimum support 중 가장 큰 confidence 선택
confidence 값이 크면 중요한 연관관계라는 것
$support(A→B)$ 와 $support(B→A)$ 와 다르게 A와 B 사이의 관계 파악 가능

3. Lift

$lift(A→B)=\frac{confidence(A→B)}{support(B)}=\frac{\#of(A\cap B)}{\# of A}$

0과 1사이의 확률값이 아닌 A와 B 사이의 관계 파악 용도로 사용됨
$lift(A→B)<1$ : 상호대체 ➡️ A와 B는 반비례
$lift(A→B)>1$ : 상호보완 ➡️ A와 B는 정비례
$lift(A→B)=1$ : 독립 ➡️ A와 B는 서로에게 영향 끼치지 않음

Ch 06-2. Rule-based 협업필터링(feat. Association Rule)

Recommender System

Ch 06. Model-based Collaborative Filtering

상호 연관관계

모델기반 협업필터링 feat. Association Rule

Association Rule Mining

1. 정의

2. Association Rule의 Support(지지도)

3. Association Rule의 Confidence(신뢰도)

4. Association Rule의 Lift(향상도)

1. Support

2. Confidence

3. Lift

More on Association Rule Mining

Ch 06-1. 이웃기반 vs. 모델기반 협업필터링

Ch 06-3. Latent Factor Model, Matrix Factorization

0개의 댓글