[T Academy] CH4

박상우·2022년 12월 26일
0

T 아카데미

목록 보기
4/4
post-thumbnail

협업 필터링

사용자의 패턴, 평점을 통해 다른 사람들과 비교 후 추천하는 과정

최근접 알고리즘, 잠재 알고리즘으로 나뉨

최근접 알고리즘

User Based

비슷한 사용자를 찾아 비슷한 사용자가 본 아이템을 추천하는 것

Item Based

비슷한 아이템의 평점을 찾아 추천하는 것

KNN 알고리즘

K개의 Neighbors를 통해 예측하는 것

User Based 과정

유저간의 유사도를 먼저 계산 (코사인, 피어슨)
유사한 K 명을 사용해 예측 및 계산
다만 원래 후한 평점을 주는 사람들이 많은 경우에는 유사도가 높게 나옴
이를 보정해주는 것이 필요함 (평균을 빼 Bias를 제거하는 등)

Item Based 과정

아이템간의 유사도를 먼저 계산
유사한 K 개의 아이템을 사용해 예측 및 계산
Bias를 제거하는 작업 필요

Neighborhood Based Collaborative Filtering

장점

알고리즘이 직관적이고 해석이 쉬움, 모델이 Robust함

단점

시간, 속도, 메모리가 많이 필요
애초에 인기가 많은 아이템 위주로 추천하기 때문에 신규 아이템에 대한 추천이 어려움

잠재 알고리즘

아이템, 유저 매트릭스를 유저의 Latent matrix와 아이템의 Latent matrix로 분해해 잠재 요인을 내적 하여 평점 매트릭스를 계산하는 것

이 Latent matrix들로 잠재 요인도 찾아 볼 수 있음

SGD

유저 matrix와 아이템 matrix의 내적과 평점 매트릭스 간 차이를 가장 작게 해주는 J 값을 찾는 것(gradient descent를 진행)

딥러닝 Loss Function을 모두 사용할 수 있음

ALS

두 행렬 중 하나를 고정시키고 다른 행렬을 최적화 하는 것
그 다음 다른 행렬을 고정시키고 첫 번째 행렬을 최적화 하는 것을 반복
수렴된 행렬을 찾을 수 있는 장점이 있음

ALS는 SGD보다 수렴속도가 빠르지만 Loss Squares만을 사용해야 함

협업 필터링의 장점

도메인 지식 필요 없음
사용자의 새로운 흥미 파악 가능
시작 단계 모델로 선택하기 좋음

단점

신규 아이템을 다루기 힘듬
Side Features(고객의 개인정보, 아이템 추가정보)를 포함시키기 어려움

profile
세상아 덤벼라

0개의 댓글