Logistic Regression
→ 전통적으로 CTR에서 가장 간단하면서 강력한 성능을 내는 모델입니다. 그러나 가중치를 이용하 Feature 간 결합(Interaction, Conjunction)을 설명하는 데 있어서 적합하지 않다는 단점을 가지고 있습니다.
추천시스템에선 feature interaction을 학습하는 것이 중요합니다.
- ex)
- 식사 시간(1)에 배달 앱 다운로드 수(2) 증가 → order-2 interaction
- 10대(1) 남성(2)은 슈팅/RPG(3) 게임을 선호 → order-3 interaction
Factorization Machine (DeepFM)
LightGBM
→ 현재(2021년 9월) 번개장터의 Click Prediction에 활용 중인 알고리즘입니다.(성능과 비용을 동시에 만족시킨 알고리즘이었다고 합니다.)
Click(CTR) Prediction은 데이터 불균형 문제로 인해 정확도(Accuracy)나 재현율(Recall)과 같은 평가 지표를 사용하기가 어려울 수 있습니다.
주로 논문들을 보면 AUC(Area Under ROC)와 RIG(Relative Information Gain)를 평가 지표로 사용하고 있습니다.
RIG: 베이스 Log Loss(Entropy)를 기반으로 상대적 이득을 측정하는 방법입니다.