5-1. 크리에이터 및 콘텐츠 소개
모듈 전체 학습 내용
총 5개 노드
-
Node 05. 딥러닝과 추천 시스템: 배경과 개요
- 딥러닝의 시대와 추천 시스템
- 딥러닝 추천 시스템 적용 사례
- 추천 시스템은 딥러닝 알고리즘만 중요할까요?
-
Node 06. 다양한 딥러닝 기반 추천 시스템: 특징과 목표
- 협업 필터링의 발전
- Shallow 영역과 Deep 영역
- 어텐션을 활용한 추천 시스템
- 다양한 딥러닝 기반 추천 시스템
-
Node 07. 추천 시스템을 설계할 때 겪을 수 있는 문제들
- 추천 시스템을 구축하기 전에
- 추천 시스템을 괴롭히는 문제
- 추천 시스템 구축과 적용 후
- 추천 시스템 개발자
-
Node 08. 추천 시스템, 모델 톺아보기: 논문과 코드
- 추천 시스템 논문을 학습하기 전에
- NCF
- DeepFM
- AutoInt
- HAFP
-
Node 09. 나만의 딥러닝 기반 추천 시스템 구축하기 [프로젝트]
- 데이터 분석하기
- 데이터 전처리
- AutoInt 모델 구현 및 학습
- 스트림릿을 사용한 시각화
- 프로젝트: AutoInt+ 모델 구현 및 시각화
5-2. 들어가며
Node 05 학습 내용
-
딥러닝과 추천 시스템
- 추천 시스템의 중요성
- 딥러닝의 시대와 추천 시스템
-
딥러닝과 추천 시스템 적용 사례
-
추천 시스템은 딥러닝 알고리즘만 중요할까요?
- 평가
- 서비스 및 시스템
- UI/UX
- 모니터링
- 개인화
Node 05 학습 목표
- 추천 시스템에 딥러닝이 적용된 배경에 대한 파악
- 실제 사례를 통한 use case 이해 및 벤치마킹
- 추천 시스템 구축에서 알고리즘 이외의 중요 요소 파악
5-3. 딥러닝과 추천 시스템
1. 추천 시스템의 중요성
추천 시스템은 산업 전반에 사용되고 있으며 친숙한 기술임!
- 추천 시스템이 중요한 이유
- 논문에서도 알 수 있듯 "추천 시스템이 중요하다"라는 메시지를 공통적으로 전달하고 있음
- 추천 시스템
- 크게 콘텐츠 기반 필터링, 협업 필터링 존재
- 그러나, 실제 사용자가 단순하게 행동한다는 전제가 있어야 하는 방법론이기 때문에 한계가 있음
- 또한 텍스트, 이미지, 소리, 영상 등의 비정형 데이터에 대한 활용이 부족함
딥러닝 기반 추천 시스템이 대두되는 이유!
2. 딥러닝과 추천 시스템
- 활용되는 기술
- RNN, Autoencoder, Graph, CNN, MLP, Attention...
장점
-
복잡한 데이터의 처리
- 다양한 구매 패턴, 선호도 분석, 이력이 복잡한 경우를 포함하여 많은 데이터들을 처리 및 분석 ➡️ 정확한 추천
-
Feature Learning(특징 학습)
- *고차원적인 입력 데이터에서 사용자 행동 식별 및 패턴 학습
- 입력 특징들 간의 관계 학습 가능
- *고차원: 특징 혹은 속성이 많은 데이터
-
희소 데이터 처리
- 입력 데이터는 대부분 희소 형태 ➡️ 희소 데이터의 관계 역시 효율적인 학습 가능
-
확장성 & 효율성
- 데이터 양, 사용자 히스토리 증가 등의 이유가 발생해도 ➡️ 효율적으로 확장
영향
-
정확도 향상
- 복잡한 패턴을 잘 모델링 ➡️ 추천 정확도가 올라감
-
개인화 향상
- 데이터가 희소해도 ➡️ 사용자 패턴을 모델링할 수 있음
- 개인화 능력이 향상되는 것
-
다양성 향상
-
콜드 스타트 방지(성능 향상)
5-4. 딥러닝 추천 시스템 적용 사례
Youtube
가장 유명한 논문: Deep Neural Networks for YouTube Recommendations
- 추천 시스템을 구성하는 방법에 대한 내용이 작성되어 있음
- 2개의 스테이지로 구성
- Input Feature를 다양하게 활용, 관계성까지 고려


On YouTube’s recommendation system
- 추천 시스템의 최초 배포, 시청 시간 측정, 평가 중요성까지의 내용이 작성되어 있음

Youtube의 사용자 데이터 사용
- 시청 시간
- 좋아요, 싫어요
- 클릭 이력
- 검색 이력
- 공유 이력...
Netflix
Deep Learning for Recommender Systems: A Netflix Case Study
- 2021년 소개된 논문
- 어려움
- 기존 협업필터링 등의 방법론으로 잘 튜닝할 경우 성능이 꽤 잘 나오는 편
- 그럼에도 딥러닝을 사용한 이유
- 다른 feature 및 information 결합 시 딥러닝의 강점이 확실하게 나왔기 때문
- 이러한 연구와 발전들이 넷플릭스 비즈니스에도 영향을 크게 미침


- 다양한 실험
- 딥러닝, 다른 방법론들... ➡️ 무조건적으로 우수한 방법은 없음을 알게 됨
- 넷플릭스가 다양한 섹션에 대한 특징에 맞게 다양하게 학습 모델을 활용하게 된 이유!


- 가장 강조하는 부분
- 딥러닝 모델은 데이터의 다양성과 양이 보장될 때 더 빛을 발함!

국내 사례
쿠팡 추천 시스템 2년간의 변천사 (상품추천에서 실시간 개인화로)
- 쿠팡에서 2년간 겪은 추천 시스템 개발 시행착오 기록
- 추천 시스템에서의 모델 및 서비스
- serving time
- 필터, 부스팅
- 인덱싱 처리..



추천시스템 3.0: 딥러닝 후기시대에서 바이어스, 그래프, 그리고 인과관계의 중요성
- 바이어스, 그래프, 인과관계에 따른 추천 시스템의 발전 사항 소개
- 추천 시스템의 발전 형태
- 편향 데이터를 다루는 방법
- 추천 시스템 모니터링
- 아이템 추천을 위한 GNN
- 온,오프라인 성능 싱크를 맞추는 방법


유저가 좋은 작품(웹툰)를 만났을 때(유저의 탐색, 발견 그리고 만족도에 대하여 탐색적 분석하기)
- 카카오 픽코마 웹툰 추천 시스템
- 추천 시스템 목적 및 목표
- 픽코마 웹툰 추천 시스템 개요
- 사용자의 만족도를 끌어올릴 수 있는 방법에 대한 고찰
- 다양한 사용자 분석
그 외 자료들
5-5. 추천 시스템은 딥러닝 알고리즘만 중요할까요?
평가
매칭 기반 평가(Top K)
-
Precision@K
- 추천 시스템이 추천한 아이템 k개 중 실제 사용자가 관심있어 하는 아이템의 비율
- 수치가 높을수록 좋음
-
Recall@K
- 사용자가 관심있어 하는 아이템 중 추천 시스템이 추천한 아이템이 얼마나 포함되는지
- 수치가 높을수록 좋음
-
Hit Rate@K
- 추천 시스템이 추천한 아이템 k개 중 사용자가 관심있어 하는 아이템이 1개라도 있다면 히트
- 수치가 높을수록 좋음
위치 기반 평가(랭킹 기반 평가)
MAP(Mean Average Precision)
- 관련 있는 Average Precision의 평균
- 수치가 높을수록 좋음
NDCG(Normalized Discounted Cumulative Gain
- 이상적인 추천과 비교해 랭킹 기반 추천이 잘 이뤄졌는지 평가
- 수치가 높을수록 좋음
모델 전체 성능
서비스 및 시스템
- 전에 언급한 쿠팡 사례에서, 서비스와 시스템 관점도 생각해야 함을 알 수 있음


UI/UX
모니터링
- 모델 및 비즈니스적 관점에서 지속적으로 모니터링을 해야만 한다는 것

개인화 방법
- 썸네일 개인화

- 메시지 개인화
