[HUFSTUDY] 추천시스템

Uomnf97·2022년 6월 27일
1

+) 코드잇 강의 바로가기

본 정리내용은 코드잇 강의를 공부하며 함께 정리한 내용입니다! 더 정확하고 자세한 내용을 공부하기 위해서는 "코드잇 머신러닝 실전 강의를 참고해주세요!"

참고 : 코드잇 머신러닝 실전 강의

추천 시스템이란?

  • 추천 시스템이란 사용자가 좋아할 법한 아이템, 사이트 등을 플랫폼에서 진열해두는 것을 말합니다.
    Ex) 넷플릭스 해리포터 마법사의 돌 시청 => 다른 해리포터 시리즈 영화 추천
    Ex) 유튜브 "바퀴 달린 집" 시청 => 이용진이 나오는 여러가지 유튜브 추천
    • 예시를 통해 알 수 있듯이 의류 사이트에서는 구매했던 옷과 비슷한 옷들을 추천하고, 특정 영화를 보면 비슷한 카테고리에 있는 혹은 같은 배우가 등장한 인물을 추천해주기도 하는데 이와 같은 방식으로 하는 것은 추천 시스템이라고 함. 다양한 사이트에서 수많은 정보가 생산되는 시점에서 추천시스템은 수익에 큰 영향을 끼침.
  • 그리고 이러한 추천 시스템에서 가장 잘 활용되고 있는 것이 "AI/머신러닝 기술"이며 이 추천 시스템이 효과적으로 사용자가 관심있을 법한 주제, 아이템, 정보를 추천할 수 있도록 관련 기술이 도와줌.

추천시스템과 머신러닝

머신러닝이란? 어떤 작업을 할 때 데이터에 의해 성능이 향상되도록 하는 기법

추천시스템은 머신러닝을 이용하여 데이터들을 학습하여 사용자가 사용하지 않았던 아이템 중 가장 사용할 것 같은 데이터를 추천하게 됨.

Ex) A와 유사한 옷을 구매하는 패턴을 보이는 B,C,D가 있을 때 A에게 B,C,D가 구매한 옷들 중 A가 구매하지 않은 옷을 추천함

추천 시스템과 데이터

  • 직접데이터(explicit data) : 유저가 직접적으로 만족/선호도를 표현한 데이터로 유저 선호도를 정확하게 나타낸다는 장점이 있다.
  • 간접데이터(implicit data) : implicit data 유저가 직접적으로 표시하지않았지만 유추할 수 있는 데이터 수집하기 쉬움. 정확하지 않지만, 데이터 수집이 쉬워 많은 양의 데이터를 확보할 수 있다는 장점이 있다.
    Ex) 유튜브에 로그인을 하지 않고 시청을 해도 간접데이터를 통해 본인이 자주, 오래 봤던 영상과 유사하게 추천이 되는 것을 알 수 있음.

결론 : 적은 양의 직접데이터를 사용하여 학습하는 것보다는 많은 양의 간접 데이터를 통해 학습하는 것이 더 효과적일 수도 있다. 따라서 많은 양의 간접데이터와 직접데이터를 섞어서 학습 한다면 더욱더 효과적인 추천시트템 알고리즘을 만들 수 있다.

profile
사회적 가치를 실현하는 프로그래머

0개의 댓글