내 질문을 머신러닝의 문제로 가장 잘 기술하는 방법을 찾기 위한 사전 조사
질문: 나이와 성별에 따라 선호하는 주제 추천
이 중 크게 본다면
사용자가 선호하는 아이템의 콘텐츠를 직접 분석하여 아이템과 아이템 혹은 아이템과 사용자 선호도간 유사성을 분석하여 이를 토대로 고객에게 아이템을 추천해주는 방식
접근방식
독립적 정보 활용
추천하고자 하는 고객의 독립적인 정보만을 필요
-> 사용자의 정보가 존재하지 않는다면 콘텐츠기반 접근방식 추천 시스템을 구현하는 것이 불가능
새로운 아이템
아이템의 속성으로 카테고리로 분류
사용자가 선호하는 아이템 속성과 유사도가 높은 카테고리의 아이템들이 사용자에게 추천
과도한 특수화 Over Specialization
콘텐츠 기반 필터링은 추천상품의 다양성을 보장할 수 없음
‘특정 아이템에 대해 선호도가 유사한 고객들은 다른 아이템에 대해서도 비슷한 선호도를 보일 것’이라는 기본 가정을 바탕으로 사용자 혹은 아이템간 유사도를 기반으로 선호도를 예측하는 방법
특징
데이터의 희소성
사회연결망 기법
존 고객들 간 유사도를 기반으로 네트워크를 생성한 뒤, 중심성이 높은 사 용자들을 새로운 고객의 이웃으로 정하고, 그들이 선택한 아이 템을 새로운 고객에게 추천
확장성
사용자가 늘어나고 데이터 셋의 크기가 커질수록 계산량이 많아질 뿐만 아니라 예측력의 정확도 저하
Grey sheep
당신의 시간이 헛되지 않는 글이 되겠습니다.
I'll write something that won't waste your time.