영문 전처리
한글 전처리
Bow, TF-IDF, Word Embedding
머신러닝
선형회귀
SVM = 초평면으로 나누는 모델
Decision Tree = 의사결정나무(비선형, 판별) 끝임없이 질문을 반복해서 최종적인 결과에 도달하는것
5줄이면 끝
EDA(탐색적 데이터 분석)와 데이터 전처리는 데이터 분석 및 모델링 과정에서 중요한 두 단계이다. 두 단계를 명확하게 구분하고 차례대로 진행하는 것이 좋다.
지도학습(데이터학습시키기)
여러 개의 분류기(Classifier)를 생성하고그 예측을 결합함으로써 보다 정확한 최종 예측을 도출하는 기법여러 개의 개별 모델을 결합하여 더 강력한 예측 모델을 구착하는 방법앙상블은 개별 모델의 약점을 보안하고 모델의 성능을 향상시키는 데 사용앙상블 기법을 사용하면
군집화란? 데이터 사이의 유사성을 통해서 같은 카테고리일 것으로 예상되는 것들을 묶어 내는 것
매우 많은 feature로 구성된 다차원 데이터 셋의 차원을 축소해 새로운 차원의 데이터로 변경하는 것
문서 분류 문서 내 정보를 바탕으로 문서의 라벨을 예측하는 작업 베이즈 정리 꼭 알아두기! 나이브 베이즈 분류기 나이브 = 간단한 / 베이즈 = 사람이름 베이즈 정리를 이용하여 텍스트 분류를 하는 방법론 확률과 통계기반 분류 모델 조건부 확률을 계산하는 방식으