붓꽃 머신러닝 하기, 사이킷런
(1) 교차검증,(KFold, Stratified KFold, cross_val_score) (2) 데이터 전처리(레이블 인코딩, 원-핫 인코딩), (3) 피처 스케일링Feature Scaling(표준화/ 정교화)
타이타닉 생존자, 평가 : 정확도,오차행렬,정밀도,재현율,F1스코어,ROC AUC
피마 원주민의 Type-2 당뇨병 결과 데이터, 결정트리,
앙상블 학습(Ensemble Learning), 보팅,랜덤포레스트,
lightGBM, 베이지안 체적화, HyperOpt
캐글 신용카드 사기, p279 ,오버샘플링, SMOTE ,스태킹 앙상블
회귀, 단순선형회귀, 경사 하강법, 주택가격예측, 다항회귀, 과대& 과소 적합, 규제선형모델(릿지, 라쏘,엘라스틱), 로지스틱회귀, 회귀트리, 정리
로지스틱 회귀, 차원축소, PCA
LDA (p415), 군집화, k-평균, 평균이동, DBSCAN
p 474 실습 내용정리
텍스트 분석, 클렌징, 토큰화, 스톱워드 , stemming , Lemmatization ,Bow, 희소행렬 , 감성분석, 지도학습
감성분석 - 비지도 학습, vader, 문서유사도 ,한글텍스트 처리, 추천시스템
마지막 수업,