nvida는 어떤 일을 하는 회사일까요?
-> 그래픽카드제조사
그래픽 카드로 할 수 있는일?
-> gpu 코어 연산, 게임
구매한다 /안 안한다 <= 있으면 지도학습, 없으면 비지도 학습
정답 == label == target
Nan 혹은 Null 이면 정답이 없는 것
회귀 알고리즘 중에 분류에 사용할 수 있는 알고리즘?
-> 로지스틱회귀
fit 은 어떤 의미일까요?
-> 학습
predict?
-> 예측
evaluate?
-> 평가
머신러닝 과정
-> fit => predict => evaluate
DecisionTreeClassifier()
수치 자료와 범주 자료 모두에 적용할 수 있다. 영문약자
-> 분류 및 회귀 트리(Classification And Regression Tree, CART)
왜 이 트리가 오버피팅 == 과대적합 == 과적합 일까요?
-> 학습하지 않아도 되는 부분까지 학습해서 쓸게없는 부분까지 학습하게 되는게 과적합
지니불순도 : 클래스에 다른 값이 얼마나 섞여있는지
엔트로피 : 정보획득량,
정확도(Accuracy) 측정하기
학습을 적게해서 점수가 낮게 나오는 것을 무엇이라고 할까요?
-> 과소적합, 언더피팅
수치형 변수를 그대로 안 쓰고 범주형 변수로 만들어 주었을까요?
-> 머신러닝 알고리즘에 힌트를 줄수도 있고 오버피팅을 방지할 수도 있습니다.