멋쟁이 사자처럼 AI 스쿨 TIL-21

김영민·2022년 10월 25일
0

nvida는 어떤 일을 하는 회사일까요?
-> 그래픽카드제조사

그래픽 카드로 할 수 있는일?
-> gpu 코어 연산, 게임

구매한다 /안 안한다 <= 있으면 지도학습, 없으면 비지도 학습
정답 == label == target
Nan 혹은 Null 이면 정답이 없는 것

회귀 알고리즘 중에 분류에 사용할 수 있는 알고리즘?
-> 로지스틱회귀

fit 은 어떤 의미일까요?
-> 학습

predict?
-> 예측

evaluate?
-> 평가

머신러닝 과정
-> fit => predict => evaluate

DecisionTreeClassifier()

  • criterion: 가지의 분할의 품질을 측정하는 기능입니다.
  • max_depth: 트리의 최대 깊이입니다.
  • min_samples_split:내부 노드를 분할하는 데 필요한 최소 샘플 수입니다.
  • min_samples_leaf: 리프 노드에 있어야 하는 최소 샘플 수입니다.
  • max_leaf_nodes: 리프 노드 숫자의 제한치입니다.
  • random_state: 추정기의 무작위성을 제어합니다. 실행했을 때 같은 결과가 나오도록 합니다.

plot_tree 를 통해 시각화 합니다.

max_depth 깊이를 어디까지 제한해서 시각화할지

feature_name 를 지정하지 않으면 X[1], X[2] 처럼 피처이름을 확인하기 어려움

filled = 클래스 별로 색상을 구분

수치 자료와 범주 자료 모두에 적용할 수 있다. 영문약자
-> 분류 및 회귀 트리(Classification And Regression Tree, CART)

왜 이 트리가 오버피팅 == 과대적합 == 과적합 일까요?

-> 학습하지 않아도 되는 부분까지 학습해서 쓸게없는 부분까지 학습하게 되는게 과적합

지니불순도 : 클래스에 다른 값이 얼마나 섞여있는지
엔트로피 : 정보획득량,

정확도(Accuracy) 측정하기

  • 모델이 얼마나 잘 예측했는지 측정

학습을 적게해서 점수가 낮게 나오는 것을 무엇이라고 할까요?
-> 과소적합, 언더피팅

수치형 변수를 그대로 안 쓰고 범주형 변수로 만들어 주었을까요?
-> 머신러닝 알고리즘에 힌트를 줄수도 있고 오버피팅을 방지할 수도 있습니다.

profile
배운걸 다 흡수하는 제로민

0개의 댓글