머신러닝의 분류 지도학습 명확한 결정값이 주어진 데이터를 학습하는 것 분류, 회귀, 시각/음성 감지/인지 비지도 학습 군집화(클러스터링) 차원 축소 머신러닝 알고리즘 기호주의-결정트리 등.. 규칙 연결주의-신경망/딥러닝 유전 알고리즘 베이지안 통계 유추주의-KNN, 서포트 벡터 머신 머신러닝 단점 데이터에 의존적이라서 편향된 데이터만 사용...
numpy 함수 정리
구성요소 DataFrame column, row로 구성되는 2차원의 데이터셋 Series 1개의 컬럼값으로 구성된 1차원의 데이터 셋 read_csv() csv를 읽어온다. sep을 이용해 delimiter설정 가능. default = ',' head() 앞줄만 보기 titanicTrain.head(3) dictionary to DataFrame ...
머신러닝 용어 정리
Estimator 학습: fit() 예측: predict() Classifier(분류) 분류 구현 클래스 DecisionTreeClassifier RandomForestClassifier GradientBoostingClassifier ... Regressor(회귀) 회귀 구현 클래스 LinearRegression Ridge Lasso ... 사이킷...
학습데이터를 다시 분할하여 학습 데이터와 학습된 모델의 성능을 일차 평가하는 검증 데이터로 나눈다. 검증 데이터 세트로 미리 테스트 검증 데이터 세트를 바꿔서 실제 테스트 데이터 세트에 적용하기 전에 미리 테스트 머신러닝 모델은 데이터에 굉장히 dependency가 강함 k 폴드 교차 검증 일반적인 k 폴드 Stratified K 폴드 불균형한 분포...