명시적으로 프로그래밍하지 않고도 컴퓨터에 학습할 수 있는 능력을 부여하는 학문 - Arthur Samuelex) 알파고 \- Decision Tree : 분할 기준(split criterion)정보 획득 : 발생 확률 작을수록 정보 가치 커짐정보 이득 : 어떤 속성을
\-> 범위 or 분포 같게 만들기label encoder : 문자 -> 숫자머신러닝 사용할 땐, 숫자로 되어있어야 함fit -> transformfrom sklearn.preprocessing import LabelEncoderle=LabelEncoder()le.fi
데이터 수집/가공/ 변환 -> 모델 학습/예측 -> 모델 평가 -> 데이터 수집/가공/ 변환반복모델회귀 모델 예측 결과 : 연속된 변수 값분류 모델 : 몇 가지 종류에서 값을 찾아내는 것 이진 분류 모델 : TP, FN, TN, FP(P가 1이고 N이 0이라고
과적합 : 모델이 학습 데이터에만 과도하게 최적화된 현상\-> 일반화된 데이터에서 예측 성능 과하게 떨어지는 현상지도 학습분류\- 회귀 (연속된 값으로 예측)비지도 학습군집차원 축소OLS : ordinaty linear least square잔차 평가 residue:
머신러닝X(설명변수) ,y(목표변수) 설정training set(학습 데이터 ) & Validation set(검증 데이터) 분할X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3, random_
이 에러만 계속 남;;;;구글링으로 찾아서y=y.reshape(1,-1) 로 하라고 하는데 ㄱ럼 또 dataframe오류 남처음부터 뭐가 틀렸나 다시 영상봄X=raw_data.iloc:,1:-1y=raw_data.iloc:,1:-1\-> ((284807, 29), (2
출처 : 파이썬 라이브러리를 활용한 머신러닝 - 한빛미디어1\. knn이해하기 쉬운 모델이지만 예측이 느리고 많은 특성 처리하는 능력 부족해 현업에서 잘 쓰이지 않음2\. 선형모델 : 입력 특성에 대한 선형 함수 만들어 예측 (첫 번째로 시도할 알고리즘)knn 단점 없
출처 : 파이썬 라이브러리를 활용한 머신러닝 - 한빛미디어비지도 변환 : 데이터 새롭게 표현, 다른 사람이나 다른 머신러닝 알고리즘 원래 데이터보다 쉽게 해석할 수 있도록군집 : ㄷㅔ이터 비슷한 것 그룹으로 묶음\- 데이터 전처리: 지도학습 알고리즘 적용하기 전 적용스
출처 : 파이썬 라이브러리를 활용한 머신러닝 - 한빛미디어from sklearn.datasets import make_blobsfrom sklearn.linear_model import LogisticRegressionfrom sklearn.model_selection
: 데이터 집합 내에 존재하는 각 데이터의 차이를 가장 잘 나타내 주는 요소 찾아내는 방법/데이터의 분산을 최대한 보존하면서 서로 직교하는 세 기저(축)을 찾아 고차원 공간의 표본들을 선형 연관성이 없는 저차원 공간으로 변환하는 기법통계 데이터 분석(주성분 찾기)데이터
X.reshape(-1,1) \-> 훈련세트와 테스트 세트 2차원 배열로 바꿈
Okt(open korean text)