머신러닝의 알고리즘 종류는 크게 3가지로 나눌 수 있습니다. 지도학습 (Supervised Learning) 비지도학습 (Unsupervised Learning) 강화학습 (Reinforcement Learning) 참고사이트 지도학습 분류(Classificati
choosing right algorithm 의존성 (Dependencies) 사이킷런은 파이썬 기반 머신러닝 라이브러리입니다. 따라서 사이킷런은 다음과 같은 파이썬, 파이썬 라이브러리에 의존성을 갖습니다. Scikit-Learn 0.20까지는 Python 2.7과
NumPy의 ndarray, Pandas의 DataFrame, SciPy의 Sparse Matrix를 이용해 나타낼 수 있습니다. 그리고 훈련과 예측 등 머신러닝 모델을 다룰 때는 CoreAPI라고 불리는 fit(), transfomer(), predict()과 같은
mean squared error from sklearn.metrics import meansquarederror error = np.sqrt(meansquarederror(y, y_new)) print(error)
loading datasets dictionary 와 유사 Bunch datatype data들의 key값들을 알아내는 메소드 데이터의 nsamples(데이터 갯수. row), nfeatures(데이터 특성. columns)의 모양을 알아보기 위해 shape 데
훈련 데이터와 테스트 데이터 직접 분리하기 traintestsplit() 사용해서 분리하기 훈련 데이터와 테스트 데이터 분리는 필수 기능입니다. 훈련에 쓴 데이터를 예측에 사용하면 항상 정확도는 100%가 나올 것이기 때문이죠. 사이킷런에서는 이 필수 기능을 당연히 A
이번 포스팅에서는 선형회귀(Linear Regression)와 로지스틱 회귀(Logistic Regression)에 대해 알아보려 한다. 회귀(Regression) 회귀분석(Regression Analysis) 이란 통계학에서 전통적으로 많이 사용되던 분석 방법이다.
그동안 주로 배워온 딥러닝 모델들이 주로 수행하는 작업들은 정답 데이터를 통해 X가 무엇인지 분류하는 방법을 배우게 하는 지도학습(Supervised Learning)이였다. 그러나 명확한 정답 데이터가 라벨(label)로 달려있지 않은 수많은 데이터들을 다룰땐 비지도
이미지넷(ImageNet)은 컴퓨터 비전 분야를 연구하다보면 필연적으로 만나게 되는 이름이다.AlexNet 구조Image Classification with Deep Convolutional Neural Networks 논문VGG는 AlexNet 같이 이미지넷 챌린지에
Regularization & Normalization Regularization는 정칙화라고 불리며, 오버피팅을 해결하기 위한 방법 중의 하나이다. L1, L2 Regularization, Dropout, Batch normalization 등이 있다. 이 방법들은