오늘은 SVM에 대해 배웠다.서포트 벡터 머신(SVM: support vector machine)은 퍼셉트론 기반의 모형에 가장 안정적인 판별 경계선을 찾기 위한 제한 조건을 추가한 모형이라고 볼 수 있다.두 클래스 사이에 선을 그었을 때 두 공간이 생기고 그 공간사이
계속해서 Scikit-Learn을 활용해 여러 알고리즘을 써보는 것을 실습했다.설명이 안된 부분이 있다고 하셔서, 먼저 Regularization(정규화)과 L1, L2에 대해 배웠다.Normalization(일반화) : 데이터에 scale을 조정하는 작업Regular
\-오늘은 데이터 전처리에 대해 우선적으로 배워보았다.총 5가지 방법이 있다.첫번째 데이터 전처리(Data preprocessing)이였다.간단하게 이야기하면 data를 분석하기 용이하게 고치는 모든 작업이다.이걸 하는 이유는 알고리즘이나 파라메터가 잘못된 경우에는 지
오늘은 어제에 이어 pandas를 이용해 표로 작성한 데이터로 그래프로 결과값을 보여주는 'Matplotlib'라이브러리를 배웠다. 그 전에 어제 배웠던 pandas를 이용한 표를 다시 나타내 보기로 했다.아래 자료는 미국의 69년도 부터 08년도까지의 성별 출생률을
오늘은 Numpy와 Pandas를 해보았다.NumPy(Numerical Python)는 파이썬에서 과학적 계산을 위한 핵심 라이브러리이다. NumPy는 다차원 배열 객체와 배열과 함께 작동하는 도구들을 제공한다. 하지만 NumPy 자체로는 고수준의 데이터 분석 기능을