: Scikit-learn(이전 명칭: scikits.learn, sklearn)은 파이썬 프로그래밍 언어용 자유 소프트웨어 기계 학습 라이브러리이다. 다양한 분류, 회귀, 그리고 서포트 벡터 머신, 랜덤 포레스트, 그라디언트 부스팅, k-평균, DBSCAN을 포함한 클러스터링 알고리즘을 특징으로 하며, 파이썬의 수치 및 과학 라이브러리 NumPy 및 SciPy와 함께 운용되도록 설계되었다.
인용: 위키백과
분류 : 주어진 데이터가 어느 클래스에 속하는지 판별한다.
회귀(Regression) : 입력된 데이터를 바탕으로 값을 예상한다.
클러스터링 : 입력된 데이터를 어떠한 기준에 따라 나누는 것이다.
사이킷런 사용법 : 사이킷런은 다양한 알고리즘이 포함되어 있는 라이브러리이기 때문에, 필요한 알고리즘을 호출하여 사용한다. 그 과정은 다음과 같다.
라이브러리를 import한다
학습 데이터와 테스트 데이터를 준비한다. (이 둘은 서로 다른 데이터여야 한다)
알고리즘을 지정하고 학습을 진행한다.
테스트 데이터로 테스트를 진행한다.
필요에 따라 정밀도 등을 시각화한다.
출처: https://blog.naver.com/ysmc2018/222847482642
Scikit Learn이 무엇인지 글을 잘 정리해 두셨다.