내가 보려고 쓴 BDAA 복습
📌K-fold 교차 검증 K-Fold 교차 검증은 데이터를 무작위로 k 개의 fold로 나누어, 각각의 fold를 한 번씩 Validation Set, 나머지 fold를 Training Set으로 추출하여 K번 검증하는 방법이다. 이 방법은 모델의 알반화 성능을 평가하기 위해 사용된다. 그러나 다중 클래스 분류 문제에서 클래스 비율이 불균형한 경우에서 ...
📌 average 매개변수 k-fold 교차 검증에서 average 매개변수는 이중 또는 다중 클래스(multi-class) 분류에서 사용되는 평균 방법을 지정한다. average 매개변수는 binary, micro, macro, weighted 중 하나를 선택할 수
선형대수 기반 프로그램을 가능하게 하는 대표적인 파이썬 라이브러리로, 빠른 계산과 배열 연산 능력을 보장한다. 선형대수는 머신러닝의 주요 알고리즘 중 하나이며 많은 머신러닝 알고리즘은 넘파이를 기반으로 하기에 넘파이에 익숙해지는 것이 매우 중요하다.(1) 다차원 배열다
1. Pandas란 행과 열로 구성된 2차원 데이터 객체를 다루는 데이터 분석 라이브러리로, 대용량의 데이터들을 처리하는데 매우 편리한 도구이다. Numpy를 기반으로 작성되지만 훨씬 더 유연하고 편리하게 데이터 핸들링을 할 수 있다. 또한 저수준 API를 제공하는
파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리이다. 특징으로는 다음과 같다. 데이터 분석 시 사용되는 ML 라이브러리분류, 회귀, 군집화 문제 해결 가능직관적인 API, 다양한 모듈, 머신러닝 기능 제공dataset 모듈은 scikit-learn이 제공하
Seaborn 은 matplotlib을 기반으로 하는 python 데이터 시각화 라이브러리이다. 다양한 색상 테마와 통계용 차트 등의 기능으로 시각화를 간편하게 할 수 있도록 한다. 주요 파라미터는 다음과 같다. x, y : x,y축의 위치를 지정하는 변수hue : 다