머신러닝 정의, 분류, 구성요소, 예시 설명
📌 개념 지도학습의 한 종류 하나 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계 분석 기법 변수들 사이에 인과관계를 밝히고 독립변수에 의해 변하는 종속변수를 예측 및 추론 수학적 설명을 덧붙이자면 직선의 함수에서 올바른 기울기와 y절편을 구하는 과정이다. 🔍 회귀분석의 변수 종속변수(y) : 영향을 받는 변수 = 결과 즉, 우리가 ...
의사결정나무의 정의, 분류기준, 가지치기 등 전체적인 이론에 대해 설명함.
앙상블 모형의 배깅, 랜덤포레스트, 부스팅 알고리즘에 대한 설명
📌 노란색은 어느 집단에 속하는가? > 위 그림과 같은 데이터가 주어졌을 때, 노란색 데이터는 빨간색과 파란색 집단 중 빨간색 집단에 속한다고 말할 수 있다. 노란색 주위에 가까운 데이터들이 모두 빨간색이기 때문이다. 📌 KNN이란? 위와 같이 주변의 가까운 K개의 데이터의 속성에 따라서 해당 데이터가 속할 집단을 분류하는 알고리즘을 K-최근접이웃(K...
📌 나이브 베이즈란? > 테니스를 좋아하는 사람이 있다. 만약 이 사람이 날씨가 좋고 습도가 낮은 날에 테니스를 칠 확률은 얼마일까? 과거 데이터에 따라 학습을 시킨 모델을 기반으로 어떤 날씨가 주어졌을 때 이 사람이 테니스를 칠지 안 할지 판단하는 것이다. 조건부 확률과 베이즈 정리 기반의 지도학습 분류 모델이다. 나이브(Naive)는 순진,단순하다는...
1. 군집분석이란? 사전에 정의된 클래스가 없는 비지도학습의 종류 중 하나로, 관측된 여러 개의 변수 값에서 유사성에만 기초하여 n개의 군집으로 집단화한 뒤, 그 군집의 특성을 분석하는 다변량 분석 기법이다. 군집 : 유사한 데이터 개체들의 집합체 군집화 : 군집으로 묶는 행위 1.1 주요 목적 주로 데이터 분포에 대한 인사이트를 얻기 위해 사용 다른...
차원의 저주, 차원 축소, 주성분 분석(PCA)
선형 판별 분석과 iris 데이터를 이용한 코드 실습
1. 정의 >ex 어떤 제품들이 종종 함께 판매되는가? = 연관 규칙 프린터 구매 후 이어질 구매는 어떤 것인가? = 순차 패턴 데이터베이스 내에서 항목(item)들간의 관계 즉, 빈번하게 발생하는 패턴를 발견하기 위한 규칙 기반 학습(Rule-Based Learning) 방법이다. 이는 마케팅에서 고객들의 상품 구매 데이터를 이용하여 품목 간의 연관성...