선형 회귀란? 머신러닝의 말 그대로 기계를 학습시켜 답을 구하는 것이라고 할 수 있습니다 그래서 어떤 값을 넣었을 때 발생할 수 결과 값을 예측할 수 있습니다. 이때 우리가 가장 직관적이고 간단하게 결과값을 구하는 방법은 선입니다. 중학교 수학시간에 배운 직선 그래
선형 회귀는 데이터 포인트들 사이의 관계를 나타내는 직선을 찾는 모델입니다. 하지만 때로는 데이터가 복잡하거나 과도하게 피팅될 수 있어서 모델이 과적합될 수 있습니다. 이때 regularization은 모델을 개선하고 일반화 능력을 향상시키는 강력한 도구입니다.과적합(
로지스틱 회귀란? 로지스틱 회귀는 데이터를 분류하는 데 사용되는 알고리즘입니다. 이진 분류 문제에서 두 개의 가능한 클래스 중 하나에 데이터를 할당합니다. 예를 들어, 이메일이 스팸인지 아닌지를 예측하거나, 환자가 질병을 가지고 있는지 없는지를 판단하는 데 사용될 수
의사결정나무란? 엔트로피(Entropy) 지수 지니(Gini) 지수 의사결정 나무는 동일한 데이터로 어떤 기준을 언제 사용하느냐에 따라 다양한 나무를 그릴 수 있다. 그렇다면 최적의 의사결정 나무는 어떻게 찾고, 무엇을 기준으로 평가할 의사결정 나무의 분리가 잘 된
군집화란? 이미 일상 속에서 군집화의 개념을 사용하고 있습니다. 비슷한 사람끼리 잘 어울리는 걸보면 "유유상종", "끼리끼리 사이언스" 등이라고 말하죠? 이처럼 비슷한 데이터끼리 묶어 그룹을 만드는 것을 "군집화"라고 부릅니다. 말이 어렵지, 데이터들이 속할 그룹을 지