# GMM

4개의 포스트
post-thumbnail

[ML] 군집분석

본 포스팅은 를 참고하여 작성되었습니다. 9. 군집 분석 9-1. 군집 분석 군집 : 데이터 집합 내에 존재하는 의미 있거나 유용성 있는, 또는 의미도 있고 유용성도 있는 그룹 군집 분석 : 레코드들로 이루어진 데이터 집합을 그 레코드를 구성하는 속성 정보만 사용해 그룹으로 나누는 기법 클러스터링 (Clustering : 군집화) : 군집 분석 기법을 사용해 군집을 찾아내는 과정 9-1-1. 분류와의 차이점 분류 : 레코드들을 이미 알려진 또는 미리 구분해 놓은 클래스에 할당 클러스터링 : 어떠한 클래스가 존재하는지 알지 못하는 상태에서 레코드들을 그 속성 정보만 사용해 그룹으로 나눔 → 후에 레코드들의 특징을 분석해 의미 파악 9-2. 군집의 의미 같은 군집에 속한 레코드들끼리는 서로 비슷하고 다른 군집에 속한 레코드들과는 서로 달라야함 많은 경우 군집의 의미를 명확하게 해석하기는 어려움

2023년 1월 22일
·
0개의 댓글
·
post-thumbnail

파이썬 머신러닝 완벽 가이드 - 8. Clustering(2) (평균 이동, GMM, DBSCAN, 예제 실습)

4. 평균 이동 Mean shift : K-평균과 유사하게, 군집의 중심을 지속적으로 움직이면서 군집화를 수행함 : 그러나, K-평균이 중심에 소속된 데이터의 평균 거리 중심으로 이동하는데 반해, : 평균 이동은 데이터가 모여있는 밀도가 가장 높은 곳으로 이동시키면서 군집화하는 방법 평균 이동 군집화는 데이터의 분포도를 이용해 군집 중심점을 찾음 군집 중심점은 데이터 포인트가 모여있는 곳이라는 생각에서 착안 이를 위해 확률 밀도 함수를 이용 함 확률 밀도 함수가 피크인 점(가장 집중적으로 데이터가 모여 있을)을 군집 중심점으로 선정하며 주어진 모델의 확률 밀도 함수를 찾기 위해서 KDE(Kernel Density Estimation)을 이용 주변 데이터와의 거리 값을 KDE 함수 값으로 입력한 뒤, 그 반환 값을 현재 위치에서 업데이트하면서 이동하는 방식 ![](https://velog.velcdn.co

2022년 10월 18일
·
0개의 댓글
·
post-thumbnail

GMM and EM algorithm

Expectation - Maximization algorithm Expectation-Maximization algorithm(EM)은 latent variable이 존재할 때, 만일 latent variable을 알 수 있다면 쉽게 풀리는 문제에 공통적으로 적용할 수 있는 범용적인 알고리즘입니디. EM은 latent variable을 통계적으로 할당하는 과정(E-step)과 할당한 결과를 바탕으로 parameter를 재산정하는 과정(M-step)을 반복합니다. 위 이미지는 Gaussian Mixture Model(GMM)의 parameter를 EM을 통해 근사하는 과정을 보여줍니다. GMM은 분포의 확률밀도함수를 Gaussian 분포의

2022년 4월 4일
·
4개의 댓글
·
post-thumbnail

Gaussian Distribution : 정규분포

오늘 포스팅할 3번째 키워드로 공부하는 데이터 분석의 키워드는 Gaussian Distribution(정규분포)입니다. Gaussian Distribution 사진 출처 : 엣지있는 인공지능 : 정규분포 정규분포는 연속 확률 분포 중 하나로, 평균이 $\mu$를 따르고, 분산이 $\sigma^2$을 따르는 분포이다. > 데이터 분석에서 정규분포가 중요한 이유 표본이 크기가 커질 경우 중심극한 정리(CLT : Central Limit Theorem)에 따라 표본이 충분히 큰 경우, 정규분포를 따르게 되어 있습니다. 데이터 분석에서 정규분포를 하지 않는 변수들의 경우에도 Scaling, 로그변환 등을

2022년 2월 6일
·
0개의 댓글
·