# clustering

69개의 포스트
post-thumbnail

투수의 디셉션을 정량적 평가하기(2)

이전 칼럼 '투수의 디셉션을 정량적 평가하기(1)'에서는 Jon Anderson의 방법을 통해 투수의 패스트볼 디셉션을 정량화하는 방법을 살펴보았습니다. 이번 칼럼에서는 2023년 MLB 데이터를 사용하여 투수들의 디셉션을 더 깊이 분석해보겠습니다.

2023년 11월 27일
·
0개의 댓글
·
post-thumbnail

투수의 디셉션을 정량적 평가하기(1)

Photo by Keith Johnston on Unsplash투수의 패스트볼 디셉션을 정량화하는 방법에 대해 이야기해보겠습니다.Jon Anderson의 블로그 글 "Quantifying Pitcher Fastball Deception"은 야구 통계학 분야에서 투수의

2023년 11월 25일
·
0개의 댓글
·
post-thumbnail

2023 이노씽크 메이커톤 (기획)

우연한 계기로 학교에서 주최하는 좋은 대회를 알게 되었고 실제 킥보드를 많이 사용했던 유저로서 굉장히 흥미로운 주제였기에 바로 참여를 하게 되었다.

2023년 11월 20일
·
2개의 댓글
·

계층적 클러스터링 응용

저번에 K-Mean 클러스터링을 구현하려고 고생하던 와중에 K값을 카메라 distance값에 따라 찾아 나가는 방식을 고민했는데그냥 그대로 클러스터링 해버리면 안되나...? 라는 생각이 들어 찾아보니 비슷한 방법이 이 계층적 클러스터링 (Hiarachical Clust

2023년 11월 16일
·
0개의 댓글
·

Mapkit과 Clustering

가까운 위치에 뜬 Annotation들이 너무 많으면 오히려 가독성이 떨어지는 문제가 있었다.그래서 Map Annotation들을 묶어서 그 Center location에 Annotation갯수를 보여주는 새로운 Clustered Annotation을 만들고 싶어서 공

2023년 11월 16일
·
0개의 댓글
·
post-thumbnail

노이즈처리

NOISE

2023년 11월 16일
·
0개의 댓글
·
post-thumbnail

유데미 큐레이션​ 자동 추천 검색어 AI 개발​ (프로젝트 발표)

클러스터링(Clustering)은 데이터를 비슷한 특성을 가진 여러 그룹으로 나누는 머신러닝의 비지도 학습 기법이다. 이 방법은 데이터 내 숨겨진 패턴을 발견하거나 데이터 구조를 이해하는 데 유용하게 사용된다. 클러스터링 알고리즘은 다양한 기준과 방법론을 가지고 있으며

2023년 11월 9일
·
0개의 댓글
·
post-thumbnail

About Clustering (k-means, hierarchical clustering, DBSCAN)

클러스터링 기법에 관하여 : K-means, 계층적 클러스터링, DBSCAN

2023년 9월 3일
·
0개의 댓글
·
post-thumbnail

[Data Science] Clustering (2) Partitioning Method; K-Means, PAM(K-Medoids), K-modes, CLARA

☑️ what) N개의 데이터를 K개의 클러스터로 나눈다.클러스터의 representative (e.g. centroid, medoid)를 정하고, 다음 식의 클러스터별 총합이 최소가 되도록 나눈다.🥲 pb) $K$가 hyper-parameter이다, non-con

2023년 6월 18일
·
0개의 댓글
·
post-thumbnail

[TIL | 230614] 군집화 - k-means, GMM, DBSCAN

참고도서 : 파이썬 머신러닝 완벽가이드 개정 2판: 군집 중심점(centroid)이라는 특정한 임의의 지점을 선택해 해당 중심에 가장 가까운 포인트들을 선택하는 군집화 기법일반적인 군집화에서 가장 많이 활용되는 알고리즘알고리즘이 쉽고 간결거리 기반 알고리즘으로 속성의

2023년 6월 14일
·
0개의 댓글
·
post-thumbnail

2019, DNC [SLT]

Discriminative Neural Clustering (DNC)

2023년 6월 5일
·
0개의 댓글
·
post-thumbnail

제로베이스 데이터취업스쿨 DAY58 머신러닝21~23

PCA 함수 만들기 iris 데이터 분석 wine 데이터 분석 주성분 2개 주성분 3개 ![](https://velog.vel

2023년 5월 27일
·
0개의 댓글
·

비지도학습

비지도학습은 나비와 벌 사진을 보여주면서 뭐가 벌이고 나비인지 알려주지 않음정답이 없는 데이터를 통해데이터의 유의미한 패턴 / 구조 발견유사한 특징을 가지는 데이터들을 그룹화예) 고객 세분화, 소셜 네트워크 분류, 기사 그룹 분류, ..데이터를 k 개를 클러스터(그룹)

2023년 4월 11일
·
0개의 댓글
·
post-thumbnail

TFT 데이터분석 - 메인 덱 클러스터링 (2)

이전 포스트에서 이어지는 포스트이다.이전 포스트에서 EDA를 통해 얻은 특징을 바탕으로 모델링을 시작했다.

2023년 3월 23일
·
0개의 댓글
·

2023.03.22.WED

[ 메인 프로젝트 ] DB clustering (수평 구조) DB 서버를 여러 개 두고 서버 한 대가 죽었을 때 대비하는 것 동일한 DB를 여러 개의 서버가 관리. 로드밸런싱 가능 Active-Active 방식, Active-StandBy 방식 여러 대의 서버가 동일한 DB를 공유하므로 병목 현상 발생 가능 https://mangkyu.t...

2023년 3월 22일
·
0개의 댓글
·
post-thumbnail

[ML] 군집분석

9. 군집 분석 9-1. 군집 분석 군집 : 데이터 집합 내에 존재하는 의미 있거나 유용성 있는, 또는 의미도 있고 유용성도 있는 그룹 군집 분석 : 레코드들로 이루어진 데이터 집합을 그 레코드를 구성하는 속성 정보만 사용해 그룹으로 나누는 기법 클러스터링 (Clu

2023년 1월 22일
·
0개의 댓글
·

Sensitive Properties Key [nifi.sensitive.props.key] not found Error

Sensitive Properties Key

2023년 1월 6일
·
0개의 댓글
·

sklearn - Loading data

sklearn을 이용하여 data 로딩하기. classification과 clustering을 위한 데이터 로딩. 기본적인 데이터 로딩, 데이터 split, 학습, 예측, 정확도 측정 코드가 있습니다.

2022년 12월 27일
·
0개의 댓글
·