군집분석(cluster analysis)이란?
동일한 성격을 가진 여러 개의 그룹을 대상을 분류하는것을 말한다. 여기서 나뉜 부분집단을 군집이라 명칭한다.
유사한 성격을 가지는 몇 개의 군집으로 집단화 한 후, 형성된 군집들의 특성을 파악하여
군집들 사이의 관계를 분석하고 데이터 전체의 구조에 대한 이해를 돕고자 하는 탐색적 분석방법이다.
군집분석의 종류
군집분석은 크게 계층적 군집화와 분할적 군집화로 나뉜다.
군집분석의 형태를 그림으로 나타내면 아래와 같은 덴드로그램을 만들 수 있다.
1. 계층적 응집 군집화 (hierarchical clustering) 란?
각 관측지를 하나의 최초 군집으로 지정한 후, 한번에 두개씩 하나의 군집으로 만들어,
모든 군집들이 하나의 군집이 될 때까지 군집들을 결합해 나가는 방법이다.
분할 방법에는 응집형과 분리형이 있다
2. 분할적 군집화(Partitional Clustering)란?
처음에 군집수인 k를 지정한 후, 관측치들을 무작위로 k개의 집단으로 분할하고
다양한 기준(평균값, 최빈값 등)을 이용하여 centroid를 수정해나가며 집단을 다시 재분류 하는 방법이다.
분할 방법에는 프로토타입 기반, 분포기반, 밀도기반, 그래프기반이 있다
'통계 > 통계지식' 카테고리의 다른 글
[통계] p-value란 무엇인가? 짧고 굵은 기본개념! (0) | 2021.01.04 |
---|---|
[모델성능 평가지표] (1) 회귀모델 (0) | 2020.11.05 |
[군집분석] K-중심군집(K-centroid clustering) : K-means clustering (0) | 2020.11.04 |
[통계적 검정] 통계적 검정이란? (0) | 2020.11.04 |
[통계] 통계란? (개념, 표본추출방법, 명목척도,순서척도,구간척도,비율척도) (0) | 2020.11.03 |