본문 바로가기

통계/통계지식

[군집분석] 군집분석이란? (군집분석 종류, 계층적군집화, 분할적군집화)

군집분석(cluster analysis)이란?

동일한 성격을 가진 여러 개의 그룹을 대상을 분류하는것을 말한다. 여기서 나뉜 부분집단을 군집이라 명칭한다.

유사한 성격을 가지는 몇 개의 군집으로 집단화 한 후, 형성된 군집들의 특성을 파악하여

군집들 사이의 관계를 분석하고 데이터 전체의 구조에 대한 이해를 돕고자 하는 탐색적 분석방법이다.

 

 

군집분석의 종류

군집분석은 크게 계층적 군집화분할적 군집화로 나뉜다.

군집분석의 형태를 그림으로 나타내면 아래와 같은 덴드로그램을 만들 수 있다.

 

1. 계층적 응집 군집화 (hierarchical clustering) 란?

각 관측지를 하나의 최초 군집으로 지정한 후, 한번에 두개씩 하나의 군집으로 만들어,

모든 군집들이 하나의 군집이 될 때까지 군집들을 결합해 나가는 방법이다.

분할 방법에는 응집형 분리형이 있다

2. 분할적 군집화(Partitional Clustering)란?

처음에 군집수인 k를 지정한 후, 관측치들을 무작위로 k개의 집단으로 분할하고

다양한 기준(평균값, 최빈값 등)을 이용하여 centroid를 수정해나가며 집단을 다시 재분류 하는 방법이다.

분할 방법에는 프로토타입 기반, 분포기반, 밀도기반, 그래프기반이 있다