05-Clustering
군집화란 머신러닝 기법 중 하나로 데이터셋들을 유사도를 기준으로 묶어 여러개의 군집(Cluster)로 만드는 방법을 의미 합니다. 포인트클라우들에서는 전체 포인트들을 어러개의 서브셋 포인트클라우들 나눈것으로 볼수 있습니다. PCL에서는 세분화(Segmentation) 모듈에서 군집화와 관련된 기능을 제공하고 있습니다. 본문에서는 군집화와 세분화를 혼용하여 사용하고 있지만 둘의 목적은 같지만 방법은 다릅니다(Ojialor, n.d.). 세분화는 특정 기준을 지정하고 이를 기준으로 나누는 반면, 군집화는 유사한 특성을 가진 데이터들끼리 분류하여 이를 하나의 같은 그룹으로 만들어 방법입니다. 예를 들은 인구통계 정보로 성별, 연령, 사는 곳, 소득, 키 등의 정보가 주여 졌을 때 세분화를 하게 된다면 성별을 기준으로 나누거나 연령대를 기준으로 세분화 할 수 있습니다. 하지만 군집화를 하게 되면 자동으로 찾아진 유사성 기준이 사는 곳이라면 한 그룹안에 남성과 여성 그리고 아이부터 어른까지 모두 속해지게 됩니다. 이 경우 군집화를 통해 새 기준으로 세분화 된것입니다. 본문에서는 포인트클라우들에서는 전체 포인트들을 어러개의 서브셋 포인트클라우들로 유사도를 기분으로 나눈것을 군집화로, 의미를 기준으로 나누는 것을 세그멘테이션으로 표현 하였습니다.
세그멘테이션 후 군집화 후 분류 ...
PCL에서 제공하는 대표적인 세그멘테인션/군집화 알고리즘은 다음과 같습니다.
- 모델 기반 세분화 : 지정된 모델과 벗어난 점군을 구분, RANSAC
- 이진 세분화 : Min-Cut
- 중심기반 군집화 : 클러스터를 클러스터 중심점으로 정의하는 기법Euclidean / Conditional Euclidean
- Region growing / Color-based Region growing