클러스터링 요약
클러스터링은 데이터 집합 내에서 하위 그룹 또는 클러스터를 찾는 기술 집합입니다. 이는 X와 Y가 둘 다 알려진 지도학습과는 달리 X만 알려진 비지도 학습의 일부입니다. 좋은 클러스터링은 그룹 내의 관측치가 유사하지만 그룹 간에는 매우 다른 경우입니다. 주로 사용되는 두 가지 클러스터링 방법은 K-Means 클러스터링과 계층적 클러스터링 입니다. K-Means는 원하는 클러스터 수 K를 지정한 다음 각 관측치를 정확히 K개의 클러스터 중 하나에 할당합니다. 클러스터 내의 원소들이 유사하도록 하는 것이 목표입니다. 계층적 클러스터링은 클러스터 수를 선택할 필요가 없으며 관측치를 나타내는 트리 기반 표현인 덴드로그램을 생성합니다. 이 방법은 클러스터링 결과를 해석하고 선택하는데 도움이 되는 정보를 제공합니다..
2024.04.05