1. 모델 만들기

# K-Means 모델 만들기
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters = 3)         # 군집 세가지로 나누겠다.사실 이번 데이터는 high / middle / low로 라벨링 되있기때문에..원래는 이런 데이터는 classification하는 게 나음

kmeans.fit(data)                     # data를 세개의 그룹으로 쪼개갰다, 모델완

2. 만들어진 군집 확인

# 형성된 군집 확인

cluster = kmeans.predict(data)               
cluster  #  세개의 라벨 데이터로 쪼개져 있을 것이다.

    출력>
    array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
           1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
           1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 0, 2, 2, 2, 2,
           1, 2, 2, 2, 2, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 0, 2, 2, 2, 2,
           2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
           2, 2, 2, 2, 2, 2, 2, 2, 0, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 0, 0,
           0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
           0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
           0, 0], dtype=int32)

3. 군집 시각화

# 형성된 군집 시각화
plt.scatter(data[:,0], data[:,1], c = cluster, linewidth=1, edgecolors='black')   # x좌표는 모든 데이터를 가져오는데 0번, y좌표는 모든 데이터를 가져오는데 1번 이용, data[:5] 이부분에서 사용하는 거 생각하면됨, 군집마다 컬러 나눠주기

+ Recent posts