martes, 8 de septiembre de 2015

Graficar Kmeans con clase conocida

Si se tienen datos con una clase definida, y se quiere saber qué tan bien pude segmentar el algoritmo Kmeans estas clases (para clases futuras), puede usarse PCA para graficar las observaciones.

En el siguiente gráfico se asigna un color diferente a cada cluster, y un símbolo diferente a cada clase conocida, para identificar donde se "equivocó" el cluster.


















NOTA:
Para otro ejemplo de graficar Kmeans ver publicacion AQUI.
Para concepto de Kmeans, ver publicacion AQUI

El script seria este:
modelo.km <- kmeans(iris[,-5],3)
acp       <- prcomp(iris[,-5])    
data.grf  <- data.frame( pca1  = acp$x[,1],
                         pca2  = acp$x[,2],
                         color = modelo.km$cluster)
plot(data.grf[,1:2],col=data.grf[,3], pch=as.integer(iris[,5]))




No hay comentarios:

Publicar un comentario