Ir al contenido principal

Diagrama de temas

    • Determinación de k

      Determinación de k

      En la agrupación en clústeres k-means, el desafío principal es determinar k (el número de clústeres). Hay varias métricas de evaluación que puede utilizar para ayudar a determinar la k óptima. Antes de usar estas métricas, sin embargo, debe comenzar evaluando el problema que está tratando de resolver. En función de su conocimiento del dominio, es posible que pueda imponer restricciones útiles a los datos. Por ejemplo, suponga que tiene un conjunto de datos sin etiqueta de miles de fotografías que representan paisajes urbanos. Desea organizar estas imágenes por las ciudades en las que se tomaron. Las imágenes no tienen metadatos basados en la ubicación, por lo que deberá confiar en el contenido real de cada imagen para identificar su ubicación. En este caso, usted sabe que cada imagen fue tomada en una de las cuatro ciudades posibles. Por lo tanto, debido a su conocimiento del dominio, sabe que solo aceptará cuatro clústeres, ni más ni menos. Por lo tanto, no necesitará estimar un número "correcto" de clústeres.

      Información adicional

      Para obtener más información sobre la agrupación en clústeres k-means, consulte este sitio.