Want to create interactive content? It’s easy in Genially!
Algoritmo k-means
MIGUEL ALEJANDRO ROJAS GARCIA
Created on September 6, 2023
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Women's Presentation
View
Vintage Photo Album
View
Geniaflix Presentation
View
Shadow Presentation
View
Newspaper Presentation
View
Memories Presentation
View
Zen Presentation
Transcript
k-means clustering
Miguel Alejandro Rojas García
START
Que es?
es un algoritmo de clasificación no supervisada (clusterización) que agrupa objetos en k grupos basándose en sus características. El agrupamiento se realiza minimizando la suma de distancias entre cada objeto y el centroide de su grupo o cluster. Se suele usar la distancia cuadrática.
Cómo funciona el algoritmo K- means?
Para utilizar el algoritmo K-means, primero se especifica el número de clusters deseados (k). Por ejemplo, al establecer «k» igual a 2, su conjunto de datos se agrupará en 2 grupos, mientras que si establece «k» igual a 4, agrupará los datos en 4 grupos.
+INFO
Actualización centroides:
Inicialización:
Data
Data
Asignación objetos a los centroides:
1) Especificar el número de clústers deseados (k):
5) Repetir los pasos 3 y 4 hasta que los centroides de los clusters ya no cambien o hasta que se alcance el número máximo de iteraciones.
Data
+INFO
3) Asignar cada punto del conjunto de datos al cluster cuyo centroide esté más cerca:
2) Seleccionar k puntos al azar del conjunto de datos como los centroides iniciales de cada clúster:
+INFO
+INFO
4) Recalcular los centroides de cada cluster como la media de todos los puntos del cluster:
+INFO
Cuándo usar la agrupación en clusters K-means
Segmentación de clientes
Puede utilizarse para dividir a los clientes en diferentes grupos en función de sus características o comportamientos. Esto puede ser útil para enviar campañas de marketing más personalizadas o para tomar decisiones de negocio.
Clasificación de texto
Puede utilizarse para clasificar documentos o artículos en diferentes categorías en función de su contenido.
Detección de anomalías
Puede utilizarse para detectar patrones anormales en un conjunto de datos y señalar posibles problemas o errores.
Proceso
Conclusiones
el algoritmo k-means es una herramienta útil para la agrupación de datos y el aprendizaje automático. Tiene grandes ventajas y sigue siendo una opción popular para muchos problemas de clasificación.
Jerarquizarla y darle peso visual a lo principal.
El algoritmo asigna cada punto del conjunto de datos al cluster cuyo centroide esté más cerca. Para hacer esto, se calcula la distancia entre cada punto y cada centroide y se asigna el punto al cluster cuyo centroide tenga la menor distancia.
Definir mensajes secundarios con interactividad.
Establecer un flujo através del contenido.
El primer paso es especificar cuántos clúster queremos dividir el conjunto de datos. Este número se denomina k.
Esto significa que se actualiza la posición del centroide para reflejar la nueva agrupación..
Planificar la estructurade tu comunicación.
Cada grupo está representado por su centro o centroide, que corresponde a la media aritmética de los puntos de datos asignados al grupo. .
Luego, se eligen k puntos al azar del conjunto de datos para servir como los centroides iniciales de cada clúster. Estos centroides son el punto central o el promedio de cada clúster.