Want to create interactive content? It’s easy in Genially!

Get started free

Algoritmo k-means

MIGUEL ALEJANDRO ROJAS GARCIA

Created on September 6, 2023

Start designing with a free template

Discover more than 1500 professional designs like these:

Women's Presentation

Vintage Photo Album

Geniaflix Presentation

Shadow Presentation

Newspaper Presentation

Memories Presentation

Zen Presentation

Transcript

k-means clustering

Miguel Alejandro Rojas García

START

Que es?

es un algoritmo de clasificación no supervisada (clusterización) que agrupa objetos en k grupos basándose en sus características. El agrupamiento se realiza minimizando la suma de distancias entre cada objeto y el centroide de su grupo o cluster. Se suele usar la distancia cuadrática.

Cómo funciona el algoritmo K- means?

Para utilizar el algoritmo K-means, primero se especifica el número de clusters deseados (k). Por ejemplo, al establecer «k» igual a 2, su conjunto de datos se agrupará en 2 grupos, mientras que si establece «k» igual a 4, agrupará los datos en 4 grupos.

+INFO

Actualización centroides:

Inicialización:

Data

Data

Asignación objetos a los centroides:

1) Especificar el número de clústers deseados (k):

5) Repetir los pasos 3 y 4 hasta que los centroides de los clusters ya no cambien o hasta que se alcance el número máximo de iteraciones.

Data

+INFO

3) Asignar cada punto del conjunto de datos al cluster cuyo centroide esté más cerca:

2) Seleccionar k puntos al azar del conjunto de datos como los centroides iniciales de cada clúster:

+INFO

+INFO

4) Recalcular los centroides de cada cluster como la media de todos los puntos del cluster:

+INFO

Cuándo usar la agrupación en clusters K-means

Segmentación de clientes

Puede utilizarse para dividir a los clientes en diferentes grupos en función de sus características o comportamientos. Esto puede ser útil para enviar campañas de marketing más personalizadas o para tomar decisiones de negocio.

Clasificación de texto

Puede utilizarse para clasificar documentos o artículos en diferentes categorías en función de su contenido.

Detección de anomalías

Puede utilizarse para detectar patrones anormales en un conjunto de datos y señalar posibles problemas o errores.

Proceso

Conclusiones

el algoritmo k-means es una herramienta útil para la agrupación de datos y el aprendizaje automático. Tiene grandes ventajas y sigue siendo una opción popular para muchos problemas de clasificación.

Jerarquizarla y darle peso visual a lo principal.

El algoritmo asigna cada punto del conjunto de datos al cluster cuyo centroide esté más cerca. Para hacer esto, se calcula la distancia entre cada punto y cada centroide y se asigna el punto al cluster cuyo centroide tenga la menor distancia.

Definir mensajes secundarios con interactividad.

Establecer un flujo através del contenido.

El primer paso es especificar cuántos clúster queremos dividir el conjunto de datos. Este número se denomina k.

Esto significa que se actualiza la posición del centroide para reflejar la nueva agrupación..

Planificar la estructurade tu comunicación.

Cada grupo está representado por su centro o centroide, que corresponde a la media aritmética de los puntos de datos asignados al grupo. .

Luego, se eligen k puntos al azar del conjunto de datos para servir como los centroides iniciales de cada clúster. Estos centroides son el punto central o el promedio de cada clúster.