Alan Elias Zapata
Métrica para evaluar la calidad del agrupamiento obtenido con algoritmos de clustering
s(i) ≈ 1, la observación i está bien asignada a su cluster
s(i) ≈ 0, la observación i está entre dos cluster
s(i) ≈ −1, la observación i está mal asignada a su cluster
01
06
¿QuÉ es?
Identificar cuál es el número óptimo de agrupamientos.
ANÁLISIS DE POSIBLES SOLUCIONES
02
OBJETIVO
SILHOUETTE COEFFICIENT
Comprendido entre -1 y 1 −1 ≤ s(i) ≤ 1
05
Coeficiente de Silueta
valor de s(i)
Puede ser obtenido combinando los valores de a y b como se muestra a continuación:
03
DEFINICIÓN
04
El coeficiente para una observación i se denota como s(i)
TÉRMINOS
b : es la distancia mínima a otro cluster que no es el mismo en el que está la observación i. Ese cluster es la segunda mejor opción para i y se lo denomina vecindad de i.
a : es el promedio de las disimilitudes / distancias de la observación i con las demás observaciones del cluster al que pertenece i
Coeficiente Silueta
Alan Elias Zapata
Created on September 19, 2023
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Semicircle Mind Map
View
Team Retrospective
View
Fill in the Blanks
View
Museum Flipcards
View
Image Comparison Slider
View
Microcourse: Key Skills for the Professional Environment
View
The Meeting Microlearning
Explore all templates
Transcript
Alan Elias Zapata
Métrica para evaluar la calidad del agrupamiento obtenido con algoritmos de clustering
s(i) ≈ 1, la observación i está bien asignada a su cluster s(i) ≈ 0, la observación i está entre dos cluster s(i) ≈ −1, la observación i está mal asignada a su cluster
01
06
¿QuÉ es?
Identificar cuál es el número óptimo de agrupamientos.
ANÁLISIS DE POSIBLES SOLUCIONES
02
OBJETIVO
SILHOUETTE COEFFICIENT
Comprendido entre -1 y 1 −1 ≤ s(i) ≤ 1
05
Coeficiente de Silueta
valor de s(i)
Puede ser obtenido combinando los valores de a y b como se muestra a continuación:
03
DEFINICIÓN
04
El coeficiente para una observación i se denota como s(i)
TÉRMINOS
b : es la distancia mínima a otro cluster que no es el mismo en el que está la observación i. Ese cluster es la segunda mejor opción para i y se lo denomina vecindad de i.
a : es el promedio de las disimilitudes / distancias de la observación i con las demás observaciones del cluster al que pertenece i