Métodos de análisis en estadística
No Paramétricos
Paramétricos
Prueba de normalidad
Cuándo usar métodos no paramétricos
Datos no normales
Datos ordinales o nominales
Presencia de valores atípicos (outliers)
22 23 100 21 24
Los métodos no paramétricos más utilizados y su equivalente paramétrico
Prueba de rangos con signo de Wilcoxon
Prueba de la U de Mann-Whitney
2 grupos
El mismo grupo 2 veces
Prueba de Kruskal-Wallis
Coeficiente de correlación de Spearman ρ (rho)
3 ó más grupos
Prueba de la U de Mann-Whitney
Una investigadora desea comparar la satisfacción con el servicio de agua potable entre dos comunidades. La satisfacción se midió en escala Likert (1 a 5). Analiza si existe diferencia significativa.
Datos: Comunidad A: 5, 4, 4, 3, 5 Comunidad B: 2, 3, 2, 1, 3
a) Ordena los datos y asígnales rangos. b) Calcula la suma de rangos de cada grupo. c) Calcula el estadístico U. d) Interpreta los resultados.
Prueba de Kruskal-Wallis
Pregunta de investigación: ¿El ingreso neto por hectárea (L/ha) difiere entre sistemas de producción Tradicional, Tecnificado y Agroecológico? Motivo para usar no paramétricos: los ingresos suelen ser asimétricos (colas largas, outliers), violando normalidad/homocedasticidad. Kruskal–Wallis compara medianas entre >2 grupos sin asumir normalidad.
Prueba de Kruskal-Wallis
Se midió la percepción de riesgo de inundación (escala Likert 1 a 5) en tres comunidades.
Datos: Boca del Toro: 4, 5, 4, 3Salado Barra: 2, 3, 2, 1 Río Viejo: 3, 3, 2, 4
a) Ordena todos los datos y asigna rangos. b) Calcula los rangos promedio por grupo. c) Aplica la fórmula de Kruskal-Wallis. d) Con base en el resultado, determina si existen diferencias entre las comunidades.
Prueba de rangos con signo de Wilcoxon
Se evaluó a cinco personas antes y después de un taller sobre servicios ecosistémicos.
Código: 1 = sí sabe, 0 = no sabe.
Datos: Persona 1: Antes 0 – Después 1 Persona 2: Antes 1 – Después 1 Persona 3: Antes 0 – Después 0 Persona 4: Antes 0 – Después 1 Persona 5: Antes 1 – Después 0
a) Determina los signos (+, –, =). b) Excluye los casos sin cambio. c) Calcula cuántos aumentos y cuántas disminuciones hay. d) Evalúa si el taller tuvo un efecto positivo.
Coeficiente de correlación de Spearman
Un docente quiere analizar si existe relación entre las horas de estudio y la nota final de un grupo de estudiantes.
Datos: Horas: 2, 4, 4, 7, 10 Notas: 60, 65, 70, 68, 90
a) Convierte los datos a rangos. b) Calcula la diferencia entre rangos. c) Aplica la fórmula de Spearman. d) Interpreta si la relación es positiva, negativa o nula.
Shapiro–Wilk (modificado) aplicado al ingreso neto por hectárea en los tres sistemas de producción.
1. Agroecológico
W = 0.89, p = 0.2310*
Como p > 0.05, no se rechaza H₀.
Los datos pueden considerarse normales. 2. Tecnificado
W = 0.91, p = 0.3954*
Como p > 0.05, no se rechaza H₀.
Los datos se ajustan a la normalidad. 3. Tradicional
W = 0.79, p = 0.0073*
Como p < 0.05, se rechaza H₀.
Los datos no siguen una distribución normal en este grupo.
Dado que al menos uno de los grupos (tradicional) no es normal, en un análisis comparativo de ingresos entre sistemas de producción no es recomendable usar ANOVA paramétrico directamente sin transformaciones previas o ajustes.
Interpretación estadística Hipótesis nula (H₀): Los datos provienen de una distribución normal.
Hipótesis alternativa (H₁): Los datos no provienen de una distribución normal. Decisión:
Con p = 0.039 < 0.05, se rechaza la hipótesis nula al nivel de significancia del 5%.
Esto significa que la variable no sigue una distribución normal en el conjunto total de datos.
El ingreso neto por hectárea no se distribuye normalmente cuando se considera a todos los productores en conjunto (p = 0.039). Esto justifica el uso de pruebas no paramétricas como Kruskal–Wallis para comparar sistemas de producción, en lugar de ANOVA paramétrico.
• Propósito: Compara las medianas de dos grupos independientes. • Equivalente paramétrico: Prueba t de Student para muestras independientes. • Uso: Se utiliza para determinar si existe una diferencia significativa entre dos grupos cuando los datos no son normales o son ordinales. Por ejemplo, para comparar los puntajes de dos grupos de estudiantes que recibieron diferentes métodos de enseñanza.
• Propósito: Compara las medianas de dos grupos independientes. • Equivalente paramétrico: Prueba t de Student para muestras independientes. • Uso: Se utiliza para determinar si existe una diferencia significativa entre dos grupos cuando los datos no son normales o son ordinales. Por ejemplo, para comparar los puntajes de dos grupos de estudiantes que recibieron diferentes métodos de enseñanza.
La correlación de Spearman: ✔ Puede aplicarse a: Variables ordinales (su uso más clásico) Variables cuantitativas (de intervalo o razón) que NO cumplen normalidad Variables cuantitativas con relaciones no lineales pero monótonas Datos con rangos, empates, asimetría o valores atípicos ❌ No es obligatorio que las variables sean ordinales. Lo obligatorio es que se puedan ordenar, porque Spearman trabaja con rangos.
• Propósito: Compara las medianas de dos muestras relacionadas o emparejadas. Es decir, se utiliza cuando tienes mediciones de la misma variable para los mismos sujetos antes y después de un evento o intervención. • Equivalente paramétrico: Prueba t de Student para muestras emparejadas. • Ejemplo de uso: Para evaluar si hay una diferencia significativa en el rendimiento de los atletas antes y después de un nuevo programa de entrenamiento.
Con estos datos tan pequeños:
Hay 2 personas que mejoran, 1 que empeora y 2 que no cambian.
Aunque parece que la mayoría mejora, estadísticamente no es suficiente evidencia para concluir que el taller aumenta el conocimiento (según la prueba de signos con α = 0.05). En otras palabras: con solo 3 observaciones útiles, este patrón puede ocurrir “por azar” con mucha facilidad (50% de probabilidad).
• Propósito: Mide la fuerza y la dirección de la asociación entre dos variables ordinales o de clasificación. No asume una relación lineal. • Equivalente paramétrico: Coeficiente de correlación de Pearson. • Uso: Para determinar la relación entre el orden de llegada en una carrera y el número de horas de entrenamiento de los participantes.
• Propósito: Compara las medianas de dos muestras relacionadas o emparejadas. Es decir, se utiliza cuando tienes mediciones de la misma variable para los mismos sujetos antes y después de un evento o intervención. • Equivalente paramétrico: Prueba t de Student para muestras emparejadas. • Uso: Para evaluar si hay una diferencia significativa en el rendimiento de los atletas antes y después de un nuevo programa de entrenamiento.
• Propósito: Es una extensión de la prueba de Mann-Whitney y se utiliza para comparar las medianas de tres o más grupos independientes. • Equivalente paramétrico: ANOVA de un factor. • Uso: Ideal para analizar si hay diferencias en los puntajes de satisfacción de clientes de tres o más tiendas diferentes, donde los datos no siguen una distribución normal.
• Propósito: Es una extensión de la prueba de Mann-Whitney y se utiliza para comparar las medianas de tres o más grupos independientes. • Equivalente paramétrico: ANOVA de un factor. • Uso: Ideal para analizar si hay diferencias en los puntajes de satisfacción de clientes de tres o más tiendas diferentes, donde los datos no siguen una distribución normal.
• Propósito: Mide la fuerza y la dirección de la asociación entre dos variables ordinales o de clasificación. No asume una relación lineal, solo monótona. • Equivalente paramétrico: Coeficiente de correlación de Pearson. • Uso: Para determinar la relación entre el orden de llegada en una carrera y el número de horas de entrenamiento de los participantes.
• Propósito: Es una extensión de la prueba de Mann-Whitney y se utiliza para comparar las medianas de tres o más grupos independientes. • Equivalente paramétrico: ANOVA de un factor. • Uso: Ideal para analizar si hay diferencias en los puntajes de satisfacción de clientes de tres o más tiendas diferentes, donde los datos no siguen una distribución normal.
Interpretación comparativa
Existe un gradiente claro en los ingresos:
Agroecológico > Tecnificado > Tradicional. Las diferencias entre medianas son amplias (más de 12,000 Lps/ha entre agroecológico y tradicional). El sistema agroecológico muestra mayor capacidad de generar ingresos netos, aunque con una dispersión amplia (lo cual coincide con la desviación estándar alta que viste antes). El tradicional es el de menor rendimiento, reflejando limitaciones en productividad y competitividad.
• Propósito: Es una extensión de la prueba de Mann-Whitney y se utiliza para comparar las medianas de tres o más grupos independientes. • Equivalente paramétrico: ANOVA de un factor. • Uso: Ideal para analizar si hay diferencias en los puntajes de satisfacción de clientes de tres o más tiendas diferentes, donde los datos no siguen una distribución normal.
• Propósito: Es una extensión de la prueba de Mann-Whitney y se utiliza para comparar las medianas de tres o más grupos independientes. • Equivalente paramétrico: ANOVA de un factor. • Uso: Ideal para analizar si hay diferencias en los puntajes de satisfacción de clientes de tres o más tiendas diferentes, donde los datos no siguen una distribución normal.
Interpretación estadísticaHipótesis nula (H₀): No existen diferencias significativas en el ingreso neto/ha entre los tres sistemas de producción. Hipótesis alternativa (H₁): Al menos un sistema de producción difiere en ingreso neto/ha respecto a los demás. Decisión:
Con p = 0.0515 y un nivel de significancia tradicional de 0.05, no se rechaza H₀ (está muy cerca del umbral).
Esto significa que no hay evidencia estadísticamente suficiente para afirmar que los ingresos difieren entre sistemas de producción.
Interpretación estadísticaHipótesis nula (H₀): No existen diferencias significativas en el ingreso neto/ha entre los tres sistemas de producción. Hipótesis alternativa (H₁): Al menos un sistema de producción difiere en ingreso neto/ha respecto a los demás. Decisión:
Con p = 0.0515 y un nivel de significancia tradicional de 0.05, no se rechaza H₀ (está muy cerca del umbral).
Esto significa que no hay evidencia estadísticamente suficiente para afirmar que los ingresos difieren entre sistemas de producción.
Para verificar si tus datos son normales, usa pruebas estadísticas como: 1. Prueba de Shapiro–Wilk (recomendada) Cuándo usar: • Muestras pequeñas o moderadas (n < 50, hasta n=2000). • Mejor para detectar desviaciones. Cómo hacerla: Paso 1: Hipótesis • H0: datos normales. • H1: datos no normales. Paso 2: Calcular W (software) Paso 3: Revisar p-valor • p > 0.05 → No rechazar H0 → datos normales. • p ≤ 0.05 → rechazar H0 → datos no normales. Ejemplo: W=0.95, p=0.18 Interpretación: p=0.18 > 0.05 → datos normales. 2. Prueba Kolmogorov–Smirnov (K–S) con corrección de Lilliefors Cuándo usar: • Muestras grandes (n ≥ 50). • Menos potente que Shapiro–Wilk. Interpretación: • p > 0.05 → normal • p ≤ 0.05 → no normal 3. Visuales (no pruebas, ayudan) 📌 Histograma con curva normal: forma de campana. 📌 Q–Q: puntos cerca de línea → normalidad; desviaciones → no normal. 📌 Boxplot: valores atípicos indican no normalidad. ¿Qué prueba usar según tamaño de muestra? Tamaño de muestra Prueba recomendada n < 50 Shapiro–Wilk 50 ≤ n ≤ 2000 Shapiro–Wilk o Kolmogorov–Smirnov n > 2000 K–S (Shapiro demasiado sensible)
METODOS NO PARAMÉTRICOS
Adelfa Patricia Colo
Created on August 22, 2025
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Essential Business Proposal
View
Project Roadmap Timeline
View
Step-by-Step Timeline: How to Develop an Idea
View
Artificial Intelligence History Timeline
View
Mobile Phone Call
View
Momentum: Onboarding Escape Game
View
Momentum: Manager Guide
Explore all templates
Transcript
Métodos de análisis en estadística
No Paramétricos
Paramétricos
Prueba de normalidad
Cuándo usar métodos no paramétricos
Datos no normales
Datos ordinales o nominales
Presencia de valores atípicos (outliers)
22 23 100 21 24
Los métodos no paramétricos más utilizados y su equivalente paramétrico
Prueba de rangos con signo de Wilcoxon
Prueba de la U de Mann-Whitney
2 grupos
El mismo grupo 2 veces
Prueba de Kruskal-Wallis
Coeficiente de correlación de Spearman ρ (rho)
3 ó más grupos
Prueba de la U de Mann-Whitney
Una investigadora desea comparar la satisfacción con el servicio de agua potable entre dos comunidades. La satisfacción se midió en escala Likert (1 a 5). Analiza si existe diferencia significativa.
Datos: Comunidad A: 5, 4, 4, 3, 5 Comunidad B: 2, 3, 2, 1, 3
a) Ordena los datos y asígnales rangos. b) Calcula la suma de rangos de cada grupo. c) Calcula el estadístico U. d) Interpreta los resultados.
Prueba de Kruskal-Wallis
Pregunta de investigación: ¿El ingreso neto por hectárea (L/ha) difiere entre sistemas de producción Tradicional, Tecnificado y Agroecológico? Motivo para usar no paramétricos: los ingresos suelen ser asimétricos (colas largas, outliers), violando normalidad/homocedasticidad. Kruskal–Wallis compara medianas entre >2 grupos sin asumir normalidad.
Prueba de Kruskal-Wallis
Se midió la percepción de riesgo de inundación (escala Likert 1 a 5) en tres comunidades.
Datos: Boca del Toro: 4, 5, 4, 3Salado Barra: 2, 3, 2, 1 Río Viejo: 3, 3, 2, 4
a) Ordena todos los datos y asigna rangos. b) Calcula los rangos promedio por grupo. c) Aplica la fórmula de Kruskal-Wallis. d) Con base en el resultado, determina si existen diferencias entre las comunidades.
Prueba de rangos con signo de Wilcoxon
Se evaluó a cinco personas antes y después de un taller sobre servicios ecosistémicos. Código: 1 = sí sabe, 0 = no sabe.
Datos: Persona 1: Antes 0 – Después 1 Persona 2: Antes 1 – Después 1 Persona 3: Antes 0 – Después 0 Persona 4: Antes 0 – Después 1 Persona 5: Antes 1 – Después 0
a) Determina los signos (+, –, =). b) Excluye los casos sin cambio. c) Calcula cuántos aumentos y cuántas disminuciones hay. d) Evalúa si el taller tuvo un efecto positivo.
Coeficiente de correlación de Spearman
Un docente quiere analizar si existe relación entre las horas de estudio y la nota final de un grupo de estudiantes.
Datos: Horas: 2, 4, 4, 7, 10 Notas: 60, 65, 70, 68, 90
a) Convierte los datos a rangos. b) Calcula la diferencia entre rangos. c) Aplica la fórmula de Spearman. d) Interpreta si la relación es positiva, negativa o nula.
Shapiro–Wilk (modificado) aplicado al ingreso neto por hectárea en los tres sistemas de producción.
1. Agroecológico W = 0.89, p = 0.2310* Como p > 0.05, no se rechaza H₀. Los datos pueden considerarse normales. 2. Tecnificado W = 0.91, p = 0.3954* Como p > 0.05, no se rechaza H₀. Los datos se ajustan a la normalidad. 3. Tradicional W = 0.79, p = 0.0073* Como p < 0.05, se rechaza H₀. Los datos no siguen una distribución normal en este grupo.
Dado que al menos uno de los grupos (tradicional) no es normal, en un análisis comparativo de ingresos entre sistemas de producción no es recomendable usar ANOVA paramétrico directamente sin transformaciones previas o ajustes.
Interpretación estadística Hipótesis nula (H₀): Los datos provienen de una distribución normal. Hipótesis alternativa (H₁): Los datos no provienen de una distribución normal. Decisión: Con p = 0.039 < 0.05, se rechaza la hipótesis nula al nivel de significancia del 5%. Esto significa que la variable no sigue una distribución normal en el conjunto total de datos.
El ingreso neto por hectárea no se distribuye normalmente cuando se considera a todos los productores en conjunto (p = 0.039). Esto justifica el uso de pruebas no paramétricas como Kruskal–Wallis para comparar sistemas de producción, en lugar de ANOVA paramétrico.
• Propósito: Compara las medianas de dos grupos independientes. • Equivalente paramétrico: Prueba t de Student para muestras independientes. • Uso: Se utiliza para determinar si existe una diferencia significativa entre dos grupos cuando los datos no son normales o son ordinales. Por ejemplo, para comparar los puntajes de dos grupos de estudiantes que recibieron diferentes métodos de enseñanza.
• Propósito: Compara las medianas de dos grupos independientes. • Equivalente paramétrico: Prueba t de Student para muestras independientes. • Uso: Se utiliza para determinar si existe una diferencia significativa entre dos grupos cuando los datos no son normales o son ordinales. Por ejemplo, para comparar los puntajes de dos grupos de estudiantes que recibieron diferentes métodos de enseñanza.
La correlación de Spearman: ✔ Puede aplicarse a: Variables ordinales (su uso más clásico) Variables cuantitativas (de intervalo o razón) que NO cumplen normalidad Variables cuantitativas con relaciones no lineales pero monótonas Datos con rangos, empates, asimetría o valores atípicos ❌ No es obligatorio que las variables sean ordinales. Lo obligatorio es que se puedan ordenar, porque Spearman trabaja con rangos.
• Propósito: Compara las medianas de dos muestras relacionadas o emparejadas. Es decir, se utiliza cuando tienes mediciones de la misma variable para los mismos sujetos antes y después de un evento o intervención. • Equivalente paramétrico: Prueba t de Student para muestras emparejadas. • Ejemplo de uso: Para evaluar si hay una diferencia significativa en el rendimiento de los atletas antes y después de un nuevo programa de entrenamiento.
Con estos datos tan pequeños: Hay 2 personas que mejoran, 1 que empeora y 2 que no cambian. Aunque parece que la mayoría mejora, estadísticamente no es suficiente evidencia para concluir que el taller aumenta el conocimiento (según la prueba de signos con α = 0.05). En otras palabras: con solo 3 observaciones útiles, este patrón puede ocurrir “por azar” con mucha facilidad (50% de probabilidad).
• Propósito: Mide la fuerza y la dirección de la asociación entre dos variables ordinales o de clasificación. No asume una relación lineal. • Equivalente paramétrico: Coeficiente de correlación de Pearson. • Uso: Para determinar la relación entre el orden de llegada en una carrera y el número de horas de entrenamiento de los participantes.
• Propósito: Compara las medianas de dos muestras relacionadas o emparejadas. Es decir, se utiliza cuando tienes mediciones de la misma variable para los mismos sujetos antes y después de un evento o intervención. • Equivalente paramétrico: Prueba t de Student para muestras emparejadas. • Uso: Para evaluar si hay una diferencia significativa en el rendimiento de los atletas antes y después de un nuevo programa de entrenamiento.
• Propósito: Es una extensión de la prueba de Mann-Whitney y se utiliza para comparar las medianas de tres o más grupos independientes. • Equivalente paramétrico: ANOVA de un factor. • Uso: Ideal para analizar si hay diferencias en los puntajes de satisfacción de clientes de tres o más tiendas diferentes, donde los datos no siguen una distribución normal.
• Propósito: Es una extensión de la prueba de Mann-Whitney y se utiliza para comparar las medianas de tres o más grupos independientes. • Equivalente paramétrico: ANOVA de un factor. • Uso: Ideal para analizar si hay diferencias en los puntajes de satisfacción de clientes de tres o más tiendas diferentes, donde los datos no siguen una distribución normal.
• Propósito: Mide la fuerza y la dirección de la asociación entre dos variables ordinales o de clasificación. No asume una relación lineal, solo monótona. • Equivalente paramétrico: Coeficiente de correlación de Pearson. • Uso: Para determinar la relación entre el orden de llegada en una carrera y el número de horas de entrenamiento de los participantes.
• Propósito: Es una extensión de la prueba de Mann-Whitney y se utiliza para comparar las medianas de tres o más grupos independientes. • Equivalente paramétrico: ANOVA de un factor. • Uso: Ideal para analizar si hay diferencias en los puntajes de satisfacción de clientes de tres o más tiendas diferentes, donde los datos no siguen una distribución normal.
Interpretación comparativa Existe un gradiente claro en los ingresos: Agroecológico > Tecnificado > Tradicional. Las diferencias entre medianas son amplias (más de 12,000 Lps/ha entre agroecológico y tradicional). El sistema agroecológico muestra mayor capacidad de generar ingresos netos, aunque con una dispersión amplia (lo cual coincide con la desviación estándar alta que viste antes). El tradicional es el de menor rendimiento, reflejando limitaciones en productividad y competitividad.
• Propósito: Es una extensión de la prueba de Mann-Whitney y se utiliza para comparar las medianas de tres o más grupos independientes. • Equivalente paramétrico: ANOVA de un factor. • Uso: Ideal para analizar si hay diferencias en los puntajes de satisfacción de clientes de tres o más tiendas diferentes, donde los datos no siguen una distribución normal.
• Propósito: Es una extensión de la prueba de Mann-Whitney y se utiliza para comparar las medianas de tres o más grupos independientes. • Equivalente paramétrico: ANOVA de un factor. • Uso: Ideal para analizar si hay diferencias en los puntajes de satisfacción de clientes de tres o más tiendas diferentes, donde los datos no siguen una distribución normal.
Interpretación estadísticaHipótesis nula (H₀): No existen diferencias significativas en el ingreso neto/ha entre los tres sistemas de producción. Hipótesis alternativa (H₁): Al menos un sistema de producción difiere en ingreso neto/ha respecto a los demás. Decisión: Con p = 0.0515 y un nivel de significancia tradicional de 0.05, no se rechaza H₀ (está muy cerca del umbral). Esto significa que no hay evidencia estadísticamente suficiente para afirmar que los ingresos difieren entre sistemas de producción.
Interpretación estadísticaHipótesis nula (H₀): No existen diferencias significativas en el ingreso neto/ha entre los tres sistemas de producción. Hipótesis alternativa (H₁): Al menos un sistema de producción difiere en ingreso neto/ha respecto a los demás. Decisión: Con p = 0.0515 y un nivel de significancia tradicional de 0.05, no se rechaza H₀ (está muy cerca del umbral). Esto significa que no hay evidencia estadísticamente suficiente para afirmar que los ingresos difieren entre sistemas de producción.
Para verificar si tus datos son normales, usa pruebas estadísticas como: 1. Prueba de Shapiro–Wilk (recomendada) Cuándo usar: • Muestras pequeñas o moderadas (n < 50, hasta n=2000). • Mejor para detectar desviaciones. Cómo hacerla: Paso 1: Hipótesis • H0: datos normales. • H1: datos no normales. Paso 2: Calcular W (software) Paso 3: Revisar p-valor • p > 0.05 → No rechazar H0 → datos normales. • p ≤ 0.05 → rechazar H0 → datos no normales. Ejemplo: W=0.95, p=0.18 Interpretación: p=0.18 > 0.05 → datos normales. 2. Prueba Kolmogorov–Smirnov (K–S) con corrección de Lilliefors Cuándo usar: • Muestras grandes (n ≥ 50). • Menos potente que Shapiro–Wilk. Interpretación: • p > 0.05 → normal • p ≤ 0.05 → no normal 3. Visuales (no pruebas, ayudan) 📌 Histograma con curva normal: forma de campana. 📌 Q–Q: puntos cerca de línea → normalidad; desviaciones → no normal. 📌 Boxplot: valores atípicos indican no normalidad. ¿Qué prueba usar según tamaño de muestra? Tamaño de muestra Prueba recomendada n < 50 Shapiro–Wilk 50 ≤ n ≤ 2000 Shapiro–Wilk o Kolmogorov–Smirnov n > 2000 K–S (Shapiro demasiado sensible)