Want to create interactive content? It’s easy in Genially!

Get started free

ANALISIS DE VARIANZA

Adelfa Patricia Colo

Created on July 11, 2024

Start designing with a free template

Discover more than 1500 professional designs like these:

Essential Business Proposal

Project Roadmap Timeline

Step-by-Step Timeline: How to Develop an Idea

Artificial Intelligence History Timeline

Mobile Phone Call

Momentum: Onboarding Escape Game

Momentum: Manager Guide

Transcript

Análisis de Varianza (ANOVA)

Licda. Adelfa Patricia Colón García

Es una técnica estadística que se usa para comparar tres o más grupos y saber si hay diferencias reales entre ellos.

¿Para qué sirve? Para responder preguntas como: “¿Los estudiantes de tres centros universitarios diferentes tienen promedios similares o hay alguno mejor que los otros?”

¿Cómo lo hace? ANOVA compara dos tipos de variación: Variación entre los grupos → ¿Qué tan diferentes son los promedios de los grupos? Variación dentro de los grupos → ¿Qué tan diferentes son los datos dentro de cada grupo?

¿Qué pasa si hay más variación entre grupos que dentro de ellos? Entonces es probable que haya una diferencia real entre los grupos. Si no, puede que las diferencias se deban al azar.

Resultado final ANOVA da un valor llamado "valor p": Si p < 0.05 → Hay diferencias significativas entre los grupos. Si p ≥ 0.05 → No hay evidencia de diferencias.

Al aplicar ANOVA de un factor se calcula un estadístico o test denominado F y su significación. El estadístico F o F-test (se llama F en honor al estadístico Ronald Fisher) se obtiene al estimar la variación de las medias entre los grupos de la variable independiente y dividirla por la estimación de la variación de las medias dentro de los grupos. El cálculo del estadístico F es algo complejo de entender, pero lo que hace es dividir la variación entre los grupos por la variación dentro de los grupos.

Si las medias entre los grupos varían mucho y la media dentro de un grupo varía poco, es decir, los grupos son heterogéneos entre ellos y similares internamente, el valor de F será más alto, y, por tanto, las variables estarán relacionadas. En conclusión, cuanto más difieren las medias de la variable dependiente entre los grupos de la variable independiente, más alto será el valor de F. Si hacemos varios análisis de ANOVA de un factor, aquel con F más alto indicará que hay más diferencias y, por tanto, una relación más fuerte entre las variables.

Usamos ANOVA de un factor cuando queremos saber si las medias de una variable son diferentes entre los niveles o grupos de otra variable. Por ejemplo, si comparamos el número de hijos entre los grupos o niveles de clase social: los que son clase baja, clase trabajadora, clase media-baja, clase media-alta y clase alta. Es decir, vamos a comprobar mediante ANOVA si la variable “número de hijos” está relacionada con la variable “clase social”. Concretamente, se analizará si el promedio del número de hijos varía según el nivel de clase social a la que pertenece la persona.

En ANOVA de un factor solo se relacionan dos variables: una variable dependiente (o a explicar) y una variable independiente (que en esta técnica se suele llamar factor) La variable dependiente es cuantitativa (escalar) y la variable independiente es categórica (nominal u ordinal). Se pide que las variables sigan la distribución normal, aunque como siempre esto es difícil de cumplir en investigaciones sociales. También que las varianzas (es decir, las desviaciones típicas al cuadrado) de cada grupo de la variable independiente sean similiares (fenómeno que se conoce como homocedasticidad). Aunque esto es lo ideal, en la realidad cuesta cumplir, e igualmente se puede aplicar ANOVA

ANOVA de un factor compara las medias de la variable dependiente entre los grupos o categorías de la variable independiente. Por ejemplo, comparamos las medias de la variable “Número de hijos” según los grupos o categorías de la variable “Clase social”. Si las medias de la variable dependiente son iguales en cada grupo o categoría de la variable independiente, los grupos no difieren en la variable dependiente, y por tanto no hay relación entre las variables. En cambio, y siguiendo con el ejemplo, si las medias del número de hijos son diferentes entre los niveles de la clase social es que las variables están relacionadas.

¿Cómo se interpreta el test de F y la significación?

La significación de F se interpretará como la probabilidad de que este valor de F se deba al azar. Siguiendo un nivel de confianza del 95%, el más utilizado en ciencias sociales, cuando la significación de F sea menor de 0,05 es que las dos variables están relacionadas.

Hemos de analizar e interpretar al aplicar ANOVA de un factor: Significación o nivel de significancia: si es menor de 0,05 es que las dos variables están relacionadas y por tanto que hay diferencias significativas entre los grupos. Valor de F: cuanto más alto sea F, más están relacionadas las variables, lo que significa que las medias de la variable dependiente difieren o varían mucho entre los grupos de la variable independiente.

Ejemplo de ANOVA de un factor

Quiero averiguar si el número de hijos varían según el nivel educativo. Para ello comparo las medias de números de hijos entre los diversos niveles educativos: sin estudios, primarios, secundarios y universitarios. Utilizaré los datos de la Encuesta Mundial de Valores realizada entre 2010 y 2014 en 58 países del mundo. En SPSS realizaré una comparación de medias y ANOVA de un factor. Análisis > Comparar medias > ANOVA de un factor

Para obtener la comparación de medias y las desviaciones típicas, nos dirigimos a Opciones y marcamos la opción de Descriptivos

El resultado es el siguiente: En la tercera columna se observan las medias para cada grupo de clase social. Si nos fijamos en las medias del número de hijos en cada grupo de clase social, podemos observar que a medida que aumenta la clase social desciende la media del número de hijos. Las personas de clase baja (lower class) tienen de media 2,18 hijos, las de clase trabajadora (working class) 1,88 hijos, las de clase media-baja (lower middle class) 1,78, las de clase media alta 1,70 hijos y las de clase alta (upper class) tienen de media 1,69 hijos.

El valor de F es 137,477 y la significación es 0,000. Al ser la significación menor de 0,05 es que las diferencias de media de hijos entre los grupos de la clase social son significativas. Aunque aparentemente podamos pensar que las diferencias no son exageradas, la decisión de si las diferencias son significativas no depende de nuestro criterio, sino de la significación de F. Este es el objetivo de aplicar ANOVA de un factor: valorar estadísticamente si las diferencias de medias son significativas o no.

ANOVA de un factor se utiliza muchísimo en las ciencias sociales. Es muy popular en psicología y en análisis comparativo para poder saber si las diferencias de un grupo respecto a otro son significativas y qué fortaleza tienen. A la hora de presentar ANOVA en un informe, artículo de investigación o tesis, se debe presentar la tabla de las medias y desviaciones típicas, y seguidamente el estadístico F y su significación. Sin ANOVA de un factor, las diferencias entre un grupo y otro quedarían a juicio subjetivo del observador, y donde una persona ve diferencias otra quizás no las vería. Es mejor usar la estadística para saber si hay similitud o diferencia entre los grupos.

¿Qué limitaciones hay que tener en cuenta? El ANOVA de un factor sólo puede utilizarse cuando se investiga un solo factor y una sola variable dependiente. Cuando se comparan las medias de tres o más grupos, puede indicar si al menos un par de medias es significativamente diferente, pero no puede indicar qué par. También requiere que la variable dependiente esté distribuida de manera normal en cada uno de los grupos y que la variabilidad dentro de cada grupo sea similar en todos los grupos.

Grados de libertad (GL) Cada suma de cuadrados lleva asociada una cantidad llamada grados de libertad (GL). Los grados de libertad indican el número de datos independientes utilizados para calcular cada suma de cuadrados. En un diseño de un factor con un factor de k niveles (en nuestro ejemplo, cinco lotes) y un total de N observaciones (cinco tarros por lote, 25 en total), los grados de libertad se calculan del siguiente modo:

Media de los cuadrados (MC) y razón F Dividimos cada suma de los cuadrados por los grados de libertad correspondientes para obtener medias de los cuadrados. Cuando la hipótesis nula es verdadera (esto es, las medias son iguales), tanto MC (Factor) como MC (Error) son estimaciones de la variación del error y tienen aproximadamente el mismo tamaño. Su razón, o la razón F, estaría cerca de uno. Cuando la hipótesis nula no es verdadera, MC (Factor) es mayor que MC (Error) y la razón es mayor que 1. En nuestro ejemplo de pruebas con adhesivo, la razón F calculada, 6.90, aporta una evidencia significativa en contra de la hipótesis nula de que las medias son iguales.

EN EXCEL

Se compararon tres métodos de capacitaci n para ver si los empleados tienen una mayor productividad después de capacitarse. Los datos que se presentan a continuación son medidas de la productividad de los individuos capacitados por cada método. Calcule el valor de F

https://networkianos.com/anova-de-un-factor-que-es-como-analizar/

Para calcular la Suma de Cuadrados del Error (SCE) en un ANOVA de un factor, se usa la siguiente relación: 𝑆 𝐶 𝑇 = 𝑆 𝐶 𝑇 𝑅 𝑇 + 𝑆 𝐶 𝐸 SCT=SCTRT+SCE Donde: SCT = Suma de Cuadrados Total = 1,676.2 SCTRT = Suma de Cuadrados del Tratamiento (entre grupos) = 435.56 SCE = Suma de Cuadrados del Error (dentro de los grupos) = ¿? Paso 1: Reorganizar la fórmula: 𝑆 𝐶 𝐸 = 𝑆 𝐶 𝑇 − 𝑆 𝐶 𝑇 𝑅 𝑇 SCE=SCT−SCTRT 𝑆 𝐶 𝐸 = 1 , 676.2 − 435.56 = 1 , 240.64 SCE=1,676.2−435.56=1,240.64 ✅ Resultado final: Suma de Cuadrados del Error (SCE) = 1,240.64

Depende del nivel de significancia

Paso 1: Buscar el F crítico (Fₐ) Buscamos el valor F crítico para gl₁ = 2 y gl₂ = 30 con α = 0.05. 🔎 De una tabla F (o calculadora estadística): 𝐹c( 2 , 30 , 𝛼 = 0.05 ) ≈ 3.32 Paso 2: Comparar F calculado con F crítico F calculado ​ =5.2>F c​ =3.32 ✅ Como F calculado > F crítico, se rechaza la hipótesis nula (H₀). ✅ Conclusión: Sí, debes rechazar H₀.

Para calcular el valor de F en este caso, necesitamos realizar un análisis de varianza de un factor (ANOVA). El ANOVA nos permitirá determinar si hay diferencias significativas en la productividad entre los tres métodos de capacitación. El primer paso es calcular la suma de cuadrados total (SCT), que representa la variabilidad total en los datos. Luego, calculamos la suma de cuadrados entre grupos (SCG), que representa la variabilidad entre los grupos (métodos de capacitación). Finalmente, calculamos la suma de cuadrados dentro de los grupos (SCD), que representa la variabilidad dentro de los grupos. A partir de estos valores, podemos calcular el valor de F utilizando la siguiente fórmula: [ F = \frac{SCG / (k - 1)}{SCD / (n - k)} ] Donde: SCG es la suma de cuadrados entre grupos. SCD es la suma de cuadrados dentro de los grupos. k es el número de grupos (en este caso, 3). n es el número total de observaciones (en este caso, 18). Calculando los valores: SCT = 1188.67 SCG = 198.67 SCD = 990 Sustituyendo estos valores en la fórmula, obtenemos: [ F = \frac{198.67 / (3 - 1)}{990 / (18 - 3)} ] Simplificando la fórmula, obtenemos: [ F = \frac{99.335}{61.875} ] Finalmente, calculamos el valor de F: [ F = 1.603 ] Por lo tanto, el valor de F es 1.603.

Para tomar una decisión en un análisis de varianza (ANOVA) de un factor con 3 grupos y un nivel de significancia α = 0.05, debes comparar el valor F calculado con el valor F crítico obtenido de la tabla F de Fisher. Paso 1: Identificar los grados de libertad Dado que hay 3 grupos: Grados de libertad entre grupos (gl₁) = k - 1 = 3 - 1 = 2 Grados de libertad dentro de los grupos (gl₂) = n - k, donde n es el número total de observaciones. Este dato no lo has proporcionado, así que para una respuesta exacta se necesita conocer n. Sin embargo, puedo ilustrar el criterio de decisión: Paso 2: Regla de decisión general Si F calculado > F crítico, se rechaza H₀ (hay al menos una media diferente). Si F calculado ≤ F crítico, no se rechaza H₀ (no hay evidencia suficiente de diferencia entre medias). Paso 3: Comparar con F crítico (ejemplo) Supongamos que tienes un total de 30 observaciones, entonces: gl₁ = 2 gl₂ = 27 Buscamos el valor F crítico para (2, 27) a α = 0.05: 🔎 F crítico ≈ 3.35 Paso 4: Aplicar la regla de decisión F calculado = 3.75 F crítico ≈ 3.35 ✅ Como 3.75 > 3.35, rechazamos H₀. ✅ Conclusión: Con un F calculado de 3.75 y un α = 0.05, se rechaza la hipótesis nula si el F crítico es menor (como en el caso ilustrado). Esto sugiere que existe una diferencia significativa entre al menos dos medias de los tres grupos.