Want to create interactive content? It’s easy in Genially!
Alpha de Cronbach
Victor Fajardo
Created on March 27, 2023
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Practical Presentation
View
Smart Presentation
View
Essential Presentation
View
Akihabara Presentation
View
Pastel Color Presentation
View
Modern Presentation
View
Relaxing Presentation
Transcript
Análisis de confiabilidad
Alfa de cronbach Coeficiente Kr-20 Coeficiente Kr-20 corregido por dispersión índice de discriminación prueba de test re test
Es recomendable hacer análisis de confiablidad a los tests que serán aplicados
Cuando aplicamos un "test" para evaluar conocimientos y/o habilidades, es necesario conocer qué tan confiable es tu prueba (validez interna), la confiabilidad nos permitirá reconocer si un test es útil, no solo para los propósitos para los que fue hecho sino que pueda tener repetibilidad y alcances a mediano plazo (validez externa).
+ info
Validez interna y validez externa
La validez interna se refiere a que cada ítem o reactivo sea entendible y cumpla con la condición de no ser tan fácil de contestar (90-100% de respuestas acertadas) o muy difícil (<60% de respuestas acertadas).
La validez externa se refiere a un test que ya ha sido validado de manera interna y que es repetible a lo largo del tiempo o sin importar el aplicador o docente (r>0.8 y p<0.05).
+ info
01
Alfa de Cronbach
La más utilizada
Esta prueba estadística, utiliza la varianza individual (cada ítem) y del test mismo
Es decir, este índice utiliza la variación de cada respuesta con respecto al promedio (que generalmente es la respuesta acertada) y hace una relación entre la varianza de cada ítem con respecto a la varianza total del test. Nos indica que tanta variabilidad tenemos y nos permite tomar decisiones.
+ info
Esta prueba estadística, utiliza la varianza individual (cada ítem) y del test mismo
+ info
Esta prueba estadística, utiliza la varianza individual (cada ítem) y del test mismo
+ info
Esta prueba estadística, utiliza la varianza individual (cada ítem) y del test mismo
- Es una prueba confiable
- Se utiliza en test con variables ordinales
- Por tanto no es recomendable para test cuyas variables son dicotómicas, es decir, una respuesta acertada y una o varias consideradas como errores o no verdaderas
+ info
02
Kr-20 o índice de Kuder Richardson
Al emplear este índice podemos calcular la confiabilidad de cada ítem y cada test cuando estos son dicotómicos
Kr-20
Evaluar un test de manera estadística nos permite conocer su calidad para depurarlo y con ello lograr validez interna o fiabilidad. También nos permite intentar la validez externa o su consitencia, es decir, que se pueda replicar en el tiempo con la misma fiabilidad.
+ info
Un ejemplo hipotético
KR(20)= 0,88
Un ejercicio real
KR(20)= 0,35
Limitante observada para el uso de Kr-20
Kr-20 parte de dos premisas importantes: 1. No debe existir dispersión de los ítems (lo cual no se logra en el ejercicio). Esto puede deberse al ítem mismo o al respondiente. 2. Hay simetría en las respuestas. Es decir, cada ítem debe ser contestado por la misma cantidad de respondientes.
+ info
03
Kr-20 corregido por la dispersión del ítem
Utiliza un ranking que se le asigna a cada pregunta dependiendo su nivel de dificultad, 1 para el más dificil hasta n para el más fácil
Un ejercicio real
KR(20)= 0,38
04
Índice de discriminación
Al calcular el alfa o coeficiente podemos calcular también el índice de discriminación de cada Ítem
>0.08
0%
Un test ideal es aquel que tenga un índice de confiabilidad alto
Cero por ciento de ítems que tengan que ser eliminados, este índice permite reconocer ítems que deban (o no) ser eliminados
Un ejercicio real
05
Prueba de test re test
Validez externa y se basa en correlaciones
Esta prueba estadística, utiliza la correlación para saber si un test tiene repetibilidad a lo largo del tiempo
+ info
Un buen test
índice de discriminación cercano a 0%
un índice de correlación superior a 0.8 y p<0.05
alfa mayor a 0.8
¿cómo estamos y qué necesitamos?
- Tenemos bases de datos. Sin embargo, los datos muestran que las preguntas no siempre son contestadas por el mismo número de alumnos, esto dificulta el análisis.
- Podemos tener una sub o sobreestimación del resultado dado que hay alumnos que en primera oportunidad marcan solo una opción de respuesta, aparentemente al azhar, esto debido a que se les mostrará donde hay errores y esto les ayuda para la segunda oportunidad, haciendo que la primera opción subestime y la segunda sobreestime.
¿cómo estamos y qué necesitamos?
- Dependiendo del número de reactivos a calibrar, aplicar más de un examen homogeneo (evitando en lo posible la aleatoriedad del reactivo o que se juegue con la aleatoriedad pero que sean los mismos ítems en la primera y segunda oportunidad) que nos permita muestrear uno o más grupos, de preferencia que un solo grupo conteste dos o más exámenes. Esto para evitar el sesgo del docente.
- Condición de visualización de respuestas:
- Primer intento, visualizar respuesta incorrecta y no visualización de respuesta correcta.
- Segundo intento, visualizar respuestas correctas e incorrectas.
- Necesitamos que cuando menos entre 10 y 20 alumnos contesten el mismo reactivo (ítem) a calibrar.
¡Gracias!