Want to create interactive content? It’s easy in Genially!

Get started free

Alpha de Cronbach

Victor Fajardo

Created on March 27, 2023

Start designing with a free template

Discover more than 1500 professional designs like these:

Practical Presentation

Smart Presentation

Essential Presentation

Akihabara Presentation

Pastel Color Presentation

Modern Presentation

Relaxing Presentation

Transcript

Análisis de confiabilidad

Alfa de cronbach Coeficiente Kr-20 Coeficiente Kr-20 corregido por dispersión índice de discriminación prueba de test re test

Es recomendable hacer análisis de confiablidad a los tests que serán aplicados

Cuando aplicamos un "test" para evaluar conocimientos y/o habilidades, es necesario conocer qué tan confiable es tu prueba (validez interna), la confiabilidad nos permitirá reconocer si un test es útil, no solo para los propósitos para los que fue hecho sino que pueda tener repetibilidad y alcances a mediano plazo (validez externa).

+ info

Validez interna y validez externa

La validez interna se refiere a que cada ítem o reactivo sea entendible y cumpla con la condición de no ser tan fácil de contestar (90-100% de respuestas acertadas) o muy difícil (<60% de respuestas acertadas).

La validez externa se refiere a un test que ya ha sido validado de manera interna y que es repetible a lo largo del tiempo o sin importar el aplicador o docente (r>0.8 y p<0.05).

+ info

01

Alfa de Cronbach

La más utilizada

Esta prueba estadística, utiliza la varianza individual (cada ítem) y del test mismo

Es decir, este índice utiliza la variación de cada respuesta con respecto al promedio (que generalmente es la respuesta acertada) y hace una relación entre la varianza de cada ítem con respecto a la varianza total del test. Nos indica que tanta variabilidad tenemos y nos permite tomar decisiones.

+ info

Esta prueba estadística, utiliza la varianza individual (cada ítem) y del test mismo

+ info

Esta prueba estadística, utiliza la varianza individual (cada ítem) y del test mismo

+ info

Esta prueba estadística, utiliza la varianza individual (cada ítem) y del test mismo

  • Es una prueba confiable
  • Se utiliza en test con variables ordinales
  • Por tanto no es recomendable para test cuyas variables son dicotómicas, es decir, una respuesta acertada y una o varias consideradas como errores o no verdaderas

+ info

02

Kr-20 o índice de Kuder Richardson

Al emplear este índice podemos calcular la confiabilidad de cada ítem y cada test cuando estos son dicotómicos

Kr-20

Evaluar un test de manera estadística nos permite conocer su calidad para depurarlo y con ello lograr validez interna o fiabilidad. También nos permite intentar la validez externa o su consitencia, es decir, que se pueda replicar en el tiempo con la misma fiabilidad.

+ info

Un ejemplo hipotético

KR(20)= 0,88

Un ejercicio real

KR(20)= 0,35

Limitante observada para el uso de Kr-20

Kr-20 parte de dos premisas importantes: 1. No debe existir dispersión de los ítems (lo cual no se logra en el ejercicio). Esto puede deberse al ítem mismo o al respondiente. 2. Hay simetría en las respuestas. Es decir, cada ítem debe ser contestado por la misma cantidad de respondientes.

+ info

03

Kr-20 corregido por la dispersión del ítem

Utiliza un ranking que se le asigna a cada pregunta dependiendo su nivel de dificultad, 1 para el más dificil hasta n para el más fácil

Un ejercicio real

KR(20)= 0,38

04

Índice de discriminación

Al calcular el alfa o coeficiente podemos calcular también el índice de discriminación de cada Ítem

>0.08

0%

Un test ideal es aquel que tenga un índice de confiabilidad alto

Cero por ciento de ítems que tengan que ser eliminados, este índice permite reconocer ítems que deban (o no) ser eliminados

Un ejercicio real

05

Prueba de test re test

Validez externa y se basa en correlaciones

Esta prueba estadística, utiliza la correlación para saber si un test tiene repetibilidad a lo largo del tiempo

+ info

Un buen test

índice de discriminación cercano a 0%

un índice de correlación superior a 0.8 y p<0.05

alfa mayor a 0.8

¿cómo estamos y qué necesitamos?

  • Tenemos bases de datos. Sin embargo, los datos muestran que las preguntas no siempre son contestadas por el mismo número de alumnos, esto dificulta el análisis.
  • Podemos tener una sub o sobreestimación del resultado dado que hay alumnos que en primera oportunidad marcan solo una opción de respuesta, aparentemente al azhar, esto debido a que se les mostrará donde hay errores y esto les ayuda para la segunda oportunidad, haciendo que la primera opción subestime y la segunda sobreestime.

¿cómo estamos y qué necesitamos?

  • Dependiendo del número de reactivos a calibrar, aplicar más de un examen homogeneo (evitando en lo posible la aleatoriedad del reactivo o que se juegue con la aleatoriedad pero que sean los mismos ítems en la primera y segunda oportunidad) que nos permita muestrear uno o más grupos, de preferencia que un solo grupo conteste dos o más exámenes. Esto para evitar el sesgo del docente.
  • Condición de visualización de respuestas:
    • Primer intento, visualizar respuesta incorrecta y no visualización de respuesta correcta.
    • Segundo intento, visualizar respuestas correctas e incorrectas.
  • Necesitamos que cuando menos entre 10 y 20 alumnos contesten el mismo reactivo (ítem) a calibrar.

¡Gracias!