TEORÍAS DE LOS TEST
TEORÍAS DE MEDIDA
TEORÍA CLÁSICA DE LOS TESTS
El enfoque clásico es el predominante en la construcción y análisis de los tests. Teniendo sus raices en los trabajos pioneros de Spearman de principios del siglo XX.
Teoría Clasica
¿Qué propuso Spearman?
(No debe confundirse con la teoría clásica de los tests )
Propone un modelo muy simple llamado modelo lineal clásico. Consiste en asumir que la puntuación empírica (X) que una persona obtiene en un test está formada por dos componentes.
Autores
Puntuación verdadera
Parte de los trabajos de Rozeboom (1966) y Jones (1971),
Puntuación Empírica
X = V + e
Error
Características
Este modelo plantea que medir consiste en determinar cuántas unidades están presentes en el objeto medido.
Spearman propone tres supuestos
Segundo supuesto p(v, e) = O.
Primer supuesto V = E(X).
Tercer supuesto
p(e;, ex) = O
No exige la existencia de una relación empírica entre los objetos.
De igual forma Spearman concibió la definición de tests paralelos, mencionó que dos tests son paralelos siempre que sus puntuaciones verdaderas y sus varianzas de los errores de medida sean idénticas.
Mide atributos, no objetos.
Teoría de la Generalizabilidad (TG)
Es el proceso de descubrimiento de relaciones numéricas entre los valores observados en un atributo cuantitativo.
Es el proceso de descubrimiento de relaciones numéricas entre los valores observados en un atributo cuantitativo.
Limitaciones del enfoque clásico
No contempla las diferentes escalas de medida aceptadas (escalas nominales y ordinales quedan fuera)
TEORÍA DE RESPUESTA A LOS ÍTEMS (TRI)
La teoría de respuesta los ítems (TRI) surge como una respuesta a las limitaciones del enfoque clásico. Es iniciada por Rasch (1960) y Birnbaum (1968). En esta escala se plantea que la puntuación de un test depende de la relación funcional del rasgo latente y la probabilidad de acertar a este. En la TRI se toma al ítem como unidad de análisis y se modeliza directamente sobre el rasgo latente.
Teoría Representacional
Autores
Fue propuesta por Steven (1949) y Suppes (1951).
Características
Características
Curva Característica del Ítem
Los números utilizados en la
medición no representan cantidades sino relaciones
Supuestos
Medir significa asignar números para representar relaciones empíricas, aunque no exista parecido entre ambos sistemas.
Segundo
Primero
Este enfoque distingue entre un sistema relacional empírico (X), un sistema relacional numérico (R) y una aplicación de X en R
Modelos
Los tres modelos de la TRI vinculan el nivel del rasgo del evaluado con las propiedades psicométricas que describen al ítem y la probabilidad de optar entre las opciones del reactivo.
Propone 4 niveles de medición:
2.oRDINAL
1.Nominal
Modelo de Rasch
El Modelo de 2 Parámetros (ML2p)
El Modelo de 3 Parámetros (ML3p)
3.iNTERVALAR
4.dE RAZÓN
Referencias
De razón
En esta escala existe un cero absoluto con significado empírico (el cero representa la ausencia de una propiedad).
De igual forma en esta escala los números indican las cantidades reales de la propiedad medida.
Tiene todas las características de la escala de intervalo, pero en esta se presenta el cero absoluto
En esta escala todas las operaciones matemáticas son admitidas
¿Tienes una idea?
¡Que fluya la comunicación!
Con las plantillas de Genially podrás incluir recursos visuales para dejar a tu audiencia con la boca abierta. También destacar alguna frase o dato concreto que se quede grabado a fuego en la memoria de tu público e incluso embeber contenido externo que sorprenda: vídeos, fotos, audios... ¡Lo que tú quieras! ¿Necesitas más motivos para crear contenidos dinámicos? Bien: el 90% de la información que asimilamos nos llega a través de la vista y, además, retenemos un 42% más de información cuando el contenido se mueve.
- Genera experiencias con tu contenido.
- Tiene efecto WOW. Muy WOW.
- Logra que tu público recuerde el mensaje.
- Activa y sorprende a tu audiencia.
Nominal
En esta escala los objetos son equivalentes y forman parte de una misma categoría. Las categorías deben abarcar todos los objetos que incluyen y no deben estar en más de una categoría. En esta escala los números asignados a cada categoría no representan más que una etiqueta. Las únicas operaciones numéricas permitidas en este nivel son el modo, los coeficientes de contingencia y las distribuciones de frecuencia.
Ordinal
En esta escala se presenta la operación de ordenamiento, donde se habla de primero, segundo y tercero (jerarquía).Incluye la relación de equivalencia como la del orden. Además de que en esta relación no existen intervalos iguales, por ejemplo, la distancia entre 2 y 4 puede o no, ser equivalente a la distancia entre 5 y 7. Las operaciones matemáticas utilizadas son la suma y la resta.
Intervalar
En este nivel están presentes las categorías, el orden y se agrega la distancia numérica.
La distancia numérica corresponde a la distancia empírica equivalente en la variable (la distancia entre 2 y 4 es la misma que en 5 y 7). La suma y la resta son operaciones utilizadas, así como la desviación estándar, la media y el coeficiente de correlación lineal.
Primer supuesto: V = E(X).
En este supuesto la puntuación verdadera se define como la esperanza matemática de la puntuación empírica, es decir, si fuera posible que el test fuera aplicado infinidad de veces a una persona la media de estas puntuaciones daría como resultado la puntuación verdadera .
Segundo supuesto: p(v, e) = O
No existe correlación entre las puntuaciones verdaderas en un test y sus respectivos errores de medida, es decir, el tamaño de los errores no está asociado a al tamaño de las puntuaciones verdaderas, puede haber puntuaciones verdaderas altas con errores bajos y viceversa.
Tercer supuesto: p(e;, ex) = O
Establece que los errores de medida de las personas en un test no están relacionados con los errores de medida en otro test distinto. Es decir, los errores de medida de los diferentes tests son aleatorios en cada ocasión y, por lo tanto, no se espera que exista ninguna relación entre ellos.
Teoría de la Generalizabilidad (TG)
Propuesta por Cronbach y sus colaboradores (Cronbach, Gleser, Nanda y Rajaratnam, 1972). Se trata de un modelo de uso complejo, que utiliza el análisis de varianza para la mayoría de sus cálculos y estimaciones.
- Es una aproximación a la estimación de la precisión de la medida en situaciones en que las medidas están sujetas a múltiples fuentes de error
- Reconoce las múltiples fuentes de error de medida, pudiendo estimar cada una de las fuentes de error, así como sus interacciones. Con tal propósito, se requiere estimar los componentes de varianza de varias facetas utilizadas como categorías y de sus interacciones
- Nos permite conocer la precisión de una medida que se desea generalizar a cualquier tipo de observaciones a las que ésta pertenezca
Limitaciones
La primera limitación en la teoria clasica se presenta cuando las mediciones no resultan invariantes respecto al instrumento utilizado, es decir si se evalua la inteligencia de tres personas distinta con tres test diferentes los resultados no va a ser comapables, Esto es así porque los resultados de los tres tests no están en la misma escala, cada test tiene la suya propia.
La segunda era que propiedades psicométricas importantes de los tests, tales como la dificultad de los ítems, o la fiabilidad del test, estaban en función del tipo de personas utilizadas para calcularlas, lo cual resulta inadmisible desde el punto de vista de una medición rigurosa.
Curva Característica del Ítem (CCI)
Existe una relación funcional entre los valores de la variable que miden los ítems y la probabilidad de acertar a estos, denominando a dicha función Curva Característica del Ítem (CCI)
La forma de la CCI viene determinada por el valor que tomen tres parámetros: a, b y c. Siendo a el índice de discriminación del ítem, b la dificultad del ítem y c la probabilidad que hay de acertar el ítem al azar.
Postula la existencia de una relación directa entre el comportamiento de un individuo frente a un ítem y el rasgo que genera esta conducta.Vinculala probabilidad de dar una determinada respuesta a un ítem con cada nivel del rasgo latente
Referencias
Attorresi, H. F., Lozzia, G. S., Abal, F. J. P., Galibert, M. S., & Aguerri, M. E. (2009). Teoría de Respuesta al Ítem. Conceptos básicos y aplicaciones para la medición de constructos psicológicos. Revista Argentina de clínica psicológica, 18(2), 179-188.Meneses, J. (2014). Psicometría: ( ed.). Editorial UOC. https://elibro.net/es/ereader/bibliotecauveg/57600?page=53
Muñiz Fernández, J. (2010). Las teorías de los tests: teoría clásica y teoría de respuesta a los ítems. Papeles del Psicólogo: Revista del Colegio Oficial de Psicólogos.
Tornimbeni, S., Pérez, E., Olaz, F. (2008). Introducción a la psicometría. Paidós SAICF.
Teorías de medida y teorías de test
VANESA ROGELIOS TEPEPA
Created on April 12, 2024
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Mobile App Dossier
View
Color Shapes Dossier
View
Notes Dossier
View
Futuristic Tech Dossier
View
Crowdfunding Campaign
View
Company Dossier
View
Economy Dossier
Explore all templates
Transcript
TEORÍAS DE LOS TEST
TEORÍAS DE MEDIDA
TEORÍA CLÁSICA DE LOS TESTS
El enfoque clásico es el predominante en la construcción y análisis de los tests. Teniendo sus raices en los trabajos pioneros de Spearman de principios del siglo XX.
Teoría Clasica
¿Qué propuso Spearman?
(No debe confundirse con la teoría clásica de los tests )
Propone un modelo muy simple llamado modelo lineal clásico. Consiste en asumir que la puntuación empírica (X) que una persona obtiene en un test está formada por dos componentes.
Autores
Puntuación verdadera
Parte de los trabajos de Rozeboom (1966) y Jones (1971),
Puntuación Empírica
X = V + e
Error
Características
Este modelo plantea que medir consiste en determinar cuántas unidades están presentes en el objeto medido.
Spearman propone tres supuestos
Segundo supuesto p(v, e) = O.
Primer supuesto V = E(X).
Tercer supuesto p(e;, ex) = O
No exige la existencia de una relación empírica entre los objetos.
De igual forma Spearman concibió la definición de tests paralelos, mencionó que dos tests son paralelos siempre que sus puntuaciones verdaderas y sus varianzas de los errores de medida sean idénticas.
Mide atributos, no objetos.
Teoría de la Generalizabilidad (TG)
Es el proceso de descubrimiento de relaciones numéricas entre los valores observados en un atributo cuantitativo.
Es el proceso de descubrimiento de relaciones numéricas entre los valores observados en un atributo cuantitativo.
Limitaciones del enfoque clásico
No contempla las diferentes escalas de medida aceptadas (escalas nominales y ordinales quedan fuera)
TEORÍA DE RESPUESTA A LOS ÍTEMS (TRI)
La teoría de respuesta los ítems (TRI) surge como una respuesta a las limitaciones del enfoque clásico. Es iniciada por Rasch (1960) y Birnbaum (1968). En esta escala se plantea que la puntuación de un test depende de la relación funcional del rasgo latente y la probabilidad de acertar a este. En la TRI se toma al ítem como unidad de análisis y se modeliza directamente sobre el rasgo latente.
Teoría Representacional
Autores
Fue propuesta por Steven (1949) y Suppes (1951).
Características
Características
Curva Característica del Ítem
Los números utilizados en la medición no representan cantidades sino relaciones
Supuestos
Medir significa asignar números para representar relaciones empíricas, aunque no exista parecido entre ambos sistemas.
Segundo
Primero
Este enfoque distingue entre un sistema relacional empírico (X), un sistema relacional numérico (R) y una aplicación de X en R
Modelos
Los tres modelos de la TRI vinculan el nivel del rasgo del evaluado con las propiedades psicométricas que describen al ítem y la probabilidad de optar entre las opciones del reactivo.
Propone 4 niveles de medición:
2.oRDINAL
1.Nominal
Modelo de Rasch
El Modelo de 2 Parámetros (ML2p)
El Modelo de 3 Parámetros (ML3p)
3.iNTERVALAR
4.dE RAZÓN
Referencias
De razón
En esta escala existe un cero absoluto con significado empírico (el cero representa la ausencia de una propiedad). De igual forma en esta escala los números indican las cantidades reales de la propiedad medida. Tiene todas las características de la escala de intervalo, pero en esta se presenta el cero absoluto En esta escala todas las operaciones matemáticas son admitidas
¿Tienes una idea?
¡Que fluya la comunicación!
Con las plantillas de Genially podrás incluir recursos visuales para dejar a tu audiencia con la boca abierta. También destacar alguna frase o dato concreto que se quede grabado a fuego en la memoria de tu público e incluso embeber contenido externo que sorprenda: vídeos, fotos, audios... ¡Lo que tú quieras! ¿Necesitas más motivos para crear contenidos dinámicos? Bien: el 90% de la información que asimilamos nos llega a través de la vista y, además, retenemos un 42% más de información cuando el contenido se mueve.
Nominal
En esta escala los objetos son equivalentes y forman parte de una misma categoría. Las categorías deben abarcar todos los objetos que incluyen y no deben estar en más de una categoría. En esta escala los números asignados a cada categoría no representan más que una etiqueta. Las únicas operaciones numéricas permitidas en este nivel son el modo, los coeficientes de contingencia y las distribuciones de frecuencia.
Ordinal
En esta escala se presenta la operación de ordenamiento, donde se habla de primero, segundo y tercero (jerarquía).Incluye la relación de equivalencia como la del orden. Además de que en esta relación no existen intervalos iguales, por ejemplo, la distancia entre 2 y 4 puede o no, ser equivalente a la distancia entre 5 y 7. Las operaciones matemáticas utilizadas son la suma y la resta.
Intervalar
En este nivel están presentes las categorías, el orden y se agrega la distancia numérica. La distancia numérica corresponde a la distancia empírica equivalente en la variable (la distancia entre 2 y 4 es la misma que en 5 y 7). La suma y la resta son operaciones utilizadas, así como la desviación estándar, la media y el coeficiente de correlación lineal.
Primer supuesto: V = E(X).
En este supuesto la puntuación verdadera se define como la esperanza matemática de la puntuación empírica, es decir, si fuera posible que el test fuera aplicado infinidad de veces a una persona la media de estas puntuaciones daría como resultado la puntuación verdadera .
Segundo supuesto: p(v, e) = O
No existe correlación entre las puntuaciones verdaderas en un test y sus respectivos errores de medida, es decir, el tamaño de los errores no está asociado a al tamaño de las puntuaciones verdaderas, puede haber puntuaciones verdaderas altas con errores bajos y viceversa.
Tercer supuesto: p(e;, ex) = O
Establece que los errores de medida de las personas en un test no están relacionados con los errores de medida en otro test distinto. Es decir, los errores de medida de los diferentes tests son aleatorios en cada ocasión y, por lo tanto, no se espera que exista ninguna relación entre ellos.
Teoría de la Generalizabilidad (TG)
Propuesta por Cronbach y sus colaboradores (Cronbach, Gleser, Nanda y Rajaratnam, 1972). Se trata de un modelo de uso complejo, que utiliza el análisis de varianza para la mayoría de sus cálculos y estimaciones.
Limitaciones
La primera limitación en la teoria clasica se presenta cuando las mediciones no resultan invariantes respecto al instrumento utilizado, es decir si se evalua la inteligencia de tres personas distinta con tres test diferentes los resultados no va a ser comapables, Esto es así porque los resultados de los tres tests no están en la misma escala, cada test tiene la suya propia.
La segunda era que propiedades psicométricas importantes de los tests, tales como la dificultad de los ítems, o la fiabilidad del test, estaban en función del tipo de personas utilizadas para calcularlas, lo cual resulta inadmisible desde el punto de vista de una medición rigurosa.
Curva Característica del Ítem (CCI)
Existe una relación funcional entre los valores de la variable que miden los ítems y la probabilidad de acertar a estos, denominando a dicha función Curva Característica del Ítem (CCI)
La forma de la CCI viene determinada por el valor que tomen tres parámetros: a, b y c. Siendo a el índice de discriminación del ítem, b la dificultad del ítem y c la probabilidad que hay de acertar el ítem al azar.
Postula la existencia de una relación directa entre el comportamiento de un individuo frente a un ítem y el rasgo que genera esta conducta.Vinculala probabilidad de dar una determinada respuesta a un ítem con cada nivel del rasgo latente
Referencias
Attorresi, H. F., Lozzia, G. S., Abal, F. J. P., Galibert, M. S., & Aguerri, M. E. (2009). Teoría de Respuesta al Ítem. Conceptos básicos y aplicaciones para la medición de constructos psicológicos. Revista Argentina de clínica psicológica, 18(2), 179-188.Meneses, J. (2014). Psicometría: ( ed.). Editorial UOC. https://elibro.net/es/ereader/bibliotecauveg/57600?page=53 Muñiz Fernández, J. (2010). Las teorías de los tests: teoría clásica y teoría de respuesta a los ítems. Papeles del Psicólogo: Revista del Colegio Oficial de Psicólogos. Tornimbeni, S., Pérez, E., Olaz, F. (2008). Introducción a la psicometría. Paidós SAICF.