¿De que elementos se compone un test?
Isaura Díaz Estrella
Created on September 3, 2024
More creations to inspire you
Transcript
¿De que elementos se compone un test?
Marcos de referencia
2. DEFINICIÓN DE LA VARIABLE MEDIDA
3. ESPECIFICACIONES
4. CONSTRUCCIÓN DE LOS ITEMS
5. EDICIÓN
Características
Para poder interpretar correctamente una puntuación de este tipo son necesarias dos fases:
- En primer lugar, el establecimiento del grupo de referencia adecuado; y,
- En segundo lugar, la transformación de la puntuación directa del sujeto en otra que indique la posición que ocupa respecto a ese grupo de referencia elegido.
CARACTERÍSTICAS
Elaboración de un test
Un test es, desde la clásica definición dada en 1890 por McKeen Cattell, un procedimiento de recogida de muestras de comportamiento de un sujeto para estimar un repertorio o inferir un constructo psicológico suficientemente sistemático como para ser repetible y comparable. (Fernández, 2013, p. 300)
Test referidos a la norma
Para su elaboración se requieren dos momentos:
- La conformación del grupo de referencia, el cual debe contar con las características de la población que el test busca medir.
- La transformación de puntuaciones directas, esto se refiere a que la puntuación que un sujeto arroja en un test le otorga una posición respecto a su grupo de referencia.
Test referidos al criterio
No comparan el rendimiento o la puntuación obtenida, sino con un criterio preestablecido diseñado para cuantificar esos valores en el test.
Propuesta de 10 pasos
6. ESTUDIOS PILOTO
7. SELECCIÓN DE OTROS INSTRUMENTOS DE MEDIDA
8. APLICACIÓN DEL TEST
9. PROPIEDADES PSICOMÉTRICAS
1. MARCO GENERAL
10. VERSIÓN FINAL DEL TEST
María Isaura Díaz Estrella
Los marcos de referencia nos ayudan a entender la puntuación directa (o en porcentaje) nos da una información de valor muy relativo. A la hora de conseguir mayor información con una puntuación, existen dos métodos de comparación básicos conocidos como «referencia al criterio» y «referencia a la norma». (Fernández, 2013, p. 129)
Cuando el marco de referencia con el que se compara para que obtenga significado es un grupo, es decir, se obtiene la posición relativa del sujeto evaluado con respecto a un grupo normativo de referencia. (Fernández, 2013, p. 130)
Son aquellas deliberadamente construidas para producir mediciones directamente interpretables en términos de un estándar de ejecución o conocimiento bien definido y especificado de antemano. (Fernández, 2013, p. 129) Este criterio de logros u objetivos a cumplir sería el marco de referencia frente al cual hay que interpretar la puntuación (información) recogida del sujeto. Así pues, el marco de referencia con el que se compara al sujeto, el criterio, es función de los logros u objetivos que pretenda el evaluador con la tarea concreta que le propone. (Fernández, 2013, p. 130)
Los test en psicología tienen una base teórica y una historia que ha ayudado a la toma de decisiones en el momento de obtener un diagnóstico y generar una intervención, ya sea con un paciente o en procesos de evaluación psicométrica diversos. (Martínez, S/F)
Un test, como señala Cronbach (citado por Fernández, 2013, p. 126), es un procedimiento sistemático para observar la conducta y describirla con la ayuda de escalas numéricas o categorías establecidas.
Se realiza la revisión exhaustiva de la literatura disponible hasta el momento de la variable que se quiere medir. Mediante esta revisión, se obtiene una definición operativa, semántica y sintáctica de la variable. La definición de la variable nos permitirá entender la interacción que tiene con otras variables, así como los posibles comportamientos encontrados en otras investigaciones. Además, delimitar las dimensiones que integran la variable estudiada, será la base para construir los items del test. (Martínez, S/F)
Aquí se definen aspectos operativos de la aplicación del test, así como las características generales del mismo.
- Número de preguntas que tendrá el test.
- Longitud, distribución, formato de respuesta y tipo de items.
- Si se requiere alguna adaptación dependiendo de la población objetivo (por ejemplo, si es para niños, procurar que el test sea visualmente atractivo y entendible para el niño).
- Tipo de administración del test.
- Material que se requiere para la aplicación.
Se construyen los bancos de ítems que deben cumplir con las siguientes características: representatividad, relevancia, diversidad, claridad, sencillez y comprensibilidad. Existen varios tipos de items, entre los que podemos mencionar: tipo Likert, opción múltiple, verdadero y falso, ensayo, entre otros. (Martínez, S/F)
Durante esta fase se obtiene la primera versión del test (impresa o digital). Este paso resulta de una importante relevancia, ya que señala la manera en que se presenta ante el evaluado. Muñiz (2018) considera que la presentación física que tenga el test (si se presenta en copias, mal engrapado, desorganizado etc.) influirá en la motivación y compromiso que tiene el evaluado al responderlo.
Como prueba referida a un criterio, un examen en el que lo que interesa es el nivel de conocimientos alcanzados por cada uno de los sujetos de modo individual. Para trabajar con referencia al criterio son útiles las puntuaciones directas y los porcentajes de respuestas dados, y lo importante en este tipo de instrumentos es la categoría de ejecución asignada al sujeto evaluado. (Fernández, 2013, p. 130)
La construcción de un instrumento de medida es un proceso complejo que continuación se concretan en 10 pasos, los cuales no son automáticos ni universales y pueden variar en función del propósito del instrumento de medida del modelo psicométrico utilizado, del tipo de respuesta exigida por los ítems, del formato de administración o del contexto de evaluación. Todo el proceso de construcción debe desarrollarse de forma rigurosa y objetiva, siguiendo unos estándares de calidad para así maximizar la validez de las inferencias hecha a partir de las puntuaciones obtenidas en la prueba por las personas evaluadas. (Downing, 2006; Lane, Raymond y Haladyna, 2016 Citados por Muñiz, 2018, 265)
Durante esta fase se identifican errores en la prueba, como redacción de los items, organización de los mismos, revisión gramatical y semántica de los items, entre otros posibles errores durante la construcción del test. Una vez concluido la fase de estudio piloto, se analizan los datos obtenidos para decidir si se eliminan, modifican o integran nuevos items, todo ello con la finalidad de mejorar la calidad métrica del test. Finalmente, se consigue una nueva versión del instrumento, mismo que tendrá que ser revisada y sustentada por un grupo de expertos y la revisión de la literatura presente. (Martínez, S/F)
A través de esta fase se integra la propuesta de aplicación de otros instrumentos que permitan una mejor interpretación de los resultados obtenidos en la prueba. (Martínez, S/F)
Durante esta fase se realiza la selección de muestra de los participantes a los que se aplicará el test. Evidentemente, al elegir la muestra esta debe tener una representatividad importante de la población objetivo, así como contar con las características de la población para las que el test está diseñado. (Martínez, S/F)
Durante esta fase se evalúan los items, se obtiene la validez y confiabilidad con la que cuenta el test y los baremos que darán un marco de referencia de los resultados arrojados por el test. Respecto a la validez y confiabilidad, a través de estos análisis se determina si el test en realidad mide lo que dice medir (validez) y los resultados son precisos y replicables (confiabilidad). (Martínez, S/F)
Tener claros los siguientes puntos:
- Cuáles son las razones por las que se está diseñando este test.
- Seleccionar la variable (atributo psicológico) que se va a medir
- Definir la población objeto a la que se va a medir
- Identificar el contexto de aplicación
- Definir si la aplicación es individual o colectiva
- Definir el propósito de las puntuaciones que arrojara el test: diagnosticar algún trastorno, identificar aptitudes, etc.) (Martínez, S/F)
Durante esta versión, se abre la posibilidad de continuar con el trabajo de validación del test en otras poblaciones e incrementar el conocimiento científico de la variable estudiada. (Martínez, S/F)
Figura 1. Fases del proceso de construcción de un test. [Fotografía], (Muñiz, 2018)
percentiles
Tipificadas o estándar
¿De que elementos se compone un test?
Puntuaciones utilizadas
Técnicas deevaluación
Ejemplo
• Escala de inteligencia Weschler. • Inventario multifacético de la personalidad (MMPI). • Escala Terman.
Ejemplo
Pruebas de conocimientos, de rendimiento, de evaluación clínica, en los que se determina la presencia de ciertos trastornos. Ejemplos concretos: la escala de depresión de Beck o la escala de riesgo suicida de Plutchik.
Existen distintos tipos de puntuaciones referidas a la norma, aunque las más usuales suelen ser los percentiles y las puntuaciones tipificadas o puntuaciones estándar.
Existen múltiples técnicas de evaluación referidas a criterios que podemos examinar en la parte cuarta de esta obra. Por ejemplo, el MMSE (MiniMental State Examination) evalúa el deterioro cognitivo y el Inventario de Depresión de Beck (Beck Depression Inventory) evalúa mediante puntuaciones criteriales distintos niveles de gravedad de la depresión. (Fernández, 2013, p. 130)
El percentil es una puntuación en términos de la posición ocupada por un sujeto en un grupo y nos indica el porcentaje del grupo al que el sujeto en cuestión sobrepasa o si obtiene puntuaciones inferiores a éste. Ejemplo: Está en el percentil 80 y en una de lectura en el 70 no puede interpretarse como que tiene mejor nivel en atención que en lectura. Podría suceder que el sujeto en cuestión tuviese mejor nivel en lectura pero que el grupo de referencia con el que se le compara fuese también muy bueno.
Las puntuaciones típicas son una transformación lineal de la puntuación directa (PD) en función de la media y desviación típica del grupo y nos indican cuánto se separa el sujeto de la media del grupo en relación con lo que se separan los demás. la puntuación directa se interpreta en relación con la media del grupo, pero tomando como unidad de medida la desviación típica de ese grupo. (Fernández, 2013, p. 131) Ejemplo: Un niño de seis años que hace bien 11 ítems en el Test de Inteligencia de Raven, o sea, que tiene una puntuación directa (PD) de 11, tendría un percentil 5, y si hubiera hecho bien 13 ítems, tendría un percentil 10.