Confiabilidad gyGlSELLEMACA 17, 2011 16 pagos CONFIABILIDAD Definición del concepto * Decimos que el test es fiable cuando al aplicarlo dos o más veces al mismo individuo grupo en circunstancias similares obtenemos resultados análogos. Averiguar la confiabilidad de un test equivale por lo tanto, a estimar la intensidad del error inherente al mismo o, si se quiere, de su grado de imprecisión y consiste en esencia en averiguar la consistencia o estabilidad de las notas obtenidas por los mismos individuos al administrarles el mismo test o bien administrarle dos test de apariencia diferente pero que miden lo mismo y en os que sus elementos son equivalentes. La confiabilidad del test indica hasta qué punto pueden atribuirse a errores de medida las diferencias individuales en las puntuaciones del las diferencias individ estamos sometiendo * Toda medida de proporción de la vari error. 16 les cons abe atribulrlas a aracterística que enota qué iones es varianza de * La confiabilidad de un test es tanto mayor cuando más estable es el rasgo psíquico que exploremos y, por ello, los test de inteligencia y de aptitudes son en general más fiables que los test de personalidad. El tipo de relación existente entre las dos series de datos btenidos se expresa mediante un coeficiente de correlación denominado «Coeficiente de Confiabilidad». Error en Psicometría. Relación con Confiabilidad * Cualquier condición que no sea afín al proposito del test representa Swlpe to vlew nexr page representa una varianza de error; significa desviación de la realidad, alejarse de la exactitud. Ejemplos: mala administración de las instrucciones, hoja de tests incompletos, ruidos, etc.
Así, cuando el examinador trata de mantener uniformes las condiciones de aplicación del test, controlando ambiente, instrucciones, limites de tiempo, Rapport y otros factores imilares, está reduciendo los varianza de error, haciendo más fiables las puntuaciones. * Sin embargo, aún dándose las condiciones óptimas ningún test es un instrumento perfectamente fiable, siempre existirá la incidencia del error; lo ideal es mantener el error dentro de los márgenes razonables. Relación entre confiabilidad y error * Mayor confiabilidad Menor confiabilidad Tipos de Error Menor error Mayor error * A. Error Típico o Error Standard: es por efecto acumulativo de variables extrañas. Es un tipo de error inherente al test y esta contemplado en él. Este tipo de error no afecta a la confiabilidad suele estar especificado en el manual del test. Su efecto es el siguiente. Si la media aritmética es 100 en un test y su desvió típico es de 15. 4 15 puntos (desvió) = 115 -k 100 – 15 puntos (desvió) = 85 * Esto implica que todo puntaje que oscile entre 115 y 85 no varia el diagnóstico; esto nos habla del margen de error a tener en cuenta. Esto sirve para interpretar los resultados según rasgos, no en forma singular y aislada.
Este tipo de error no afecta la regulandad n’ la preclsión 2 OF singular y aislada. Este tipo de error no afecta la regularidad ni la precisión de la medición. * B. Error de medición o de medida: aquí se pueden discernir las vanables que pueden producir el error y este tipo de error si incide sobre la confiabilidad del test. Las fuentes de error de medida se pueden controlar, o sea, el examinador puede hacerlo. Ejemplos: falta de aclaración de las instrucciones, poca comprensión de la tarea, condiciones ambientales contraproducentes (iluminación, ventilación, horario, etc. * Este error no se puede calcular, está directamente relacionado con la responsabilidad y ética del examinador. * C. – Error maestral; ocurre cuando la muestra de la conducta es deficiente. Muestreo del Contenido del test: tiene que ver con la validez de contenido. El test no es una buena muestra de los observables del rasgo que se quiere medir:: existente muestreo defectuosos. * Muestra del universo de los sujetos: que sirvió para la elaboración de las normas o baremos. La falla estuvo en la muestra de tipificación.
Ejemplo: cuando aplicamos un test en nuestro país que fue tipificado para otro; uno de baremos inadecuados. El baremo se puede adaptar a las condiciones locales pero toma tiempo y es costoso. Este proceso se llama tipificación de un test o elaboración de baremo. Este tipo de error afecta a la onfiabilidad d. * D. – Error Típico de medición / de medida: la confiabilidad de un test se puede expresar en función del error típico de medida llamado también «error tipico de una puntuación». Esta medida se adapta particularmente bien a la interpretación de olas puntuaciones individu puntuación».
Esta medida se adapta particularmente bien a la interpretación de olas puntuaciones individuales. El error tipico de medida se puede calcular fácilmente partiendo del coeficiente de confiabilidad dado por el manual del test, mediante la siguiente fórmula: * El error típico de medida y el coeficiente de confiabilidad son videntemente dos formas alternativas de expresar la fiabilidad de un test. Al contrario que el coeficiente de confiabilidad, el error típico de medida es dependiente de la variabilidad del grupo sobre el que se calcula. Está expresado en función de las puntuaciones individuales.
Si queremos comparar la fiabllidad de distintos test, la mejor medida será el coeficiente de confiabilidad. Para interpretar las puntuaciones individuales, el error típico de medida constituye la forma más apropiada TÉCNICAS PARA MEDIR LA CONFIABILIDAD Método del test – retest El método más obvio para hallar la confiabilidad de un test onsiste en repetir en una segunda ocasión. El coeficiente de confiabilidad en este caso es simplemente la correlación entre las puntuaclones obtenidas por los mismos sujetos en las dos aplicaciones del test.
La varianza del error corresponde a las fluctuaciones en las actuaciones debidas al azar desde una sesión de prueba a otra. Estas variaciones pueden ser debidas en parte a condiciones de examen no controladas, como cambios extremos en el clima, ruidos repentinos y otras distracciones. Sin embargo hasta cierto punto, surgen de cambios en la condición misma del sujeto, como por ejemplo, enfermedad, la fatiga, tensión mocional, las preocupaciones, las exper 40F por ejemplo, enfermedad, la fatiga, tensión emocional, las preocupaciones, las experiencias recientes de naturaleza agradable o desagradable y factores análogos.
Cuando en el manual del test se indica la confiabilidad del retest debe especificarse siempre la longitud del intervalo sobre el que midió, puesto que las correlaciones del test disminuyen progresivamente a medida que el intervalo se alarga al aplicar test a niños pequeños el periodo debe ser mas que para las personas mayores puesto que las primeras edades los cambios progresivos del desarrollo son discernibles tras un periodo de un es y a un menos. Para cualquier tipo de sujeto, el intervalo entre la repetición de los test rara vez debe pasar de los 6 meses.
Cualquier cambio que se presente en la actuación relativa de los individuos en el test tras periodos de tiempos mas largos es probablemente acumulativo y progresivo mas que enteramente casual. Esta técnica, aunque aparentemente sencilla y directa, presenta dificultades al ser aplicada a la mayoría del tests psicológicos. La practica originara probablemente valores diferentes de mejoramiento en las puntuaciones del retest de varios sujetos. Además, si el intervalo entre los tests es bastante cortos, los ujetos recordaran muchas de sus primeras respuestas, al intervenir la memoria.
De esta manera, las puntuaciones en las dos aplicaciones del no se obtienen independientemente, y la correlación entre ellas seria falsamente alta. Además, no siempre es fácil disponer en dos oportunidades de los mismos sujetos testados Método de las formas paralelas * Consiste en construir dos o mas tests paralelas, es dec s OF * Consiste en construir dos o mas tests paralelas, es decir equivalentes. Para ello se utilizan cuestiones de naturaleza y dificultad analogas pero de apariencia distinta.
En principio dos eries equivalentes deben tener el mismo numero de Iterns ; estos deben ser de dificultad análoga, deben medir lo mismo las instrucciones ,tiempos limites de administración, ejemplos y otros aspectos de cada uno de los tests, tienen que ser equiparables. Varios test de inteligencia y aptitudes como los -«Culture free», el «Terman – Merril «, las » Escalas Wechsler – Bellevue la «Escala de Memoria», de Wechsler, el ‘test de retencion visal» de Benton, y otros mas, disponen de series paralelas.
Una vez demostrada la equivalencia de las dos formas, se aplican ambas, una inmediatamente despues de la otra, al mismo rupo de sujetos y la correlación ente dos series de puntuaciones será el conficiente de confiabilidad del test ; las diferencias obtenidas estaran producidas en su mayor parte por los fallos que existen por la semejanza o equivalencia de los Ítems, a parte de la influencia que puede ejercer los errores muéstrales * Si los test se aplican con un intervalo de tiempo, el coeficiente ya no sera solo equivalencia de ítems, si no también de estabilidad temporal. La desventaja de este método consiste en que suele exigir una considerable cantidad de trabajo preparatorio. pero resulta ?til en aquellos casos en que interesa hacer un retest orillando los inconvenientes del aprendizaje o las posibilidades del fraude. Por ejemplo, cuando dos grupos de persona que puede establec 6 OF posibilidades del fraude. Por ejemplo, cuando dos grupos de persona que puede establecer contactos ente si a de pasar el mismo test de diferentes dias, como sucede a menudo en las pruebas de ingreso en ciertos centro de enseñanza o en los exámenes de conocimiento.
También tiene sus limitaciones : si el contenido del test esta muy sujeto al aprendizaje, el uso de formas paralelas lo reproducirá mas que el test – etest, pero no lo elimara po completo, puesto que los principios de resolución serán en esencia muy parecidos. Método de divisiones en mitades * Este test consiste generalmente en hacer una sola aplicación del test y una vez que se han obtenido las respuestas, divldir los elementos del test en dos partes equivalentes, puntuar las por separado y calcular su correlación. Como es lógico, una previa condición para aplicar este método es que las dos partes en que vayamos a dividir el test sean verdaderamente equivalentes. Para ello es necesario que de antemano conozcamos la dificultad de cada uno de los items. El Procedimiento será correcto excepto par aquellos tests que sean de excesiva longitud y exijan un esfuerzo prolongado de atención, ya que en tale casos, probablemente la segunda mltad del de test podría dar unas notas algo mas bajas a consecuencia de la fatiga. Un procedimiento adecuado para este fin ed el de hallar las puntuaciones de los elementos pares e impares de test. Si los elementos estaban originariamente dispuestos en orden de dificultad crecimiento, esta división proporciona puntuaciones muy aproximadamente equivalentes de las mitades. Una vez obtenidas las dos puntuaciones m untuaciones muy aproximadamente equivalentes de las mitades. Una vez obtenidas las dos puntuaciones militares para cada sujeto, de pueden correlacionar siguiendo el método usual. Sin embargo, debe advertlrse que lo que da, en realidad, dicha correlación es la confiabilidad de una mitad solo de test.
Este tipo de coeficiencia de confiabilidad de denomina en ocasiones coeficiente de consistente interna Rulon * Rulon (1939) elaboro un método abreviado para descubrir la fiabilidad de la división en mitades. Se necesita solamente la varianza de las diferencias entre las puntuaciones de ada persona en las dos mitades del test y la varianza de las puntuaclones totales; estos dos valores se aplican la siguiente Método Kuder – Richardson * Otro método para la hallar la confiabilidad de un test, también con una sola aplicación de una sola forma, se basa en la consistencia de las respuestas de los sujetos a todos los elementos.
Esta consistencia entre los elementos se halla influida por dos fuentes de varianza de error: 1 Muestreo de contenido (como en la forma equivalente y la confiabilidad de la división en mitades) ‘k 2. – La heterogeneidad del área examinada. Cuando ás homogénea sea, más alta será la consistencia entre los elementos. Si por ejemplo: un test incluye solamente elementos de multiplicación, mientras que el otro comprende elementos de adición, sustraccion, multiplicación y división, el primero probablemente mostrará más consistencia entre los elementos que el segundo.
Este último test, más heterogéneo, un sujeto puede tener mejor actuación en la resta que las demás operaciones más heterogéneo, un sujeto puede tener mejor actuación en la resta que las demás operaciones aritmética; otro puede puntuar relativamente bien en los elementos de división, ero más pobremente en los de adición y multiplicación y asi sucesivamente. Un problema importante relacionado con esto si el criterio que el trata de predecir es a su vez relativamente homogéneo o heterogéneo.
Aunque los test homogéneos son preferibles porque su puntuaciones permiten una interpretación bastante inequívoca, obviamente un solo test homogéneo no es un instrumento adecuado para la predicción de un criterio muy heterogéneo. Los test de inteligencia tradicional nos suministran un buen ejemplo de tests heterogéneos destinados a predecir un criterio heterogéneo. En este caso, sin embargo pudo ser referible elaborar varios tests relativamente homogéneos y cada uno mida fase distinta del criterio heterogéneo. El procedimiento más comun para hallar la consistencia entre los elementos es el desarrollado por Kuder Richardson (1937). Como en los métodos de división en mitades, la consistencia entre los elementos se halla partiendo de una aplicación única de un solo test. Sin embargo esta técnica, en lugar de basarse en el requisito de dos puntuaciones mltades, lo hace en un examen de la ejecución de cada elemento.
De las varias formulas ideadas por Kuder y Richardson, la aplicación más amplía, conocida eneralmente como la formula 20 de Kudery Richardson, es la siguiente: * En esta formula, r es el coeficiente de confiabilidad de la totalidad del test, n, el numero de elementos y *, es la desviación de las puntuaciones totales. El único test, n, el numero de elementos y *, es la desviación de las puntuaciones totales. El único termino nuevo es la fórmula de Ep. , se halla tabulando la proporción de personas que resuelven (P) cada elemento y la de las que no resuelven (q). Se calcula el producto de py q para cada elemento y se suman estos productos para todos los elementos, los que nos da Ep. q. Confiabilidad del Puntuador * Una fuente de varianza de error factible de ser controlada de manera bastante sencilla es la varianza del puntuador. Ciertos tipos de tests especialmente los de creatividad y los proyectivos de personalidad, dejan un gran margen al juicio del punutador.
La confiabilidad del puntuador puede hallarse mediante una muestra de los protocolos del test puntuados independientemente por dos examinados. Las dos puntuaciones obtenidad de esta forma por cada sujeto se correlacionan en forma corriente, el coeficiente de correlación resultante es una medida de la confiabilidad del examinador. Este tipo de confiabilidad se calcula por lo general cuando se emplean en la investigación de instrumentos putnuados subjetivamente.
Validez y confiabilidad de las medlciones de variables psicológicas * La psicometría, engloba la teoría y la construcción de pruebas, test y otros procedimientos de medición válidos y confiables. Incluye, por tanto, la elaboración y aplicación de procedimientos estadísticos que permitan determinar si una prueba o (test) es válido o no para la medición de una variable o conducta psicológica previamente definida. * Sin embargo, la medida de estos aspectos no directamente