Centro Virtual Cervantes

Diccionario de términos clave de ELE

Fiabilidad

La fiabilidad es una de las dos cualidades básicas que debe poseer un examen o, en general, todo instrumento de medida. La otra es la validez. El concepto designa la estabilidad que proporciona ese instrumento en la obtención de resultados. Así, por ejemplo, una prueba cuyos resultados dependen de factores no controlados —como el ruido existente en el aula de examen, el criterio del evaluador o el orden seguido en la corrección— no es una prueba fiable; por el contrario, se considera que un instrumento de medición es tanto más fiable cuanto más capaz es de reducir los errores de medición.

Existen distintos métodos para determinar el grado de fiabilidad de un examen, pero todos ellos tienen en común el hecho de comparar los resultados de la prueba, bien con otra, bien consigo misma, y expresar numéricamente, mediante el llamado coeficiente de fiabilidad, el grado en que esos dos conjuntos de resultados son coincidentes. Cuanto más alto es dicho coeficiente, es decir, cuanto mayor es el grado de coincidencia entre los dos grupos de resultados, más fiable resulta la prueba. Así, puede considerarse que, si bien los valores máximos oscilan entre -1 y +1, cuando el coeficiente es inferior a +0.30, la fiabilidad de la prueba es muy baja (los valores negativos no suelen darse); cuando alcanza +0.60, se estima aceptable; y a partir de +0.70, la fiabilidad de la prueba es alta.

 Los métodos más habituales para medir el grado de fiabilidad de las pruebas de corrección objetiva (por ejemplo, los tests de verdadero/falso o los de opción múltiple) son los siguientes:

En las pruebas de corrección subjetiva (entrevistas orales, pruebas de expresión escrita), lo que resulta relevante es comprobar el grado de fiabilidad de la corrección, y en concreto:

En todo caso, la fiabilidad de una prueba depende de varios factores, como la homogeneidad de los ítems (si todos los ítems evalúan la misma destreza, es probable que la correlación entre ellos sea más alta que si evalúan destrezas diferentes) o la propia longitud del test.

Por último, una prueba puede ser fiable sin ser válida (esto es, puede arrojar resultados consistentes aunque mida algo distinto de aquello que pretende medir), pero no puede ser válida si no es fiable (puesto que no puede medir lo que pretende si no puede hacerlo de forma precisa).

Otros términos relacionados

Evaluación; DELE.

Bibliografía básica

  1. Alderson, J. C., Clapham, C. y Wall, D. (1995). Exámenes de idiomas. Elaboración y evaluación. Madrid: Cambridge Universtiy Press, 1998.

Bibliografía especializada

  1. Bachman, L. (1990). Language Testing Construction and Evaluation. Oxford: Oxford University Press. Trad. al español del cap. 4. En M. Llobera et al. (1995). Competencia comunicativa. Madrid: Edelsa.
  2. Davies, A. et al. (1999). Dictionary in Language Testing. Cambridge: Cambridge University Press.
  3. McNamara, T. (2000). Language Testing. Oxford: Oxford University Press.
Centro Virtual Cervantes © Instituto Cervantes,  . Reservados todos los derechos. cvc@cervantes.es