martes, 20 de mayo de 2008

W. James Popham y la medición referida a criterios

La información que a continuación se presenta puede carecer, por momentos, de información detallada o de un vocabulario técnico-evaluativo más preciso, sin embargo debe el lector comprender que la finalidad de este escrito no es servir como fuente de estudio detallada para la comprensión de procesos evaluativos, sino como un aporte que busca, en un vocabulario para la mayoría accesible, contribuir a la formación y generación de una cultura educativa saludable.
W. James Popham (1930) fue una de las figuras principales que impulsaron y promovieron la medición referida a criterios sobre lo cual hace referencia este artículo.

La medición referida a criterios nace, en términos generales, a finales de la década de los 50 e inicio de los 60, permitiendo complementar el sistema de medición referido a una norma imperante hasta ese entonces. Una de las principales diferencias, y la más representativa quizás, entre estos dos modelos de medición es aquella que responde a la pregunta de: ¿Respecto a qué o quienes determino o valoro la actuación de un individuo (No olvidemos que la concepción actual que poseemos sobre evaluación resulta mucho más amplia que en el pasado)? En la medición referida a una norma, el individuo es comparado en relación a un grupo, buscando conocer su posición dentro de éste, mientras que la evaluación referida a criterios busca averiguar y valorar la posición de un individuo respecto a un campo definido.

El nacimiento de lo que se conoce como instrucción programada o enseñanza programada señalaba, en palabras simples, que las secuencias pedagógicas bien diseñadas, bien implementadas y bien corregidas permitirían a cualquier estudiante (o a la gran mayoría) alcanzar ciertos objetivos propuestos con antelación. Enotras palabras, promovía la idea que cualquier estudiante que fuese sometido a una secuencia pedagógica organizada y aplicada apropiadamente podía obtener buenos resultados en cuanto a su aprendizaje. Lo que ahora puede parecernos algo obvio quizás, no lo fue así para la época y provoco que fuese necesario un cambio de enfoque en cuanto a la responsabilidad de los aprendizajes y a la interpretación de los resultados. Como se señaló anteriormente, las pruebas referidas a una norma buscan posicionar la actuación de un individuo dentro de un grupo. La forma de realizar esto es diseñar instrumentos de medición (pruebas) que permitieran situar a los individuos de forma tal que pudiesen ser distribuidos de la forma más amplia posible dentro de una escala de medición. Para esto era necesario construir el instrumento de medición utilizando elementos que permitiesen una amplia distribución de los resultados dentro de la escala señalada. Los conceptos de recorrido, correlación, varianza, etc., eran de dominio frecuente en la construcción de las pruebas y, por ejemplo, si un elemento no permitía diferenciar claramente a los individuos dentro de un grupo, era entonces eliminado o bien recibía una ponderación menor. La capacidad de un elemento de diferenciar predominaba sobre el contenido a medir del elemento en cuestión. Una nueva técnica de enseñanza hacía necesaria una nueva modalidad de medición, y era eso lo que esta enseñanza programada necesitaba. ¿Cómo conocer en qué momento de esta programación se encuentra este estudiante? ¿Se encontrará apto para avanzar al siguiente nivel? Para responder a esas preguntas ya no resulta útil conocer en que lugar , respecto al grupo, se encuentra el individuo y sus aprendizajes, siendo necesario ahora conocer que tan cerca o lejos se encuentra el individuo de determinadas conductas y contenidos planteados con antelación, naciendo entonces la medición referida a criterios como una forma de describir de la mejor manera posible las actuaciones del individuo. Como consideración final podría señalarse que la medición referida a una norma busca posicionar al individuo en comparación a un grupo mientras que la medición referida a criterios persigue el describir su actuación.

Esta nueva concepción de la medición educativa ocasionó además un cambio de paradigma educativo que guarda relación con lo siguiente: Cuando se medía el desempeño de los estudiantes a través de un sistema de medición referido a normas, se buscaba distribuir a los estudiantes a lo largo de la escala de medición de una forma más o menos estándar. Sin importar la actuación de los alumnos siempre existirán individuos que estarán bajo el promedio, otro grupo más numeroso se concentrará alrededor de la media o promedio, y el resto (menos numeroso que el anterior) se situará hacia la parte alta de la escala (aquellos familiarizados con la curva de distribución normal o gaussiana sabrán a lo que me refiero). Sin importar el esfuerzo que el docente u objeto de la medición realice, el desempeño de los estudiantes será similar, habiendo un grupo con resultados insuficientes, otro grupo con resultados mediocres y un grupo final reducido con resultados excelentes, por lo que nos encontramos con que el resultado individual de cada alumno no dependerá del docente, sino que del esfuerzo individual realizado por cada alumno. Por otro lado, la medición referida a criterios no busca conocer la ubicación de un individuo dentro de un grupo, sino que conocer la ubicación del individuo en relación a un campo conductual determinado. Es posible entonces que pueda darse el caso de encontrarse en la mayoría de los estudiantes resultados insuficientes o, por el contrario, la mayoría de los alumnos poseer resultados excelentes. Lo anterior provoca que la responsabilidad del rendimiento se traspase de los estudiantes y su esfuerzo y dedicación, al profesor, siendo este el principal responsable del rendimiento de los alumnos.

Hasta el momento he intentado dejar clara la diferencia entre los dos tipos de mediciones (y si no ha sido así espero me lo haga saber), pero ¿qué ventajas nos ofrece, por ejemplo, la medición referida a criterios en comparación con la referida a una norma? Como respuesta a lo anterior podríamos dar a conocer tres ventajas (de acuerdo a la utilización) de la medición referida a criterios, en comparación con la medición referida a una norma, siendo éstas las siguientes:

1) Elementos admisibles en el instrumento de medición: Un elemento que ha sido contestado correctamente por el 90% de un grupo de estudiantes no resulta de mucha utilidad en la aplicación de un instrumento normativo (referido a normas), ya que no permite diferenciar a los estudiantes (revísense conceptos de varianza, correlación, etc.). Sin embargo esto no resulta de importancia para la aplicación de un instrumento de medición referido a criterios, lo que posibilita utilizar elementos que en una prueba referida a la norma debieran ser objetados o eliminados.

2) Utilidad para un evaluador formativo: Al no ser de carácter descriptivo la medición referida a la norma no puede entregar información sobre, por ejemplo, la efectividad de algún proceso de enseñanza determinado, haciendo que la labor de recogida de información resulte menos eficaz que a través de la utilización de un instrumento referido a criterios.

3) Responsable de la enseñanza: Si bien se señaló anteriormente, resulta importante volver a destacar la utilidad de la medición referida a criterios en este punto. En las situaciones en que se utiliza apropiadamente, la medición referida a criterios responsabiliza en mayor medida al docente respecto al resultado de los individuos. Este nuevo paradigma permite entonces que sea el docente quien promueva mejoras en cuanto a metodologías, estrategias, diseños y otros conceptos relativos a la enseñanza y sea, como ya se ha insistido, el responsable del aprendizaje de sus alumnos, ya que de todos modos se supone que es esa su función ¿o no?

¿Cuándo utilizar cada tipo de medición?
No es menor la importancia que debe otorgarse a esta pregunta, ya que una mala decisión puede generar, por ejemplo, una situación como la siguiente: Situémonos en el caso de querer medir el desempeño de un alumno y que este alumno debe rendir examen en dos ciudades o establecimientos educacionales distintos. Un alumno con desempeño regular puede resultar, aprobado por ejemplo, dentro de un grupo de bajo rendimiento (establecimiento 1), mientras que puede resultar reprobado dentro de un grupo de alto rendimiento (establecimiento 2). Con una medición referida a criterios se podría, en teoría, conocer cuánto sabe realmente el alumno sin importar con quien se contraste su rendimiento. ¿Cómo podríamos saber entonces que tipo de medición realizar? Pues la respuesta resulta bastante simple y sólo debemos preguntarnos que finalidad le daremos a la información de la medida del desempeño del individuo. Por ejemplo, si dentro de un proceso de selección de personal queremos seleccionar al candidato que mejor se desempeñe en ciertas áreas, no nos interesará tanto conocer cuánto sabe cada postulante (asumiendo que resultase posible realmente conocer cuánto sabe a través de un sistema de medición como los mostrados), sino que nos interesará saber cuál es el postulante que sabe más respecto a algo. En cambio, si nos presentamos a rendir un examen de conducir, no será tan importante para quien mida el determinar si manejamos mejor o peor que el resto de los examinados, sino que será importante para ellos saber si poseemos los conocimientos y habilidades mínimos que aseguren que podremos guiar un vehículo bajo ciertos estándares mínimos de seguridad para nosotros y para quienes nos rodean.

En estas líneas he querido desarrollar y explicar de forma sencilla, los orígenes, importancia y finalidad de los sistemas de medición señalados (referidos a normas y a criterios), con la finalidad de que el lector pueda ampliar sus conocimientos respecto a ciertos aspectos del fenómeno evaluativo, siendo ésta la orientación que debe primar, y no la de transformarse en una guía para algunos aspectos evaluativos. Para lo anterior será el lector capaz de referirse a fuentes de mayor credibilidad.


Nota: En la actualidad es posible que las concepciones puedan diferir de las señaladas acá, sin embargo en su origen o nacimiento, la clasificación y características de las mediciones acá señaladas responden, principalmente, a las características mencionadas.