Cultura Evaluativa: 2008

domingo, 19 de octubre de 2008

Evaluación en Educación Musical: Modelos cognitivos y focos de evaluación

Resumen / Abstract

La música resulta beneficiosa para el Hombre tanto en su dimensión filosófica como en su dimensión espiritual, social e intelectual, por lo que se encuentra intencionalmente integrada al currículum escolar. Por esto, los modelos de su enseñanza y aprendizaje han de ser vinculados con ciertos modelos cognitivos asociados, haciéndose deber del docente el recoger información a través de los procesos de evaluación correspondientes, permitiéndole así conocer en qué grado los alumnos han alcanzado los diversos niveles de desarrollo cognitivo esperados. El texto que a continuación se presenta da cuenta de lo anterior; de la importancia de la música para el hombre, de su vinculación al aula a través de un modelo de desarrollo musical asociado, y de algunas características esenciales para permitir llevar a cabo un proceso de evaluación exitoso en el subsector.

Palabras claves: Evaluación, Educación Musical, aprendizaje, modelo cognitivo.

Evaluación en Artes Musicales (Educación Musical): Modelos cognitivos y focos de evaluación.

Aunque para el Cardenal Newman (1915; citado en Swanwick, 1992) la música pueda ser un pasatiempo elegante y un recurso para ociosos (pero no educación), para muchos otros ésta cumple, y ha cumplido siempre, una importante función en el desarrollo de la humanidad, principalmente en torno a la conciencia humana, la expansión de ésta y, últimamente, como un arte al servicio del desarrollo de otras habilidades intelectuales. Como ejemplo de lo anterior, Swanwick (1992) señala que“la función especial [de las artes] consiste en reforzar, extender, iluminar, transformar y, en última instancia hacer la vida más digna de ser vivida” (p. 58), mientras que en relación con el desarrollo intelectual propiamente tal, María Victoria Casas (2001) indica que diversos estudios en el campo de la sicología, música y educación, han demostrado que el aprendizaje de la música en la infancia mejora el dominio de la lengua, de la lectura, de las matemáticas y aumenta el rendimiento académico en general. Además, Campbell (1998) agrega que el estudio de la música influye en el desarrollo de la creatividad y de ciertas habilidades sociales, mejora la autoestima e influye en el desarrollo psicomotriz de los humanos al desarrollar habilidades motoras perceptivas.

De manera similar a la presentada en el párrafo anterior, no es difícil encontrar en la literatura otros estudios, publicaciones y fundados comentarios sobre las bondades de la música para el desarrollo humano. Estas referencias ayudan a explicar la presencia del arte, y sus diversas formas de manifestación, dentro del currículum de la gran mayoría de instituciones educativas escolares a nivel mundial, ya sea por iniciativa propia o producto de orientaciones estatales al respecto. Lo anterior obliga a intencionalizar el proceso de aprendizaje de los estudiantes, a secuenciar los diversos contenidos (sin importar su naturaleza) y a vigilar y resguardar el avance de los alumnos así como el desempeño de quienes orientan o conducen este proceso, especialmente de los profesores. No olvidemos las palabras de Tyler (1945; citado en Stenhouse, 1975) quien señala que “la escuela es una institución finalista, la educación es una actividad intencional” (p.88). Es en relación a estos últimos puntos que radica uno de los aspectos importantes de la evaluación a nivel de aula ya que, según Tenbrink (1997), ésta resulta beneficiosa para los profesores pues “les ayuda a contestar preguntas importantes sobre sus alumnos y sus métodos de enseñanza” (p.29). Sin embargo, no solo debe sustentarse la evaluación desde la óptica de los maestros, sino que también desde la del alumnado, transformándola en una herramienta eficaz para que los estudiantes puedan regular sus propios aprendizajes (Flórez, 1999).

Por ende, la evaluación en las Artes Musicales, integrada por cierto a la didáctica de la especialidad y vinculada a los procesos de desarrollo cognitivo de los estudiantes, ha sufrido, al igual que el concepto de evaluación en su más amplio espectro, notorias modificaciones en cuanto a sus definiciones, implicaciones e importancia. Desde una perspectiva centrada en los resultados de una ejecución instrumental o vocal técnicamente eficiente (aprender un instrumento), se ha abierto camino hacia una práctica que gira principalmente, sin descuidar la producción musical, en torno a la reflexión y valoración estética consciente del arte (aprender música). Lo anterior no es producto del azar, y se relaciona directamente con los procesos cognitivos vinculados al aprendizaje de la música y la evolución, o descubrimientos, de éstos en el tiempo. Al respecto se destaca el modelo de desarrollo musical en espiral de Keith Swanwick (1992) donde, producto de un estudio sobre más de 700 niños y adolescentes, da conocer 8 niveles o modos evolutivos que se superponen en función de la edad de los estudiantes. El modelo en espiral permite representar, principalmente, la necesidad de retornar reiteradamente sobre los elementos y recursos básicos propios de la música cada vez que se aborde una obra musical, ya que sin ellos no es posible acceder a un estado o nivel superior. Junto con ello, se representan en el modelo características y recursos propios del discurso musical como materiales, expresión, forma y valor, y sus distintas representaciones tanto a nivel individual como colectivo (Swanwick, 1992).

El vínculo entre evaluación y el modelo de desarrollo cognitivo a nivel musical, presentado resumidamente con anterioridad, se encuentra asociado a la idea fuerza que señala que el evaluar, el aprender y el enseñar son procesos que no pueden desligarse unos de otros (Flórez, 1999). Sobre el mismo punto, Casas (2006) señala que “la evaluación es inherente a todo proceso de aprendizaje y como tal la evaluación tiene relación con el modelo de aprendizaje” (p. 36). Por esto no deben olvidarse aquellas relaciones de la evaluación con los modelos de enseñanza y de aprendizaje que se encuentran a su vez imbuidos de los aportes de otras áreas del conocimiento como son, a modo de ejemplo, aquellos propuestos por la sicología o la sociología.

En el caso chileno se promueve en la actualidad, y de acuerdo a orientaciones emanadas desde Ministerio de Educación, la evaluación de los aprendizajes en torno a cuatro áreas fundamentales, siendo éstas las siguientes: Expresión creativa (productos de la ejecución instrumental y composición), percepción (reconocimiento de características y componentes de la creación musical), reflexión (pensamiento acerca de la música) y forma de enfocar el trabajo (iniciativa y capacidad de cooperación)(MINEDUC, 2004a). Una mirada más profunda a estas orientaciones permite generar el vínculo entre estas áreas con cuatro grandes bloques o niveles presentes en la ya mencionada espiral de desarrollo musical de Swanwick (1992). A partir de lo anterior es posible concluir entonces que existe un alto grado de coherencia entre las maneras de enseñar, de aprender y de evaluar los aprendizajes, coherencia que no es solo atendible desde la perspectiva de desarrollo cognitivo y la evaluación, sino que también desde una comprensión más profunda del fenómeno musical, a partir del acercamiento sobre sus tres aristas principales siendo éstas la audición, la creación o recreación musical (según corresponda), y la valoración estética de ésta. En los documentos oficiales estos énfasis evaluativos se encuentran claramente descritos en los anexos de evaluación de los programas de estudio del subsector además de presentarse sugerencias en cuanto a criterios y descriptores evaluativos.

En relación a estas orientaciones ministeriales mencionadas, y sin ahondar de manera demasiado específica sobre los puntos siguientes, resulta necesario destacar algunos aspectos fundamentales sobre el proceso evaluativo, principalmente en torno al qué evaluar y al cómo evaluar los aprendizajes de los alumnos. Respecto al qué evaluar, las orientaciones estatales señalan que debe existir un justo y apropiado equilibrio entre la evaluación de los procesos involucrados en el aprendizaje de los estudiantes y, como consecuencia, de los productos fruto de estos procesos (MINEDUC, 2004a). Lo anterior no resulta simple si se atienden ciertas características específicas del subsector, especialmente aquellas relacionadas con la creatividad, la libertad y la subjetividad, por lo que “una adecuada evaluación del proceso de aprendizaje artístico tiende a resistirse a las medidas estándar que suponen cierta uniformidad de los individuos en el manejo de determinadas habilidades clave” (MINEDUC, 2004b, p. 123). En otras palabras, no puede simplemente evaluarse aquello que se quiere observar, sino que debe estarse siempre atento y dispuesto a considerar aquellos elementos propios de la heterogeneidad del grupo de estudiantes, elementos que afloran al permitirse la libre creatividad cuando corresponda, evitando entonces el predeterminar productos y procesos observables en los estudiantes.

Respecto al cómo evaluar, especial importancia debe entregársele a la variable contexto durante el proceso evaluativo; debe permitirse a los estudiantes la posibilidad de ser evaluados dentro del desarrollo normal de actividades en el aula, en condiciones reales de trabajo y a través de procedimientos ya conocidos y no a través de procedimientos y momentos extraordinarios que buscan, artificiosamente, situar al alumno frente a las mejores condiciones, de acuerdo al profesor, para ser evaluado, evitando entonces “abordar los aspectos aisladamente, imponiendo relaciones arbitrarias, o sin considerar aquellas relaciones establecidas por los propios estudiantes en base a sus experiencias, conocimientos, intereses y necesidades”(MINEDUC, 2004a, p.129). Además, el no descontextualizar la evaluación de los procedimientos habituales desarrollados en el aula, permite alivianar la tensión que generan los procesos evaluativos tradicionales en los estudiantes junto con posibilitar al profesor la observación del comportamiento de los alumnos en su estado natural infiriendo las competencias, musicales en este caso, de manera directa, “sin dar rodeos mediante las tradicionales facultades lógicas y lingüísticas (MINEDUC, 2004a, p. 130).

Lamentablemente la realidad dista, en innumerables ocasiones, de la teoría. Producto de numerosos factores que no resultan necesarios ser comentados en estos momentos, la evaluación de los aprendizajes en el subsector se encuentra muchas veces limitada a conceptos tan ambiguos como el gusto o el empeño, ya que todavía persiste en muchas personas, profesores de asignatura o no, la falsa creencia de que sólo aquellos que han sido dotados de un talento especial pueden hacer música, en el más amplio sentido de las palabras, restando así importancia a aspectos como trabajo en grupo, apreciación estética y procesos musicales.

Por todo lo anterior, y a modo de resumen y/o conclusión, la evaluación en el subsector de Artes Musicales debe diseñarse e implementarse en virtud de las concepciones que se tengan respecto a currículum, modelos y teorías cognitivas, teorías educativas y evaluación (entre otros aspectos), y en virtud de las relaciones coherentes entre éstos conceptos, evitando viciar el proceso descontextualizándolo y menoscabando las capacidades intelectuales de los alumnos declarando, por suerte al menos de manera inconsciente e indirecta, que no todos los alumnos pueden aprender música.

Bibliografía

Campbell, D. (1998). El efecto Mozart. Barcelona: Editorial Urano.

Casas, L. D. (2006). Evaluación de capacidades y valores en la sociedad del conocimiento. Perspectivas didácticas. Santiago: Arrayan Editores.

Casas, M. V. (2001). ¿Por qué los niños deben aprender música? Revista Colombia Médica.Vol. 32 (4), 197-204.

DESPINS, J. P. (1989). La música y el cerebro. Barcelona: Gedisa.

Flórez, R. (1999) Evaluación pedagógica y cognición. Santafé de Bogotá: McGraw Hill.

MINEDUC. (2004). Artes Musicales. Programa de estudio, Cuarto año Medio, Formación General. Santiago: MINEDUC.

MINEDUC. (2004). Educación Artística. Programa de estudio, Sexto año básico. Santiago: MINEDUC.

Stenhouse, L. (1975). An introduction to curriculum research and development. Londres: Heinemann.

Swanwick, K. (1992). Música pensamiento y educación. Madrid: Morata.

Tenbrink, T.D. (1997). Evaluación. Guía práctica para profesores. Madrid: Narcea.

martes, 24 de junio de 2008

Evaluación Docente: 8 argumentos en contra y a favor.

Hablar de evaluación docente, refiriéndose al Sistema de Evaluación Docente de Chile, es hacer ingreso a un sector repleto de desacuerdos. Lo que en un principio surgió como un proceso formativo para fortalecer la formación docente, se ha transformado en parte, en una herramienta que enjuicia la labor de los docentes, cuya información se ha utilizado para categorizar el desempeño, asignar responsabilidades sociales y, en determinados casos, sancionar. Por otro lado, y bajo determinados criterios y supuestos, a través de este sistema ha sido posible conocer el estado actual de competencia de gran número de docentes, en su mayoría provenientes del sistema municipal, además de contribuir al fortalecimiento de una cultura evaluativa.

Debido a la existencia de argumentos a favor y en contra, y con la finalidad de promover un debate informado y colaborar en el fortalecimiento de una cultura evaluativa, se presentan a continuación cuatro argumentos a favor y cuatro argumentos en contra del Sistema de Evaluación Docente de Chile. La selección de argumentos se realiza bajo la asociación con los Estándares para la Evaluación de Programas, Proyectos y Materiales Educativos, elaborados por el Comité Conjunto de Estándares para la Evaluación Educativa, normas consideradas “necesarias y suficientes para que las evaluaciones sean útiles, factibles. Precisas y válidas” (Stufflebeam & Shinkfield, 1987, p. 26). Si bien la orientación de los estándares está destinada a la evaluación de proyectos, programas o material educativo, y no se orientan hacia la evaluación de evaluaciones, o metaevaluación, se ha considerado válido el relacionar el sistema de evaluación docente con estos estándares, ya que estos últimos funcionan como indicadores guías para orientar la mirada evaluativa.

Se presentan entonces a continuación, 4 argumentos a favor y 4 argumentos en contra del Sistema de Evaluación Docente de Chile, agrupadas en pares (a favor y en contra) y de acuerdo a normas de utilidad, viabilidad, honradez (propiedad) y precisión.

I) Utilidad
1.1 A favor:
Los resultados de la evaluación docente son reportados a través de un informe de evaluación individual, de resultados para el establecimiento educacional y de resultados para el sostenedor municipal. A través de estos se entrega información detallada, y en distintos niveles, a determinados miembros del sistema educativo. En el caso del informe de evaluación individual, y según palabras de la consultora Docentemás (2008), encargada del proceso de evaluación docente cada docente recibe retroalimentación en base la evidencia entregada para el proceso de Evaluación Docente, lo que contribuye a cumplir el propósito formativo del Sistema de Evaluación.

1.2 En contra:
El principal instrumento de evaluación utilizado en este sistema es el portafolio, con una ponderación del 60%. El otro 40% es aportado por una autoevaluación, la entrevista de un evaluador par y un informe de referencia de terceros con un 10%, 20% y 10% respectivamente. La finalidad de la evaluación, como ya fue señalado, es mejorar las prácticas pedagógicas, sin embargo la información recopilada a través del portafolio recoge información, principalmente, sobre ciertos procedimientos técnicos del proceso de diseño de una unidad, evaluación de ésta y reflexión sobre los procesos anteriores que, junto con la filmación de una clase de 40 minutos, no son capaces de entregar, a juicio del autor, información orientada a mejorar las prácticas pedagógicas que permita elevar los aprendizajes de los alumnos. La evaluación no ha cumplido entonces, con los objetivos planteados, y mediciones del tipo SIMCE confirman que no se ha producido una mejora significativa de los alumnos en cuanto al rendimiento.

II) Viabilidad
2.1 A favor:
Los problemas acarreados por los procedimientos evaluativos no son significativos y no alteran mayormente el normal actuar de los docentes evaluados. No existen trabas ni impedimentos técnicos para obtener información.

2.2 En contra:
La evaluación ha sido, principalmente, impuesta y no se han alcanzado acuerdos políticos entre los involucrados (por ejemplo entre el Colegio de profesores y el Ministerio de Educación) que permita eliminar trabas, influir en los resultados o utilizarlos de manera no adecuada. Lo anterior, sumado a otros antecedentes, colabora en que la evaluación no sea aceptada por importantes actores involucrados, persistiendo grupos que se niegan a someterse al procedimiento.

III) Honradez (propiedad)
3.1 A favor:
Los resultados del proceso de evaluación son dados a conocer al público o, en su defecto, los interesados pueden conocer ciertos resultados referidos al proceso, como por ejemplo el número de evaluados, los porcentajes y número de docentes catalogados en distintos niveles de desempeño (destacado, competente, básico e insatisfactorio). De este modo los resultados son comunicados a la sociedad y se fomenta el conocimiento, en este caso, de algunos aspectos referidos a la educación ya la evaluación.

3.2 En contra:
En el último tiempo ha sido posible percibir como, desde entidades como el Ministerio de Educación se han utilizado ciertos resultados de mediciones o evaluaciones SIMCE, PSU, Evaluación Docente u otras, buscando responsabilizar a determinados grupos sobre ciertos aspectos de la calidad educativa actual. Por otro lado, muchos docentes perciben a la evaluación como un instrumento destinado a sancionar, o como una herramienta que puede permitir, o no, el acceso a mejores remuneraciones producto de los bonos obtenidos gracias a la clasificación de acuerdo a su desempeño. Por un lado los profesores buscan mantener su puesto de trabajo y poder acceder a mejores remuneraciones y el Ministerio de Educación, por otro lado, realiza una suerte de caza de brujas persiguiendo culpables. Este conflicto de intereses no ha sido debatido como corresponde, y se mantiene oculto en este proceso (al menos no se ha comunicado).

IV) Precisión
4.1 A favor:
Los procedimientos evaluativos son conocidos tanto por quien evalúa como por quienes son evaluados, en este caso los docentes. Además, en el caso del portafolio, se entrega tiempo suficiente para la realización de éste así como la posibilidad de elegir en determinados aspectos (clase a filmar, por ejemplo). Además es posible poseer garantías técnicas respecto a los instrumentos, la recogida de información o datos, y la corrección y análisis de éstos.

4.2 En contra:
Quizás una de las principales fallas del sistema se relaciona con la identificación del objeto de evaluación. No se han identificado, considerado o examinado en profundidad múltiples aspectos del docente y su labor, así como las influencias del contexto en el objeto de evaluación. Es debido a esto, y volviendo a características entregadas con anterioridad, que la evaluación no debiese ser considerada, al menos en su nombre, como Sistema de Evaluación Docente, al no referirse a éste último, el docente, con esa profundidad necesaria que permita recoger de mejor manera información referida a sus prácticas contextualizadas. Un nombre menos llamativo, pero quizás más honesto como Sistema de evaluación de la planificación docente, u otro similar, ayudaría notablemente a definir de mejor manera el objeto de evaluación, y que esta definición fuese compartida, evitando entonces emitir juicios o tomar decisiones erradas.

Así como estos argumentos, existen otros que pueden ser esgrimidos para manifestar una posición a favor o en contra de ciertos aspectos del proceso en determinados momentos. El impacto negativo de quien ha sido evaluado con desempeño insatisfactorio en tres o más ocasiones, la relación o correlación entre profesionales evaluados, nivel de desempeño docente y logros de los alumnos o el consenso internacional sobre los beneficios de procedimientos evaluativos similares no han sido considerados para el desarrollo de este ensayo, y queda en manos del lector profundizar en estos u otros aspectos relacionados con la evaluación.

En estas líneas se han intentado dar a conocer aspectos positivos y negativos del Sistema de Evaluación Docente de Chile, bajo la luz de criterios previamente establecidos, intentándose mantener una posición neutral respecto al tema, con la finalidad única de promover un debate informado sobre el procedimiento aludido.

Promover una cultura evaluativa es responsabilidad de todos los que se acercan de manera especial o diferente a la evaluación, el no hacerlo sería contribuir a mantener el significado de la evaluación como una actividad eminentemente destinada a medir, bajo una antigua mirada, el rendimiento de un grupo en determinadas pruebas.

Bibliografía

Docentemás. (2008). Información extraída el 24 de Junio de 2008, desde http://www.docentemas.cl/

Stufflebeam, D. L., & Shinkfield, A. J. (1987). Evaluación sistemática. Guía teórica y práctica. Barcelona: Paidós.

viernes, 13 de junio de 2008

Estandarización: ¿Peras con manzanas?

Imaginemos que tenemos dos alumnos que traen naturales colaciones al colegio. Juanito trajo hoy 5 manzanas y Josecito trajo una sandía y dos frutillas. Ante tal suculento y apetitoso panorama, ¿Sería usted capaz de señalar qué alumno trajo más fruta? ¿Qué pasaría si quisiésemos saber cuánta fruta traen en promedio todas las semanas? Probablemente resultaría todo más sencillo si, nuestros alumnos, se pusiesen de acuerdo en traer todos los días la misma variedad de fruta.

Sabemos sumar sandías con sandías, y restar plátanos entre ellos, pero ¿no nos enseñaron desde pequeños a no mezclar peras con manzanas? ¿Y si ahora quisiéramos sumarlas?

Cuando necesitamos, en estadística, sumar peras con manzanas o entregar información resumida sobre variables de distinto tipo (y distintas escalas), debemos echar mano de un proceso o procedimiento conocido como estandarización. Este proceso , relativamente simple consiste es traspasar valores, provenientes de distintas escalas, a una escala común, sin unidad de medida donde es posible finalmente comparar y analizar la información.
Para estandarizar una serie de valores debemos proceder de la siguiente manera:

1) Calcular la media aritmética (promedio) de los datos.
2) Calcular la desviación estándar de los datos.
3) Restar a cada valor el promedio obtenido en el punto número 1
4) Dividir el resultado obtenido en el punto número 3 por el valor de la desviación estándar.

¿No se entendió?

Veamos el siguiente ejemplo (calcúlelo usted mismo):

Sean los datos los siguientes:

Puntajes: 4, 6, 2, 4, 4, 3, 7, 9, 8, 2
Media aritmética: 4,9
Desviación estándar: 2,47
Puntajes estandarizados: -0,36 0,45 -1,17 -0,36 -0,36 -0,77 0.85 1,66 1,26 -1,17

Ahora que ya conocemos el proceso matemático de la estandarización podemos preguntarnos ¿y cuándo necesito mezclar peras con manzanas?
Tomemos el siguiente ejemplo:

Un profesor de educación física necesita determinar que alumno es quien se desempeña mejor en un conjunto de 4 pruebas atléticas. Para ello ha confeccionado una tabla donde ha dejado expresado ciertos valores del rendimiento de los alumnos. La tabla confeccionada se presenta a continuación.

¿Podría usted entonces señalar que alumno es el que tiene un mejor desempeño en el total de las 4 pruebas?

jueves, 29 de mayo de 2008

SIMCE 2007 (Resultados entregados en Mayo de 2008)

(Imagen extraída de http://engelbertsoto.blogspot.com/)

Hoy, martes 28 de mayo de 2008, se dieron a conocer en Chile los resultados del sistema de medición de la calidad de la educación SIMCE realizado el 2007, el cual, y pese a la espectacularidad del significado de la sigla (medición de la calidad de la educación), es según lo señalado por la Unidad de Currículum y Evaluación del Ministerio de Educación de Chile ,el sistema nacional de medición de resultados de aprendizaje del Ministerio de Educación de Chile, siendo su propósito principal el contribuir al mejoramiento de la calidad y equidad de la educación, informando sobre el desempeño de los alumnos y alumnas en diferentes áreas del currículum nacional, y relacionándolos con el contexto escolar y social en el que ellos aprenden (http://www.simce.cl).

Como consecuencias de los resultados se desató, de manera casi inmediata, y esperada por cierto, una suerte de histeria educacional colectiva donde docentes y administradores de establecimientos educacionales realizaban cálculos varios, intentando determinar los grandes éxitos o los no tan grandes éxitos en comparación a años pasados, a establecimientos educacionales de la competencia, a diferentes niveles, subsectores y, finalmente, comparaciones entre cualquier cosa (resulta interesante destacar que en estos casos no hay derrotas, sólo varía la magnitud del éxito).

Por otra parte, la sociedad ávida de respuestas, clama por encontrar al o los culpables de tan “inesperada” brecha educacional y falta de equidad educativa. El gobierno de turno, reaccionando rápida e “inesperadamente” ante este súbito clamor popular, realiza una rápida investigación y encuentra culpables. Si en las novelas de misterio el asesino es siempre el mayordomo, en educación los culpables resultan ser, muchas veces, los profesores. No habría de ser ésta la excepción.

¡Alego defensa! Exclama el gremio de los profesores, la responsabilidad no es sólo nuestra. Culpemos entonces, agregan, a las diferencias sociales, al neoliberalismo y a la negligencia e ineficiencia del estado en materia educacional.

Pese a que el SIMCE asegura ser, al menos así lo señala su sigla, un sistema de medición de la calidad de la enseñanza, es la propia orientación del ministerio la que señala que no es más que un sistema de medición de resultados de aprendizajes. Y es eso lo que informa el SIMCE, intentando cuantificar estos resultados y no señalar qué, quién o quiénes son los responsables de los altos o bajos desempeños.

Según mi opinión, la finalidad debiese ser la de intentar analizar la información entregada, sin intentar celebrar, difundir o publicar los resultados, teniendo como principal premisa principal el reconocimiento social y futuras gratificaciones económicas. Debemos intentar analizar la información en virtud, por ejemplo, de determinadas estrategias metodológicas y determinar si la implementación de éstas incide en un aumento futuro del rendimiento de los alumnos. Si lo anterior no le resulta interesante o atractivo, puede entonces intentar analizar la información con otra finalidad, pero por favor, analícela y utilícela teniendo siempre delante suyo la posibilidad de mejorar, en cualquier aspecto que este sea. De lo contrario la rapidez de cambio de las mejoras será, en el mejor de los casos, positivamente pequeña (existiendo la trágica posibilidad de que sea negativa).

A modo de ejercicio le propongo que lea y, posteriormente, intente analizar el siguiente ejemplo.

Ejemplo:

Imaginemos el caso de una escuela (Escuela "A") que ha mantenido en las últimas dos mediciones de 4º básico, subsector lenguaje y comunicación, un puntaje promedio de 240 puntos. En futuras mediciones SIMCE se observa un aumento sostenido del rendimiento de los alumnos en la prueba. Consideremos además que en otro establecimiento, de similares características y resultados anteriores (Escuela "B"), los resultados de mediciones SIMCE futuras no entregan ninguna diferencia significativa respecto a años anteriores, manteniéndose estable el puntaje promedio.

Intente analizar la información entregada por el SIMCE de acuerdo a una de las siguientes situaciones o combinación de ellas:

1) La escuela “A” implementó estrategias metodológicas en el aula con la finalidad de aumentar el rendimiento de sus alumnos. La escuela “B” no.

2) Las calificaciones promedio de los alumnos de la escuela “A” no han sufrido variación significativa en el tiempo. En la escuela “B”, las calificaciones en el subsector, han aumentado significativamente pasando de un valor promedio de 4,7 el año 2002 a 6,3 el año 2007.

¿Es capaz usted de proponer un análisis de acuerdo a las condiciones señaladas?
¿Puede usted sugerir otra condición o situación que pueda ser analizada?

martes, 20 de mayo de 2008

W. James Popham y la medición referida a criterios

La información que a continuación se presenta puede carecer, por momentos, de información detallada o de un vocabulario técnico-evaluativo más preciso, sin embargo debe el lector comprender que la finalidad de este escrito no es servir como fuente de estudio detallada para la comprensión de procesos evaluativos, sino como un aporte que busca, en un vocabulario para la mayoría accesible, contribuir a la formación y generación de una cultura educativa saludable.

W. James Popham (1930) fue una de las figuras principales que impulsaron y promovieron la medición referida a criterios sobre lo cual hace referencia este artículo.

La medición referida a criterios nace, en términos generales, a finales de la década de los 50 e inicio de los 60, permitiendo complementar el sistema de medición referido a una norma imperante hasta ese entonces. Una de las principales diferencias, y la más representativa quizás, entre estos dos modelos de medición es aquella que responde a la pregunta de: ¿Respecto a qué o quienes determino o valoro la actuación de un individuo (No olvidemos que la concepción actual que poseemos sobre evaluación resulta mucho más amplia que en el pasado)? En la medición referida a una norma, el individuo es comparado en relación a un grupo, buscando conocer su posición dentro de éste, mientras que la evaluación referida a criterios busca averiguar y valorar la posición de un individuo respecto a un campo definido.

El nacimiento de lo que se conoce como instrucción programada o enseñanza programada señalaba, en palabras simples, que las secuencias pedagógicas bien diseñadas, bien implementadas y bien corregidas permitirían a cualquier estudiante (o a la gran mayoría) alcanzar ciertos objetivos propuestos con antelación. Enotras palabras, promovía la idea que cualquier estudiante que fuese sometido a una secuencia pedagógica organizada y aplicada apropiadamente podía obtener buenos resultados en cuanto a su aprendizaje. Lo que ahora puede parecernos algo obvio quizás, no lo fue así para la época y provoco que fuese necesario un cambio de enfoque en cuanto a la responsabilidad de los aprendizajes y a la interpretación de los resultados. Como se señaló anteriormente, las pruebas referidas a una norma buscan posicionar la actuación de un individuo dentro de un grupo. La forma de realizar esto es diseñar instrumentos de medición (pruebas) que permitieran situar a los individuos de forma tal que pudiesen ser distribuidos de la forma más amplia posible dentro de una escala de medición. Para esto era necesario construir el instrumento de medición utilizando elementos que permitiesen una amplia distribución de los resultados dentro de la escala señalada. Los conceptos de recorrido, correlación, varianza, etc., eran de dominio frecuente en la construcción de las pruebas y, por ejemplo, si un elemento no permitía diferenciar claramente a los individuos dentro de un grupo, era entonces eliminado o bien recibía una ponderación menor. La capacidad de un elemento de diferenciar predominaba sobre el contenido a medir del elemento en cuestión. Una nueva técnica de enseñanza hacía necesaria una nueva modalidad de medición, y era eso lo que esta enseñanza programada necesitaba. ¿Cómo conocer en qué momento de esta programación se encuentra este estudiante? ¿Se encontrará apto para avanzar al siguiente nivel? Para responder a esas preguntas ya no resulta útil conocer en que lugar , respecto al grupo, se encuentra el individuo y sus aprendizajes, siendo necesario ahora conocer que tan cerca o lejos se encuentra el individuo de determinadas conductas y contenidos planteados con antelación, naciendo entonces la medición referida a criterios como una forma de describir de la mejor manera posible las actuaciones del individuo. Como consideración final podría señalarse que la medición referida a una norma busca posicionar al individuo en comparación a un grupo mientras que la medición referida a criterios persigue el describir su actuación.

Esta nueva concepción de la medición educativa ocasionó además un cambio de paradigma educativo que guarda relación con lo siguiente: Cuando se medía el desempeño de los estudiantes a través de un sistema de medición referido a normas, se buscaba distribuir a los estudiantes a lo largo de la escala de medición de una forma más o menos estándar. Sin importar la actuación de los alumnos siempre existirán individuos que estarán bajo el promedio, otro grupo más numeroso se concentrará alrededor de la media o promedio, y el resto (menos numeroso que el anterior) se situará hacia la parte alta de la escala (aquellos familiarizados con la curva de distribución normal o gaussiana sabrán a lo que me refiero). Sin importar el esfuerzo que el docente u objeto de la medición realice, el desempeño de los estudiantes será similar, habiendo un grupo con resultados insuficientes, otro grupo con resultados mediocres y un grupo final reducido con resultados excelentes, por lo que nos encontramos con que el resultado individual de cada alumno no dependerá del docente, sino que del esfuerzo individual realizado por cada alumno. Por otro lado, la medición referida a criterios no busca conocer la ubicación de un individuo dentro de un grupo, sino que conocer la ubicación del individuo en relación a un campo conductual determinado. Es posible entonces que pueda darse el caso de encontrarse en la mayoría de los estudiantes resultados insuficientes o, por el contrario, la mayoría de los alumnos poseer resultados excelentes. Lo anterior provoca que la responsabilidad del rendimiento se traspase de los estudiantes y su esfuerzo y dedicación, al profesor, siendo este el principal responsable del rendimiento de los alumnos.

Hasta el momento he intentado dejar clara la diferencia entre los dos tipos de mediciones (y si no ha sido así espero me lo haga saber), pero ¿qué ventajas nos ofrece, por ejemplo, la medición referida a criterios en comparación con la referida a una norma? Como respuesta a lo anterior podríamos dar a conocer tres ventajas (de acuerdo a la utilización) de la medición referida a criterios, en comparación con la medición referida a una norma, siendo éstas las siguientes:

1) Elementos admisibles en el instrumento de medición: Un elemento que ha sido contestado correctamente por el 90% de un grupo de estudiantes no resulta de mucha utilidad en la aplicación de un instrumento normativo (referido a normas), ya que no permite diferenciar a los estudiantes (revísense conceptos de varianza, correlación, etc.). Sin embargo esto no resulta de importancia para la aplicación de un instrumento de medición referido a criterios, lo que posibilita utilizar elementos que en una prueba referida a la norma debieran ser objetados o eliminados.

2) Utilidad para un evaluador formativo: Al no ser de carácter descriptivo la medición referida a la norma no puede entregar información sobre, por ejemplo, la efectividad de algún proceso de enseñanza determinado, haciendo que la labor de recogida de información resulte menos eficaz que a través de la utilización de un instrumento referido a criterios.

3) Responsable de la enseñanza: Si bien se señaló anteriormente, resulta importante volver a destacar la utilidad de la medición referida a criterios en este punto. En las situaciones en que se utiliza apropiadamente, la medición referida a criterios responsabiliza en mayor medida al docente respecto al resultado de los individuos. Este nuevo paradigma permite entonces que sea el docente quien promueva mejoras en cuanto a metodologías, estrategias, diseños y otros conceptos relativos a la enseñanza y sea, como ya se ha insistido, el responsable del aprendizaje de sus alumnos, ya que de todos modos se supone que es esa su función ¿o no?

¿Cuándo utilizar cada tipo de medición?
No es menor la importancia que debe otorgarse a esta pregunta, ya que una mala decisión puede generar, por ejemplo, una situación como la siguiente: Situémonos en el caso de querer medir el desempeño de un alumno y que este alumno debe rendir examen en dos ciudades o establecimientos educacionales distintos. Un alumno con desempeño regular puede resultar, aprobado por ejemplo, dentro de un grupo de bajo rendimiento (establecimiento 1), mientras que puede resultar reprobado dentro de un grupo de alto rendimiento (establecimiento 2). Con una medición referida a criterios se podría, en teoría, conocer cuánto sabe realmente el alumno sin importar con quien se contraste su rendimiento. ¿Cómo podríamos saber entonces que tipo de medición realizar? Pues la respuesta resulta bastante simple y sólo debemos preguntarnos que finalidad le daremos a la información de la medida del desempeño del individuo. Por ejemplo, si dentro de un proceso de selección de personal queremos seleccionar al candidato que mejor se desempeñe en ciertas áreas, no nos interesará tanto conocer cuánto sabe cada postulante (asumiendo que resultase posible realmente conocer cuánto sabe a través de un sistema de medición como los mostrados), sino que nos interesará saber cuál es el postulante que sabe más respecto a algo. En cambio, si nos presentamos a rendir un examen de conducir, no será tan importante para quien mida el determinar si manejamos mejor o peor que el resto de los examinados, sino que será importante para ellos saber si poseemos los conocimientos y habilidades mínimos que aseguren que podremos guiar un vehículo bajo ciertos estándares mínimos de seguridad para nosotros y para quienes nos rodean.

En estas líneas he querido desarrollar y explicar de forma sencilla, los orígenes, importancia y finalidad de los sistemas de medición señalados (referidos a normas y a criterios), con la finalidad de que el lector pueda ampliar sus conocimientos respecto a ciertos aspectos del fenómeno evaluativo, siendo ésta la orientación que debe primar, y no la de transformarse en una guía para algunos aspectos evaluativos. Para lo anterior será el lector capaz de referirse a fuentes de mayor credibilidad.

Nota: En la actualidad es posible que las concepciones puedan diferir de las señaladas acá, sin embargo en su origen o nacimiento, la clasificación y características de las mediciones acá señaladas responden, principalmente, a las características mencionadas.

domingo, 11 de mayo de 2008

Cultura Evaluativa:¿Por qué no?

Para conocer qué factores limitan el desarrollo de una cultura evaluativa, es necesario primero referirnos al concepto de cultura evaluativa. Sin el afán de aportar una nueva definición del concepto, me permito señalar que cultura evaluativa es el conjunto de procedimientos, concepciones, herramientas, actitudes, etc., que se relacionan directa o indirectamente con la evaluación. Son las relaciones que se generan o construimos, de forma individual y colectiva, con la evaluación. Al respecto, Erika Himmel (s.f.), Master of Arts en Medición y Evaluación en Psicología y Educación de la Universidad de Columbia, señala cuatro factores que facilitan o limitan el desarrollo de una cultura evaluativa, siendo estos los siguientes:

a) La tradición en evaluación del país: Mientras mayor sea la cantidad de tiempo que la evaluación haya estado en contacto con la población, mayor posibilidad de generar relaciones con ésta.
b) Las políticas educacionales: Si una política educacional involucra e incluye dentro de sí misma a la evaluación, entonces hay mayor posibilidad de que la evaluación ocurra y de generar relaciones con ella.
c) La legislación o normativa: Si se norma la evaluación, existen mayores posibilidades de caracterizarla, sistematizarla y, por ejemplo, legitimarla ante la sociedad.
d) Las estrategias y formas de comunicación de resultados: la evaluación genera, entre otras cosas, información y mientras mejor y más oportuna sea ésta, mejor el contacto de la sociedad con la evaluación.

A los factores señalados anteriormente me gustaría agregar algunos que si bien pueden parecer menos importantes que los señalados anteriormente, resultan fundamentales, a mi parecer, a la hora de hablar sobre cultura evaluativa y evaluación, siendo éstos los siguientes:

e) Concepto de evaluación: Ampliar progresivamente el concepto de evaluación permite que la evaluación se inserte con mayor frecuencia en la vida cotidiana, sobre todos en aquella de los inmersos en el sistema educativo. Si poseemos un concepto limitado que no abarque distintas áreas, entonces veremos mermadas nuestras oportunidades de contactarnos con ella y encontrarla presente de manera más frecuente.
f) Reticencia al cambio: La evaluación busca, como una de sus finalidades principales, la mejora de un sistema y para producir una mejora es necesario introducir cambios. Mientras mayor sea el rechazo a los cambios introducidos por la evaluación, menores serán las oportunidades de contacto con ésta o con sus consecuencias. Si los cambios o mejoran no se realizan, entonces la finalidad de la evaluación se pierde y por ende su importancia y utilidad no resulta observable.
g) Desconfianza: Hablamos de evaluación y tememos. Ni mencionar lo que ocurre cuando se habla de evaluación docente o evaluación de la gestión escolar (entre otras evaluaciones). ¿Evaluar implica hacer rodar cabezas? No importa cuánto sepamos en teoría sobre la evaluación, o si ésta es parte de una política educacional suprema, si manejamos amplios conceptos al referirnos a ella, o si los resultados de la medición SIMCE se publican en el periódico. La evaluación no puede ser un tema tabú. Si ya se conoce tanto sobre la evaluación, ¿por qué no nos atrevemos a vivirla?

______________________________________________________________

Himmel, E. (s.f.). Hacia una cultura de evaluación educacional. [Documento PDF]. Extraído el día 30 de Abril de 2008 desde http://www.ifie.edu.mx/Erika%20Himmel.htm

Cultura Evaluativa