Incluso las múltiples formas de evaluación de lectura que discutimos aquí están, en muchas formas, basadas en el muestreo. Por supuesto, todo tipo de pruebas solo es una muestra de cómo el estudiante responde al material un día específico en comparación con otro, pero esto también sucede con otras formas de evaluación. Cuando los profesores se sorprenden con los resultados de las pruebas estandarizadas que son evaluadas en otro recinto, no tienen la posibilidad de pedir que se vuelva a impartir la prueba o ignorar los resultados por ser poco precisos. Ahora bien, en el caso de las evaluaciones que presentamos en este libro, asumimos que son específicas para un momento, a pesar de que intentamos diseñarlas para que puedan servir a propósitos más amplios. Sin embargo, tenemos la posibilidad de cuestionar la herramienta de evaluación junto con el cómo y el porqué el evaluador llegó a una conclusión específica. En la escuela Mission Hill en Boston, pusimos en marcha una escala de cero a cinco sobre fluidez en la lectura para los cursos desde kínder hasta octavo, y pasamos una cantidad de tiempo considerable tratando de acordar qué indicaba cada número y cómo lo describiríamos a los chicos y a sus familias. Esto era muy importante, ya que las categorías de 0–5 cubrían un gran terreno entre no poder leer y leer fluidamente cualquier cosa apropiada a su edad o curso. Es por esto que se llevaban a cabo múltiples evaluaciones que apuntaban hacia la grabación de esta evaluación sumativa (la que en Mission Hill era grabada en video o en audio) y que funcionaban como respaldos importantes.
Los números son inútiles sin descriptores
Lo que una buena evaluación necesita es un descriptor preciso y no una comparación que categoriza de mejor a peor. Probablemente, no hay forma de evitar que alguien convierta cualquier cosa en una herramienta comparativa de alguna forma, lo que podría llegar hacer un instinto humano saludable. Así, por ejemplo, Mission Hill tenía el objetivo de que todos los chicos estuviesen en el nivel cuatro de fluidez lectora en algún momento antes de terminar su cuarto grado. Si notábamos una baja, nos hacíamos preguntas, y algunas de ellas nos llevaban a revisar los instrumentos o nuestra propia práctica.
Pero es importante recordar que cualquier orden de clasificación es engañoso, y rara vez tan importante como lo hacen parecer. No importa cuánto practiquemos, o qué tan obediente son todos los chicos, cuando los llamemos a formarse luego del recreo, siempre la mitad de ellos estará enfrente y un solo niño estará al final. Es también una fortuna que no todos los niños tienen tanto ímpetu por estar en el frente. De igual forma, a algunos estudiantes no les importa tanto el obtener la respuesta correcta en las pruebas, sino la integridad de sus respuestas y que puedan defenderlas. Enseñarles trucos para adivinar o cómo meterse en la estructura mental de quienes diseñaron las pruebas para algunos chicos puede ser destructivo y, quizás, inmoral en sus propios códigos de ética.
Aún más, con respecto a esa pretensión de exactitud en las pruebas que no pueden ser evaluadas con puntaje, la idea de aprobado/reprobado es una locura. El error de medida es sustancial de acuerdo con los diseñadores de pruebas estandarizadas y puede fallar por mucho. Cuando solíamos obtener puntajes que pretendían medir el nivel del curso –6,3 implicaba el puntaje medio para estudiantes en el tercer mes del sexto grado– de hecho, no lograba medirlo. Tal cual como formarse en línea, solo podía decirnos a nosotros y a los padres que obtuvo más o menos respuestas correctas, y luego proveer un valor numérico para conectar con las respuestas. La mayoría de las pruebas estandarizadas actuales entrega lo que se llama un puntaje “normado políticamente”. Un grupo de expertos decide qué puntajes deben ser considerados “excelente”, cuales “bien”, cuáles “suficiente” y cuáles “reprobado”. Todavía puedes alinearlos, pero la decisión de qué hace que el 86 sea lo suficientemente bueno, pero 83 no, es una decisión que toma alguien a la distancia y en una posición mucho más alta en una escala de poder.
Toda evaluación requiere juicios
En resumen, no importa si lo llamamos evaluar a un estudiante, a una clase o a un profesor: siempre es una decisión subjetiva. Quien toma esta decisión podría estar equivocado. Conversar abiertamente sobre cómo llegamos a nuestras decisiones y la evidencia que usamos cuando necesitamos tomar una, ayuda significativamente. Qué tan seguido y con qué propósito tomamos estas decisiones debería hacer algo que cada comunidad escolar evalúe en conjunto y llegue a un “paquete” de acercamientos que satisfagan a los tres grupos –estudiantes, profesores y familias– al ser útiles, comprensibles y tolerables para cada uno. Al igual que las decisiones tomadas por aquellos con mayor poder, debiese siempre haber mecanismos para apelar a las decisiones. Probablemente nadie opine perfecto de nosotros –ni nosotros lo hacemos– pero algunos intentos de juicios hacen daño considerable y otros son altamente útiles para ayudar a todos los involucrados. Esto último es lo que buscamos con este libro. En términos escolares, esto significa que todos los grupos involucrados, como mínimo, deberían tener acceso a toda la evidencia involucrada y deberían tener una oportunidad de ofrecer interpretaciones alternativas cuando y si es que hay consecuencias que los podrían ayudar o dañar. Ese es el principio número uno en la búsqueda de una evaluación justa.
Acerca de las siete evaluaciones
Las evaluaciones que elegimos para perfilar y describir en este libro están divididas en siete categorías básicas:
1. Autoevaluaciones de estudiantes: oportunidades para motivar a los estudiantes a que piensen críticamente sobre su propio trabajo, utilizando herramientas u ocasiones estructuradas, tales como reuniones familiares, rúbricas o la colección de reflexiones llamada recuerdos.
2. Observaciones de parte del profesor acerca de los estudiantes y su trabajo: profesores actuando como observadores o etnógrafos, anotando, recogiendo, sintetizando y analizando miles de piezas de información acerca de sus estudiantes a medida que ellos hacen su trabajo diario.
3. El proceso de revisión descriptiva: una forma organizada de recoger observaciones y otras piezas de evidencia, enfocándolas alrededor de una pregunta que funciona como marco y discutiendo la pregunta, o un trabajo particular, o evaluación del chico con un grupo de adultos.
4. Entrevistas de lectura y matemáticas: evaluaciones de las habilidades de comprensión lectora y matemática de los estudiantes utilizando procesos tales como escuchar grabaciones de estudiantes leyendo con un adulto, seguidas por preguntas de comprensión de un adulto, el evaluador.
5. Portafolios y defensas públicas del trabajo de estudiantes: portafolios del trabajo de estudiantes, junto con defensas públicas de su trabajo llevadas a cabo por los estudiantes, las que constituyen evidencia significativa, juzgada por un panel (generalmente de padres, profesores y miembros de la comunidad), de que el estudiante ha alcanzado los estándares de la institución.
6. Evaluación de las escuelas por parte de expertos externos: Evaluación de las escuelas llevadas a cabo por un equipo de expertos externos. Este proceso generalmente consiste en un período de autoestudio, en el que la escuela recoge un rango de evidencias sobre lo que han logrado en el período previo, alineado a la misión declarada de la escuela. Luego de revisar estos documentos, el equipo revisor pasa un período dentro de la escuela, verificando cómo esta autoevaluación se condice con observaciones directas y entrevistas llevadas a cabo con los integrantes de la comunidad escolar. Luego el equipo entrega sus resultados.
Читать дальше