Explora más de 1,5 millones de audiolibros y libros electrónicos gratis durante días

Al terminar tu prueba, sigue disfrutando por $11.99 al mes. Cancela cuando quieras.

La evaluación en la mira: Una examinación crítica y propositiva para la evaluación educativa a nivel nacional, docente y de aula
La evaluación en la mira: Una examinación crítica y propositiva para la evaluación educativa a nivel nacional, docente y de aula
La evaluación en la mira: Una examinación crítica y propositiva para la evaluación educativa a nivel nacional, docente y de aula
Libro electrónico743 páginas9 horas

La evaluación en la mira: Una examinación crítica y propositiva para la evaluación educativa a nivel nacional, docente y de aula

Calificación: 0 de 5 estrellas

()

Leer vista previa

Información de este libro electrónico

Las y los profesores de las escuelas –seguramente más que nadie– entienden y experimentan de qué manera las pruebas estandarizadas nacionales e internacionales, evaluaciones docentes, bonos de desempeño, entre otros, son parte constitutiva de su labor y conforman tecnologías políticas que no son inocuas. La evaluación es una de las herramientas políticas de regulación masiva más ampliamente extendida sobre los sistemas educativos. El propósito de este libro es poner la evaluación en la mira, bajo una lupa, examinarla críticamente a partir del conocimiento acumulado en el área y, a su vez, avanzar hacia un nuevo paradigma evaluativo y proponer nuevos escenarios posibles.
IdiomaEspañol
EditorialEdiciones Universidad Alberto Hurtado
Fecha de lanzamiento1 mar 2025
ISBN9789563575118
La evaluación en la mira: Una examinación crítica y propositiva para la evaluación educativa a nivel nacional, docente y de aula

Relacionado con La evaluación en la mira

Libros electrónicos relacionados

Métodos y materiales de enseñanza para usted

Ver más

Comentarios para La evaluación en la mira

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    La evaluación en la mira - Alejandra Falabella

    PRIMERA PARTE

    EVALUACIONES NACIONALES E INTERNACIONALES

    CAPÍTULO 1

    LA EXPANSIÓN GLOBAL DE LAS PRUEBAS DE DESEMPEÑO: INSTRUMENTACIÓN Y TRAYECTORIAS EN TIEMPOS DE RENDICIÓN DE CUENTAS Y ASEGURAMIENTO DE LA CALIDAD EDUCATIVA

    Antoni Verger , Clara Fontdevila y Lluís Parcerisa

    La gobernanza de los servicios públicos se rige, cada vez más, por políticas que enfatizan la recolección de información y la definición de códigos y estándares de buenas prácticas (Le Galès, 2011). Muchos gobiernos adoptan este tipo de políticas debido a la capacidad de control que les otorgan sobre el comportamiento y los resultados de los proveedores de servicios (Scott, 2000). En el sector educativo, los instrumentos de gobernanza que han proliferado bajo este nuevo paradigma incluyen evaluaciones de desempeño a gran escala, políticas de rendición de cuentas (RdC) y la definición de estándares de aprendizaje. Concretamente, las evaluaciones de desempeño a gran escala, que consisten en la evaluación censal del aprendizaje de los y las estudiantes a través de pruebas estandarizadas, son uno de los instrumentos que se ha expandido más rápidamente en los últimos años, adquiriendo una dimensión global (Ramírez et al., 2018).

    La combinación de evaluaciones de desempeño¹⁰, RdC y estándares de aprendizaje constituye un dispositivo político coherente y eficaz (Ball et al., 2017, p. 4) que, entre otras funciones, permite monitorear el desempeño de los centros educativos y del personal docente, a la vez que genera presión competitiva en las escuelas (Teltemann y Jude, 2018). En el contexto de la RdC basada en pruebas estandarizadas, tanto las escuelas como el personal docente se enfrentan a consecuencias que pueden ser muy variadas –materiales o reputacionales, individuales o colectivas– dependiendo de su desempeño y conformidad con los estándares de aprendizaje oficiales. Se trata de un fenómeno que pone de manifiesto la creciente importancia que la política educativa otorga a la medición y mejora del rendimiento educativo. Sin embargo, y a pesar de la dimensión global de este fenómeno, su origen e impacto han sido analizados principalmente en países anglosajones, donde estos sistemas se alinean más abiertamente con los principios del neoliberalismo y de la mercantilización educativa, adoptando un enfoque de RdC de altas consecuencias (o high stakes). Ahora bien, con el avance de la globalización y la competencia internacional por la excelencia educativa, ha aumentado rápidamente el número de países que han implementado políticas similares, con el objetivo de monitorear y potenciar la competitividad de sus sistemas educativos. La adopción de estas prácticas más allá del contexto anglosajón sugiere una tendencia global hacia la estandarización y la generalización de la RdC en materia educativa –si bien, como veremos, los efectos y adaptación de estas políticas varían significativamente de un país a otro–.

    En este capítulo argumentamos que, a pesar de sus orígenes estrechamente vinculados a la agenda neoliberal, la adopción, recepción y evolución de la RdC basada en pruebas de desempeño no es un proceso uniforme, sino que varía significativamente en función del contexto y se cristaliza en distintas trayectorias políticas (Kauko et al., 2018; Maroy et al., 2017). Instrumentos como las evaluaciones de desempeño y la RdC se han difundido a nivel mundial, pero sus usos (y la intensidad de dichos usos) dependen de las especificidades de los entornos políticos e institucionales en los que estos instrumentos se integran. El enfoque de la sociología política de los instrumentos (Lascoumes y Le Galès, 2007; Simons y Voß, 2018), combinado con premisas analíticas del institucionalismo histórico (Thelen, 2004), nos permite analizar el fenómeno de la globalización de la RdC basada en pruebas de desempeño y sus múltiples configuraciones a escala global.

    Sobre la base de este enfoque, prestamos especial atención a tres ejes analíticos: en primer lugar, a las lógicas de elección de las pruebas estandarizadas y de la RdC como instrumentos de gobernanza en diferentes países; en segundo lugar, a la evolución de los usos de dichos instrumentos en los distintos sistemas educativos; y en tercer lugar, a las nuevas subjetividades e intereses generados por estos instrumentos. En las secciones que siguen, presentamos los resultados de nuestro estudio de acuerdo con estos ejes. Para la elaboración del capítulo, hemos revisado un corpus de 158 artículos académicos sobre reformas contemporáneas de la gobernanza educativa en diferentes países.¹¹ La búsqueda se realizó en la base de artículos académicos Scopus, aunque para aquellos países subrepresentados en la literatura recurrimos también a literatura gris y a las recomendaciones de informantes clave.

    Elección de instrumentos:

    tres lógicas en las que se sustentan las reformas de la gobernanza educativa

    En esta primera sección de resultados ponemos de relieve que los regímenes político-administrativos de los países actúan como mediadores en la adopción de políticas de RdC basada en pruebas. Para ello, nos basamos en las categorías desarrolladas por Pollitt (2007) y Pollitt y Bouckaert (2017) en sus estudios sobre la recepción y evolución de las reformas de Nueva Gestión Pública (NGP) en países industrializados. Estos autores distinguen entre diferentes tradiciones administrativas, de las que destacamos la liberal (o promercado), la neoweberiana y la napoleónica. La tradición liberal, predominante en países anglosajones, se caracteriza por un cierto pragmatismo, la orientación al cliente, la gestión por resultados, y la activación de mecanismos de mercado para una provisión más eficiente de servicios públicos. La tradición neoweberiana, sobre todo aquella que predomina en los países del norte de Europa, se caracteriza por sus altos niveles de transparencia, descentralización e igualitarismo. Finalmente, la tradición napoleónica, predominante en los países del sur de Europa, se caracteriza por el legalismo, el centralismo y una cierta uniformidad en la concepción de los servicios públicos y la relación entre los ciudadanos y el Estado.

    La tipología de trayectorias de políticas que detallamos a continuación no tiene un carácter exhaustivo. En primer lugar, porque se basa en los regímenes administrativos más ampliamente documentados en los estudios de política comparada. Muchos países de América Latina, África o Asia no han sido tipificados desde esta perspectiva o bien han sido clasificados en categorías muy genéricas que dificultan el análisis de tendencias (Peters, 2021). Además, nuestra tipología no refleja todas las posibles manifestaciones de las reformas de RdC en educación, sino aquellas que están más presentes en la literatura sobre las causas y trayectorias de la política educativa. De nuevo, la mayoría de regiones del mundo están subrepresentadas en este ámbito de estudio. Es también importante señalar que los países federales son especialmente difíciles de clasificar, dado que los distintos estados o regiones autónomas dentro de un mismo contexto federal pueden presentar trayectorias de reforma diferentes e incluso divergentes.

    Lógica de mercado:

    adopción de la RdC basada en pruebas para expandir la competencia y la elección escolar

    En países anglosajones como Estados Unidos, Inglaterra y Nueva Zelanda, pero también en Chile, las reformas del sector público han sido a menudo inspiradas en los principios de libre mercado y de la teoría de la elección pública. En el marco de la crisis económica global de la década de 1970, las ideas neoliberales cobraron protagonismo en las agendas políticas de dichos países (Falabella, 2015; Hursh, 2005). En ellos, las herramientas de la NGP (gestión por resultados, descentralización, flexibilidad, etc.) se utilizaron estratégicamente para promover la mercantilización y la privatización de los servicios públicos. Las reformas educativas adoptaron un enfoque promercado y comportaron la adopción de nuevos instrumentos de gobernanza educativa con los que gestionar un conjunto cada vez más complejo, heterogéneo y fragmentado de proveedores educativos.

    Los primeros países en adoptar el enfoque de la NGP en la educación partían de la premisa que la RdC basada en pruebas, la libre elección de escuela y la competencia entre centros educativos podían desencadenar un círculo virtuoso de mejora escolar. De acuerdo con ello, en estos países las pruebas estandarizadas y las medidas de RdC a menudo se implementaron en combinación con políticas de privatización exógena (como vouchers, cheques escolares u otras formas de subsidios públicos para escuelas privadas) con el propósito de estimular la competencia en el mercado educativo y empoderar a las familias en su rol de clientes (Ball, 2008; Clarke et al., 2000). Las pruebas estandarizadas se concebían como un instrumento fundamental para recoger datos sobre el desempeño de las escuelas, orientar la elección escolar de las familias y promover una RdC, no solo administrativa sino de mercado.

    En muchos casos, estas reformas educativas se justificaron a través de un discurso persistente sobre los déficits y limitaciones de la educación pública y la baja calidad de las escuelas públicas, generalmente atribuida a reglas burocráticas onerosas y a la ausencia de incentivos en el sector público (Falabella, 2015; Hursh, 2005; Whitty y Wisby, 2016). En estos países, la necesidad de adoptar mecanismos de evaluación y control más estrictos fue justificada por un discurso a menudo hostil hacia el personal docente y sus sindicatos. En tal contexto de desconfianza hacia la educación pública, la RdC basada en pruebas y los estándares de aprendizaje se presentó como una solución política con la que incrementar el control estatal sobre las escuelas públicas, el trabajo del personal docente y el currículum (Whetton, 2009).

    En Inglaterra y Chile, este modelo de gobernanza educativa se adoptó en los años 1980 y ha gozado de una notable continuidad en el tiempo, en gran parte debido a que tiene sus orígenes en un proceso más profundo de reestructuración del rol del Estado en la provisión de servicios. En ambos países, los sistemas de RdC basados en pruebas han devenido más complejos y sofisticados, y sus usos se han intensificado gradualmente por parte de gobiernos de distinto signo político (Ball, 2008; Parcerisa y Falabella, 2017).

    En los Estados Unidos, las reformas del mercado educativo promovidas durante la década de 1980 tuvieron un impacto moderado, con variaciones significativas entre los estados (Klitgaard, 2007). A diferencia de otros contextos, la libertad de elección de escuela y la RdC basada en pruebas no se regularon inicialmente como un paquete unificado de reforma educativa a nivel federal. No fue hasta la promulgación de la Ley No Child Left Behind (NCLB) a principios de los 2000 que la RdC comenzó a definir más claramente la agenda educativa, marcando un punto de inflexión hacia políticas de altas consecuencias (Betebenner et al., 2005). El proceso político que dio lugar a la Ley NCLB combinó discursos sobre competitividad y elección escolar con argumentos a favor de la equidad racial y socioeconómica, así como la reducción de las brechas de rendimiento educativo entre distintos grupos sociales (Hursh, 2005). Esta ley instauró lógicas de RdC que facilitaron la conversión de escuelas públicas de bajo desempeño en escuelas charter, ampliando así las opciones de elección de escuela y la posibilidad de salida del sector público para las familias.

    Aseguramiento de la calidad en Estados neoweberianos: la nueva gobernanza viaja a la Europa continental

    Desde mediados de la primera década de los 2000, instrumentos de gobernanza como las evaluaciones externas y la RdC se han adoptado ampliamente en Europa continental, y concretamente en aquellos países del norte y centro de Europa en los que prevalece un régimen político-administrativo neoweberiano. Se trata de países en los que el Estado mantiene un rol protagónico en la solución de problemas sociales, pero que en los últimos años ha intentado modernizar su burocracia, haciéndola más profesional, eficiente y cercana a los ciudadanos. En los Estados neoweberianos, las evaluaciones externas y los instrumentos de RdC en educación fueron inicialmente concebidos como una forma de garantizar estándares de calidad por parte del Estado, en un contexto de sistemas educativos altamente descentralizados. En los años 1980 y 1990, países nórdicos como Dinamarca, Suecia o Noruega transfirieron numerosas competencias y responsabilidades en educación a los gobiernos locales (Hatch, 2013; Moos, 2014). La descentralización de los servicios públicos se adoptó por razones de eficiencia y como una forma de conseguir que respondieran mejor a las demandas de la ciudadanía. Sin embargo, la descentralización conllevó una cierta pérdida del control educativo a la administración central del Estado, y algunos actores claves comenzaron a cuestionar si el gobierno central contaba con las herramientas necesarias para monitorear la calidad de la educación (Tveit, 2009).

    Los gobiernos de Noruega y Dinamarca comenzaron a enfocarse en el control de calidad educativa tras la publicación del primer informe PISA de la OECD en 2001. Los resultados, percibidos como insatisfactorios, reforzaron la percepción de una crisis de aprendizaje y abrieron la puerta a la influencia de grupos de expertos y reformadores educativos. En estos países, el motivo de alarma que impulsó el proceso de reforma no fue únicamente la calidad promedio del sistema educativo, sino también las amplias disparidades en los resultados de aprendizaje entre alumnos en función de su origen social (Camphujisen et al., 2021). Como respuesta a ello, los países nórdicos adoptaron un enfoque de gestión educativa basado en resultados, con currículums más centralizados y evaluaciones externas para monitorear el desempeño de gobiernos locales y escuelas (Møller y Skedsmo, 2013; Ydesen, 2013). También se crearon sistemas de aseguramiento de la calidad y de inspección escolar, así como nuevas unidades de evaluación educativa (Helgoy y Homme, 2007).

    En Europa central, países como Alemania, Austria y los Países Bajos experimentaron un proceso de reforma educativa similar, introduciendo o reforzando sistemas de evaluación externa y RdC para recuperar el control sobre el currículum y mejorar los resultados de aprendizaje. En Alemania, por ejemplo, los bajos puntajes obtenidos en PISA generaron un "shock" educativo que dio lugar a un proceso de reforma para fomentar una gobernanza escolar más orientada a los resultados. Estas reformas incluyeron una mayor autonomía escolar y el seguimiento centralizado de los estándares educativos, junto con la expansión de la formulación de políticas basadas en la evidencia. Estas reformas fueron más intensas en los länder (o estados) alemanes que obtuvieron peores resultados en PISA (Niemann et al., 2017). Sin embargo, a pesar del creciente énfasis en la RdC, los sistemas adoptados en Alemania fueron predominantemente de bajas consecuencias (o low stakes), como ha sucedido en la mayoría de los Estados neoweberianos (Thiel et al., 2017).

    En resumen, en la Europa del norte y central, la adopción de nuevos instrumentos y prácticas de evaluación y RdC vino motivada por las presiones competitivas generadas sobre todo por evaluaciones internacionales como PISA que, entre otras cosas, pusieron de manifiesto la necesidad de recentralizar el control sobre los resultados educativos por parte de los gobiernos nacionales (ver capítulo 2 de este libro).

    Modernización educativa en los Estados napoleónicos: adopción parcial y desigual de instrumentos de gobernanza

    En los Estados con un modelo de administración pública napoleónico, que es el que impera en los países del sur de Europa (tales como Portugal, España, Francia, Italia, Grecia), se han intentado implementar reformas de modernización de los servicios públicos reiteradamente, aunque estas no siempre han generado los cambios esperados (Gallego, 2003; Kickert, 2007). En estos países las reformas educativas gerenciales se han adoptado de forma tardía, sin suficiente respaldo político y sin seguir necesariamente un plan de reforma integral. Además, la implementación de los instrumentos de RdC ha sido desigual y muy condicionada por las tensiones políticas y la coyuntura económica.

    En estos países, donde la mayoría de docentes son funcionarios públicos con altos niveles de autonomía pedagógica, las evaluaciones externas se han introducido principalmente como respuesta a la percepción de falta de control sobre lo que sucede en el aula, y con el objetivo de promover el mejoramiento escolar (Carvalho y Costa, 2017). Estos instrumentos también buscan modernizar la gobernanza del sistema educativo, en sintonía con normas y discursos internacionales que valoran la profesionalización de la dirección escolar y una gestión basada en resultados. Sin embargo, estas iniciativas no se han implementado dentro de un marco de reformas coherentes y, a menudo, han carecido de los recursos necesarios, lo que ha resultado en interrupciones y discontinuidades en su aplicación (Serpieri et al., 2012). Además, aunque las escuelas reciben regularmente los resultados de las pruebas estandarizadas, estos suelen ser utilizados de manera ritualista, sin que impliquen cambios significativos en la toma de decisiones (Pagès, 2021).

    Estos nuevos instrumentos en los países del sur de Europa se asocian a una retórica de garantía de la calidad, aunque la teoría del cambio sobre cómo deben mejorar la calidad no siempre es explícita ni articulada. Otra característica de las reformas educativas en esta región es su fuerte énfasis en la autonomía escolar, que generalmente se traduce en la promoción de un estilo de liderazgo más jerárquico en las escuelas (Dobbins y Christ, 2017). La profesionalización y el empoderamiento de la dirección escolar representa un cambio significativo en países con una tradición de gobernanza escolar horizontal en el que el director o directora es un primus inter pares en el claustro de profesorado (Gairín Sallán, 2015). En países como Portugal, Grecia y España, la gobernanza escolar democrática (que valoriza la participación directa de las familias y el cuerpo docente en las decisiones más relevantes de la escuela) surgió como una reacción a décadas de regímenes autoritarios, que ejercían un firme control sobre el sistema educativo por razones políticas. No obstante, más recientemente este modelo ha sido cuestionado por su poca eficacia y por las dificultades de su correcta aplicación. Es sobre la base de este diagnóstico que se ha promovido la introducción de cambios gerenciales y nuevos estilos de liderazgo escolar, más orientados a la gestión por resultados y al uso de indicadores de desempeño en procesos de mejora escolar (Veloso et al., 2013; Verger y Curran, 2014).

    Usos nuevos y cambiantes:

    la evolución de las pruebas de desempeño y los sistemas de RdC

    Para comprender el impacto de las pruebas de desempeño y de la RdC en la gobernanza educativa es necesario ir más allá de investigar la adopción de políticas y comprender cómo dichas políticas se despliegan, evolucionan y mutan con el paso del tiempo. Una de las premisas de partida de este estudio es que los instrumentos de política se adaptan a las nuevas circunstancias que emergen con el paso del tiempo, adquiriendo nuevos usos y propósitos (Thelen, 2004; Vetterlein y Moschella, 2014). Estas adaptaciones se pueden producir de manera intencionada, pero a veces se producen por inercia o por cambios en el contexto de implementación, de manera que la evolución y los efectos de dichos instrumentos son a menudo impredecibles (Mahoney, 2000; Bezes, 2007).

    En esta sección se analiza separadamente la evolución de las pruebas de desempeño y de los sistemas de RdC. Ello debido a que, si bien ambos instrumentos acostumbran a estar imbricados en los sistemas educativos, desde la perspectiva de sus usos se trata de instrumentos objetivamente distintos: las pruebas de desempeño son instrumentos destinados a evaluar y recopilar información, que se pueden centrar exclusivamente en la toma de decisiones de planificación educativa (sobre todo cuando se llevan a cabo de manera muestral y con fines diagnósticos), mientras que la RdC refiere a instrumentos explícitamente destinados a moldear el comportamiento de los proveedores de servicios en base a las consecuencias asociadas a la evaluación de resultados (Hood, 2007). De modo que es esperable que la evolución de dichos instrumentos en los sistemas educativos difiera.

    Expansión e intensificación de las evaluaciones de desempeño

    Los instrumentos de evaluación y recopilación de datos, como las pruebas de desempeño, tienden a permanecer relativamente estables a lo largo del tiempo. No solo se trata de intervenciones cuyos beneficios para la administración educativa superan los costes, sino que además constituyen un instrumento ideológicamente maleable que puede acomodar distintas agendas políticas. El principal cambio experimentado por las pruebas de desempeño está relacionado con su sofisticación y expansión. Con el paso del tiempo, la frecuencia y el alcance de las evaluaciones nacionales tienden a aumentar. Los cambios en las evaluaciones suelen ser el resultado de preocupaciones sobre la confiabilidad o relevancia de las pruebas, por ejemplo, cuando se introducen cambios para asegurar una mejor alineación con los estándares curriculares o cuando las materias evaluadas se amplían debido a preocupaciones sobre la reducción del currículum. Estas preocupaciones a menudo son desencadenadas por el creciente número de usos y funciones que se otorgan a las pruebas de desempeño, lo que convierte su validez en una cuestión crucial.

    Este patrón de intensificación se puede observar en diferentes contextos, pero es particularmente evidente en los países con una tradición administrativa liberal, es decir, aquellos que han sido pioneros en la adopción de la NGP, como Chile e Inglaterra. En Chile, a finales de los años 1990 y principios de los 2000, y a medida que las preocupaciones sobre la calidad de la educación adquirían mayor centralidad en la agenda educativa, se implementaron una serie de cambios para alinear el currículum y las evaluaciones nacionales (Gysling, 2015). Las pruebas se reorientaron progresivamente hacia la evaluación de un marco curricular nacional, con lo que se pretendía medir habilidades cognitivas de orden superior mediante la introducción de nuevos tipos de preguntas. Asimismo, durante el período 2005-2014 se agregaron nuevos grados y asignaturas al marco de evaluación nacional, y se intensificó la frecuencia de las pruebas para permitir el seguimiento de los y las estudiantes a lo largo del tiempo (Bravo, 2011; Inzunza y Campos-Martínez, 2016).

    En otros casos, el ciclo de pruebas no se modifica o intensifica, pero se diseñan nuevas herramientas de monitoreo –por ejemplo, desagregando datos para facilitar la toma de decisiones, creando nuevos sistemas de clasificación de escuelas o desarrollando nuevas medidas compuestas (índices, tipologías, etc.)–. La introducción de medidas adicionales y herramientas más sofisticadas es la consecuencia lógica de la creación de organizaciones especializadas (normalmente, agencias de evaluación independientes de las autoridades educativas) cuya principal responsabilidad es supervisar y hacer uso de un volumen de datos creciente. Estas dinámicas se pueden observar claramente en Inglaterra donde, si bien las pruebas de desempeño se mantuvieron relativamente estables (en términos de número y frecuencia) desde su introducción con la Ley de Reforma Educativa (Education Reform Act) de 1988, el número y la sofisticación de la información relacionada con el desempeño ha aumentado (por ejemplo, con la adopción de los Pupil Achievement Trackers y de los informes Performance and Assessment). Además, en 2010, una serie de decisiones contribuyeron a la consolidación y expansión del marco de la evaluación de desempeño. Esto incluyó la introducción de una nueva prueba (Phonics Screening Check, aplicada a niños y niñas de seis años), la simplificación del Early Years Foundation Stage Profile (para niños y niñas de cinco años) y el establecimiento de una nueva medida de desempeño ligada a la proporción de estudiantes que adquieren puntuaciones elevadas en el Certificado General de Educación Secundaria¹², entre otras (Bradbury, 2014; Mansell, 2011).

    Estados Unidos ejemplifica también la naturaleza expansiva de las pruebas estandarizadas. La aprobación de NCLB en 2001 estableció un marco de evaluación extenso al requerir que los estados examinaran a los y las estudiantes en varios momentos de la educación obligatoria. Esta tendencia incremental se vio reforzada por la adopción del programa Race to the Top impulsado por la administración del presidente Obama. Entre otras medidas, esta ley federal alentó a los estados a adoptar estándares de aprendizaje y evaluaciones más rigurosas con las que medir con precisión el progreso de las y los estudiantes hacia esos estándares, así como el desarrollo y uso de sistemas de datos integrales para rastrear el rendimiento de los y las estudiantes y la efectividad de los y las docentes, que dependían en gran medida de los resultados de las pruebas estandarizadas (Lee and Wu, 2017).

    La RdC basada en desempeño:

    un instrumento en constante evolución

    Los sistemas de RdC han evolucionado a un ritmo diferente al de las pruebas estandarizadas, ya que han tendido a desplegarse de forma más gradual y desigual. Por ejemplo, es habitual que algunos de sus componentes y usos se descarten poco tiempo después de su implementación. Sin embargo, estas dinámicas se desarrollan de manera distinta, y sus usos varían en función de las diferentes tradiciones administrativas esbozadas anteriormente.

    En el caso de los países con una tradición administrativa liberal, las consecuencias de las pruebas han tendido a aumentar e intensificarse. Esto ocurre no solo porque las consecuencias reputacionales y de mercado tienden a reforzarse con el tiempo, sino también porque a menudo se agregan consecuencias administrativas al sistema de RdC. En los Estados Unidos, la intensificación de las pruebas de desempeño acabó marcando la agenda de la evaluación docente. Programas federales como Race to the Top promovieron el desarrollo de sistemas de evaluación docente que otorgaban mucha relevancia al aumento en los resultados de aprendizaje de los y las estudiantes, medido mediante pruebas estandarizadas. En este contexto, los denominados modelos de valor agregado (value added models) han llegado a ocupar un lugar central en la gobernanza del profesorado en varios distritos y estados del país como Florida, Nueva York, Ohio, Tennessee y Texas (Amrein-Beardsley y Holloway, 2017; Baker et al., 2013).

    En Chile, la prueba nacional Simce, creada inicialmente para orientar la elección escolar de las familias, guiar el trabajo pedagógico y controlar la enseñanza del curriculum (Meckes y Carrasco, 2010; Falabella, 2015), fue acompañada en 1995 de una bonificación salarial vinculada al desempeño de las escuelas, así como a sanciones y medidas administrativas adicionales (Flórez, 2013). En la primera década de los 2000, los subsidios escolares para estudiantes de bajos ingresos se condicionaron al cumplimiento de metas de aprendizaje por parte de las escuelas. Además, en este marco, las escuelas con bajos puntajes pasaban a ser supervisadas más estrictamente, perdían la capacidad de gestionar en forma autónoma los fondos públicos y se arriesgaban al cierre si no mostraban signos de mejora en los años posteriores. Algunas de estas nuevas disposiciones administrativas –incorporadas en la Ley de Subvención Escolar Preferencial (Ley N° 20.248)– fueron adoptadas por el gobierno de centroizquierda de la Concertación (2006-2010) como un medio para corregir las fallas del mercado y reforzar el papel del Estado como agente regulador. Al mismo tiempo, estos mismos cambios fueron apoyados por la derecha, ya que eran percibidos como una manera de reformar la educación que permitía preservar y sofisticar el funcionamiento del mercado escolar (Parcerisa y Falabella, 2017).

    De forma similar, en Inglaterra, las consecuencias asociadas a las pruebas estandarizadas aumentaron hacia finales de la década de los 1990 y principios de los 2000, con el gobierno del Nuevo Laborismo. Algunas de las consecuencias de las evaluaciones tenían un carácter reputacional, incluyendo la publicación de los resultados, en combinación con la intensificación de la agenda de elección y competencia escolar (Mansell, 2011; Muijs y Chapman, 2009). Sin embargo, también se agregaron otras consecuencias de carácter material y administrativo. Se incluyeron políticas de intervención soft para las escuelas con bajos puntajes, así como fórmulas de bonificación salarial basadas en el rendimiento (Mansell, 2011; Whetton, 2009). Estos cambios supusieron una desviación importante del sistema de RdC establecido con la Ley de Reforma Educativa de 1988, que se sustentaba en una lógica de mercado. No obstante, la reforma aprobada por el gobierno de coalición formado por conservadores y liberales después de las elecciones de 2010 significó un cierto retorno a un sistema de RdC basado en lógicas de mercado. Las nuevas regulaciones redujeron el papel y la capacidad de intervención de los servicios de inspección sobre las escuelas con un desempeño satisfactorio, ya que los centros que obtenían calificaciones sobresalientes pasaban a considerarse exentos de la inspección regular (Mansell, 2011).

    En los llamados Estados neoweberianos resulta más difícil discernir un patrón de intensificación de las medidas de RdC. De hecho, en algunos de estos casos incluso es posible detectar una cierta desaceleración de la agenda de la RdC, producto de la eliminación de las consecuencias reputacionales que se adoptaron inicialmente, y un mayor control por parte de la profesión docente en el marco de los sistemas de RdC, con una tendencia a avanzar hacia sistemas de RdC más reflexivos y horizontales. Así, aunque muchos países nórdicos han experimentado con la publicación de los resultados de las pruebas estandarizadas, la mayoría de ellos finalmente han dejado de hacerlo, al menos a nivel nacional, debido a las dudas sobre la calidad y confiabilidad de las medidas, pero también debido a la respuesta crítica de actores educativos y de la sociedad civil.

    El caso de Noruega permite ilustrar estas lógicas de ajuste y reversión. En 2005, una coalición liderada por los conservadores introdujo un sistema nacional de evaluación que incluía por primera vez una prueba de desempeño estandarizada. El gobierno conservador que impulsó esta reforma esperaba crear presión sobre las escuelas mediante la combinación de la publicación de los resultados y la introducción de mayores niveles de elección escolar. Sin embargo, la publicación de los resultados de la prueba se suspendió aquel mismo año con la llegada al poder de una nueva coalición de centroizquierda (Camphuijsen et al., 2018; Hatch, 2013). Con el tiempo, los y las docentes noruegos han recuperado el control sobre el sistema de RdC a través de sus órganos de representación profesional, pero también a nivel de escuela. Los sistemas de RdC son actualmente vistos como una forma de favorecer la transparencia en el sector público y como una fuente válida de datos para la mejora educativa. A diferencia de lo observado en otros contextos, la RdC no es percibida como el resultado de la desconfianza del gobierno con los y las docentes, ni como un dispositivo que socava su autonomía profesional (Parcerisa et al., 2022). En Dinamarca se ha documentado un patrón similar. En 2005 se publicaba una orden que exigía que las escuelas publicaran información relevante en sus sitios web, incluidos los resultados de la evaluación y la enseñanza, y el Ministerio de Educación experimentó con la publicación de rankings escolares. No obstante, la publicación de los resultados escolares siguió siendo un tema altamente controvertido, y la coalición de centroizquierda que llegó al poder en 2011 suspendió la publicación de los rankings de escuelas (Ydesen y Andreasen, 2014).

    En cualquier caso, cabe tener en cuenta que la publicación de los resultados escolares puede acabar resurgiendo a pesar de no ser promovida por las autoridades educativas. En Noruega, aun cuando el gobierno nacional no publica los puntajes de las escuelas, muchos gobiernos municipales o incluso medios de comunicación locales lo hacen, aprovechando las reglas de transparencia en la administración pública. De manera similar, en la Columbia Británica (Canadá), no es el gobierno nacional sino el Instituto Fraser, un centro de pensamiento comprometido explícitamente con una agenda de desregulación y mercantilización de la educación, el que difunde los resultados obtenidos por los centros educativos (Simmonds y Webb, 2013).

    En los Estados napoleónicos, las reformas de RdC suelen avanzar a través de una lógica de ensayo y error y exhiben una dinámica pendular caracterizada por discontinuidades frecuentes. La RdC basada en pruebas sigue estando relativamente poco desarrollada y la evolución de las consecuencias depende de forma más evidente que en los casos anteriores de la orientación política del gobierno. Los intentos de introducir alguna forma de evaluación de directivos escolares en Italia ilustran bien esta dinámica. A principios de la década de los 2000, el gobierno de centroderecha puso en marcha una serie de pruebas piloto de evaluación de directores. Aunque la participación en la evaluación era voluntaria, la iniciativa generó un gran rechazo, en parte porque algunos actores asumieron que las pruebas piloto eran solo el primer paso antes de la implementación de la evaluación obligatoria. La iniciativa se suspendió en 2006, cuando llegó al poder una coalición de centroizquierda. Sin embargo, la elección de un nuevo gobierno de centroderecha en 2008, junto con el nombramiento de un ministro de educación explícitamente comprometido con la meritocracia educativa, devolvió la evaluación de directores a la agenda política (Grimaldi y Serpieri, 2013). A principios de la década de 2010 se presentó un nuevo proyecto que establecía la evaluación voluntaria de escuelas y docentes, dando lugar en 2012 a un modelo de evaluación experimental que integra la medición del valor agregado de la escuela y la evaluación de directores (Serpieri et al., 2015). Aun así, no fue hasta el año 2015 con la reforma educativa La Buona Scuola, aprobada por un gabinete tecnocrático, que la evaluación de directores se consolidó como parte del nuevo marco de RdC (Montefiore, 2018).

    Dinámicas similares se observan en la Comunidad de Madrid en España. A principios de la década de los 2000, el gobierno conservador de esta región introdujo una serie de medidas de RdC combinadas con políticas promercado, incluida la implementación de una prueba estandarizada censal, la publicación de los resultados escolares en dicha prueba y un aumento de la libertad de elección de escuela. Con estas políticas, esta región tomó una trayectoria de mercado atípica que, aparentemente, no encajaba bien con las principales características de la tradición administrativa napoleónica predominante en el contexto español. La adopción de estas reformas por parte de un gobierno conservador se debe en gran parte al fuerte liderazgo, el espíritu emprendedor y el estilo de gobierno de arriba hacia abajo de la presidenta Aguirre (2003-2012), quien estaba ideológicamente comprometida con la libertad de elección escolar. Sin embargo, la reforma no resistió a la renuncia de Aguirre en 2012, y el nuevo gobierno, a pesar de continuar en manos del mismo partido político, redujo la frecuencia de las pruebas y abandonó algunas de las disposiciones más promercado, como la publicación de resultados escolares (Pagès y Prieto, 2020).

    Cabe señalar finalmente que los estados federales o altamente descentralizados merecen una consideración aparte. En estos casos, el aumento progresivo de las consecuencias ocurre generalmente a nivel subnacional. Por lo tanto, incluso si el gobierno federal no establece consecuencias materiales o de carácter administrativo ligadas a las evaluaciones nacionales, las autoridades locales o estatales pueden aprovechar la existencia de estos instrumentos para adoptar e intensificar sus propias medidas de RdC (ver, por ejemplo, Gable y Lingard, 2015; Termes y Mentini, 2018, en relación con los casos de Australia y Brasil, respectivamente).

    La aparición de nuevos sujetos económicos y políticos

    Una vez seleccionados e implementados, los instrumentos de política privilegian a ciertos actores y sus intereses y, por lo general, estimulan la generación de nuevas coaliciones y grupos de interés. Se trata de nuevas formas de agencia configuradas por actores políticos o económicos orientados a desarrollar, mantener y expandir un modelo instrumental específico de gobierno (Simons y Voß, 2018, p. 31), y que, por tanto, pueden sacar partido a la intensificación del uso de los instrumentos en cuestión. A la vez, estos mismos instrumentos pueden perjudicar a otros grupos y, en consecuencia, desencadenar reacciones críticas y diferentes formas de resistencia.

    El papel de los intereses económicos

    Las reformas de la gobernanza educativa han contribuido a la emergencia y al fortalecimiento de una industria de pruebas estandarizadas y de medición del rendimiento escolar. La expansión de los intereses económicos privados en las actividades de evaluación y medición es, de hecho, un factor relevante para entender el actual nivel de difusión de las evaluaciones externas e instrumentos de RdC en determinados contextos. Como reconoce la misma OCDE (2013), la rentabilidad de la industria de la evaluación educativa y del aprendizaje implica que las empresas tengan fuertes incentivos para presionar por la expansión de la evaluación estandarizada de los estudiantes como política educativa¹³ (p. 51).

    La presencia de esta industria es mayor en los países con una tradición administrativa liberal. En estos países, empresas, consultorías y centros de investigación son contratados por los gobiernos de manera habitual para el diseño, la administración y el análisis de datos de las evaluaciones nacionales (Burch, 2006)¹⁴, siendo Pearson, ETS o ACER algunos de los nombres más conocidos. Estas mismas organizaciones pueden ofrecer también servicios de mejora escolar, planes de lecciones o plataformas educativas a los gobiernos locales y a las escuelas que buscan mejorar su rendimiento (Hogan et al., 2016). Se trata de un segmento de mercado especialmente lucrativo en países como Inglaterra y Chile, donde las pruebas estandarizadas tienen consecuencias directas para los centros educativos.

    La creciente implicación de grupos de interés en actividades de evaluación educativa explica que las evaluaciones de desempeño y la RdC basada en resultados se expandan no solo hacia nuevos territorios, sino también hacia nuevos ámbitos y niveles educativos. Cuando los intereses políticos y económicos de estos grupos son fuertes, hay más razones para esperar que estos instrumentos de política perduren en el tiempo, independientemente de su eficacia (Dale, 2018). Así, el rol y capacidad de influencia de los grupos que administran los instrumentos de evaluación (o prestan servicios relacionados) es clave para explicar la continuidad de la RdC basada en pruebas, incluso cuando la eficacia de un uso intensivo de las pruebas estandarizadas es cuestionada.

    La emergencia de voces críticas

    La rápida expansión de instrumentos de política como las pruebas estandarizadas o la RdC se ha visto favorecida por el hecho de que, en muchas ocasiones, estos instrumentos se han adoptado sobre la base de argumentos y debates puramente técnicos. A menudo se presentan como medidas políticamente neutras, y su adopción puede pasar desapercibida para la mayoría de la población. En el caso concreto de las evaluaciones nacionales, estas suelen adoptarse como instrumentos de recolección de datos no intrusivos, que a menudo se llevan a cabo en los inicios a nivel muestral (no censal). Además, el efecto de estas pruebas sobre docentes y escuelas no es evidente desde el principio. Todo ello dificulta la articulación de formas organizadas de oposición, así como la emergencia de argumentos consistentes y críticos con estos instrumentos. Sin embargo, con el paso del tiempo y en determinadas circunstancias, estos instrumentos han generado reacciones críticas. La RdC basada en resultados es el instrumento de gobernanza más polémico, especial pero no solamente, cuando se asocia con consecuencias directas para docentes y centros educativos. Esta forma de RdC suele generar debates apasionados entre sus partidarios y detractores, y puede llegar a desencadenar episodios de resistencia colectiva (Pizmony-Levy y Woolsey, 2017).

    Si bien las respuestas abiertamente críticas son a veces lideradas por los sindicatos docentes, este no es siempre el caso. La RdC basada en resultados suele plantear dilemas políticos a las organizaciones docentes, razón por la cual sus respuestas son variadas y no siempre desafiantes. En Chile, por ejemplo, dirigentes del principal sindicato –Colegio de Profesores– no solo consintieron, sino que participaron activamente en la definición de nuevas formas de políticas de evaluación docente en el año 2004. En este entonces, vieron en estas políticas una oportunidad para aumentar los salarios del profesorado y de promover una evaluación del profesorado no centrada en los resultados de las pruebas de desempeño (Gindin y Finger, 2013; Vaillant, 2005); aunque no había una sola posición dentro del gremio, y se crearon divisiones internas. En este mismo país, como respuesta a la intensificación de la RdC basada en pruebas y la creciente presión hacia las escuelas y sus docentes, en el año 2013 surgió la campaña Alto al Simce, y en el año siguiente se creó la denominada Comisión Simce para evaluar el funcionamiento de la prueba e introducir mejoras. Las recomendaciones de esta comisión fueron claves para llevar a cabo la posterior reducción del número de pruebas y la promoción de un proyecto de ley para prohibir los rankings de escuelas (Inzunza y Campos-Martínez, 2016).

    Pese a la larga historia de instrumentos de evaluación en países de tradición liberal, el shock que representó la pandemia del Covid-19 favoreció que se pudiera pausar y repensar la política de evaluación. En un contexto en el que se priorizó el bienestar del alumnado y el profesorado, movimientos sociales y expertos de la educación trataron de promover debates para reconsiderar el modelo hegemónico de RdC basado en pruebas de desempeño y avanzar así hacia modelos de RdC más holísticos (véase Moss et al., 2021 para el caso de Inglaterra y Falabella et al., 2022 y Flórez-Petour, 2023, para el de Chile). Sin embargo, por lo que se desprende del caso chileno, a pesar de los intensos debates sobre los sistemas de evaluación y RdC que tuvieron lugar tanto a nivel parlamentario, como en redes sociales y medios de comunicación, no hay indicios de que estos movimientos vayan a derivar en cambios sustantivos, al menos en el corto plazo (El Mostrador, 2022).

    En Suecia las pruebas estandarizadas han generado poca controversia, en comparación con otros contextos. Allí, el profesorado no ve las evaluaciones de desempeño como un instrumento externo que desafía su autonomía, sino como una herramienta útil para apoyar su desarrollo profesional y establecer estándares de calidad en la educación (Helgøy y Homme, 2007). De forma similar, en Noruega, la adopción de pruebas de desempeño inicialmente generó mucho rechazo entre los colectivos de profesorado, que exigieron una moratoria de las pruebas para replantear la política. Desde entonces, los colegios profesionales docentes se implicaron más activamente en el diseño de la prueba para reforzar su validez y asegurar que esta genere datos que les puedan resultar útiles para la toma de decisiones. Como consecuencia de ello, actualmente las actitudes y opiniones del profesorado respecto a las pruebas externas son generalmente positivas (Mausethagen et al., 2020).

    En el sur de Europa, por el contrario, los sindicatos docentes han tendido a adoptar una posición abiertamente crítica y de rechazo a la RdC y las pruebas estandarizadas. En estos países, los sindicatos han sido y son especialmente beligerantes contra estos instrumentos, que perciben como un ataque a la autonomía docente y escolar. En el contexto portugués, por ejemplo, los sindicatos docentes consideran las evaluaciones nacionales como instrumentos represivos con reminiscencias al período dictatorial, y han articulado un movimiento de oposición muy contundente (Veloso et al., 2013). En Italia, la actitud beligerante de los sindicatos es crucial para entender las discontinuidades y los cambios experimentados por muchos programas e instrumentos de RdC (Barzanò y Grimaldi, 2013; Grimaldi y Serpieri, 2013). En este país, además, se adoptó también una política de autoevaluación de centros educativos para responder a las críticas que decían que la política de evaluación escolar estaba pivotando en exceso en pruebas de desempeño (Mentini y Levatino, 2023).

    Más allá de los sindicatos, la adopción de la RdC basada en pruebas también genera respuestas críticas por parte de otros agentes sociales, como los movimientos estudiantiles, algunos círculos académicos y, especialmente, las asociaciones de familias. Estos actores tienden de hecho a adquirir un rol más protagónico en contextos en los que los sindicatos adoptan una posición más ambigua o pasiva frente a las reformas de RdC o la extensión de los sistemas nacionales de evaluación. En Estados Unidos, por ejemplo, la rápida intensificación de las pruebas estandarizadas ha desencadenado la aparición de un movimiento social de boicot a estas pruebas conocido como opt-out movement, como han documentado Pizmony-Levy y Woolsey (2017). En Chile, se observan dinámicas similares con la emergencia de la plataforma Alto al Simce (Pino et al., 2016). Se trata de movimientos liderados por familias de clase media, académicos y colectivos de renovación pedagógica con una narrativa muy sofisticada en relación a los efectos no deseados de las pruebas estandarizadas en la práctica educativa (reducción del currículum, enseñanza orientada a la preparación de la prueba, etc.).

    Discusión y conclusiones

    En las últimas décadas, las pruebas de desempeño, los estándares de aprendizaje y la RdC se han convertido en elementos centrales de las reformas educativas emprendidas en la mayoría de los países de ingresos medios y altos. La expansión global de estos instrumentos refleja el impacto y la influencia del discurso educativo en torno a la evaluación de los aprendizajes y la RdC. No obstante, ni el proceso de instrumentación, es decir, el proceso político a través del cual se adoptan estos instrumentos, ni los usos que los gobiernos les están dando muestran una convergencia evidente.

    Las tradiciones administrativas de los países ejercen una influencia significativa en el proceso de adopción e implementación de estos nuevos instrumentos, y desempeñan así un rol estratégico en la comprensión de diversas trayectorias de políticas de gobernanza escolar. Por una parte, en los países anglosajones o aquellos con una organización liberal del Estado, la adopción de estos instrumentos de gobernanza ha estado más claramente asociada a una agenda educativa promercado. En dichos contextos, los instrumentos de evaluación y RdC basada en resultados se utilizan explícitamente para promover la competencia y la libre elección de escuela, y están más claramente vinculados a los rankings escolares, a la evaluación docente y a las fórmulas de remuneración basadas en el mérito. Con el paso del tiempo los instrumentos de RdC adoptados en estos países se han vuelto más sofisticados y han adquirido nuevas funciones. Estas políticas disfrutan de un amplio consenso entre los principales partidos políticos, lo cual favorece su sostenibilidad y continuidad.

    En los Estados neoweberianos del centro y sobre todo del norte de Europa, caracterizados por altos niveles de descentralización, los instrumentos de evaluación y RdC se han adoptado siguiendo una lógica de aseguramiento de la calidad y de equidad en el desempeño académico. En estos contextos, los principales partidos políticos coinciden en la importancia de las pruebas estandarizadas y en la transparencia de los resultados escolares, pero no siempre en los usos que se deben dar a estos instrumentos. Concretamente, la derecha se ha mostrado normalmente favorable a la elaboración de rankings y a la promoción de una mayor competencia de mercado, mientras que las fuerzas de izquierda han desincentivado este tipo de usos¹⁵. En consecuencia, la regulación de estos instrumentos de gobernanza varía mucho en función de la orientación política del partido de gobierno y de las especificidades de la política local.

    Por último, en los Estados napoleónicos, la RdC basada en pruebas estandarizadas se ha adoptado a nivel formal como parte de un esfuerzo de alineación con discursos y estándares internacionales de política educativa, pero la implementación de las políticas asociadas a la RdC ha sido muy desigual. De hecho, en muchos casos la implementación de estas políticas se encuentra en una fase incipiente y no afecta el día a día de los centros escolares de forma especialmente perceptible. Ello se debe, en parte, a la naturaleza de bajas consecuencias de las pruebas de desempeño, pero también a que la cultura burocrática de estos países sigue poco orientada a la gestión por resultados. En el contexto de los Estados napoleónicos es donde el avance de las reformas de RdC ha estado más claramente condicionado por la coyuntura política y económica. El consenso político en torno a las evaluaciones externas y la RdC basada en pruebas es frágil, y los sindicatos docentes se han opuesto más abiertamente a dichas políticas que en otros contextos.

    Sobre el carácter acumulativo de las reformas de la gobernanza escolar

    Las transformaciones en la gobernanza educativa descritas en este capítulo se caracterizan por ser fragmentarias y acumulativas. En la mayoría de los casos, el cambio político es el resultado de un proceso de acumulación de distintos instrumentos, técnicas y herramientas, que no se integran necesariamente en un programa de reforma coherente y preestablecido. A lo largo del tiempo, instrumentos como los sistemas de rendición de cuentas (RdC) tienden a desarrollar cierta autonomía respecto a sus concepciones programáticas iniciales, y se crean grupos de interés a su alrededor que favorecen su expansión y la adopción de nuevos usos.

    Además, la adopción de pruebas de desempeño y de la rendición de cuentas (RdC) basada en resultados suele ocurrir en diferentes momentos históricos y como consecuencia de debates y demandas variadas. Generalmente, la implementación de un sistema de evaluación estandarizada precede a las medidas de RdC basadas en resultados.

    ¿Disfrutas la vista previa?
    Página 1 de 1