mardi 26 septembre 2023

Combiner l’évaluation sommative des enseignants avec les évaluations externes

Dans un précédent article, nous avons mis en évidence certaines limites liées à l’évaluation pilotée par les enseignants et une évaluation externe officielle à enjeux élevés. Aucune de ces deux approches prises isolément ne semble pouvoir assurer une évaluation intègre et non biaisée. Par conséquent, combiner l’évaluation des enseignants et l’évaluation externe semble être potentiellement une meilleure option. C’est la piste explorée ici.

(Photographie : Katrien Vermeire)



Disposer de plus d’une seule source de preuves pour certifier


Pour remplir pleinement son rôle et mesurer un apprentissage plus qu'une performance singulière, l'évaluation sommative doit récolter des preuves et rendre compte d'une progression. 

L’avantage de ces évaluation réalisées par les enseignants est qu’elles peuvent recueillir beaucoup plus de preuves que n’importe qui peut le faire dans une épreuve externe d’une heure et demie ou deux.

Toutefois, nous savons aussi qu’il y a là des problèmes à surmonter avec l'évaluation pilotée par les enseignants, comme la partialité (être juge et partie), ou la qualité des évaluations elles-mêmes. Différents biais et influences externes peuvent diminuer la qualité d'une évaluation uniquement pilotée par les enseignants.

Pour ces raisons, il apparait qu'une combinaison entre des valuations pilotées par les enseignants et d’évaluations externes soit la meilleure manière d'évaluer l'apprentissage des élèves dans une perspective de certification.

Il existe un consensus de la plupart des spécialistes de l’évaluation sur le fait qu’il est utile de disposer de plus d’une seule source de preuves.

Dylan Wiliam (2022) rapporte deux exemples de systèmes éducatifs combinant les deux sources (interne et externe) :

En Australie du Sud, un tel système proposait un assemblage des sources de preuves :
  • Les enseignants donnaient une note dans le cadre de leur cours. Ensuite, les élèves passaient tous le même test officiel.
  • Lors de réunions de modération ultérieures organisées en école, les enseignants comparaient les notes moyennes des deux sources et s’interrogeaient sur leurs similitudes et leur différences :
    • Si les résultats de l’évaluation externe étaient inférieurs à ceux internes, cela indiquait que l’enseignant était sans doute un peu trop indulgent.
    • Si les résultats de l’évaluation externe étaient inférieurs à ceux internes, cela indiquant que l’enseignant était sans doute un peu trop un peu trop sévère. 
  • La dispersion des scores et la corrélation des deux composantes étaient mesurées. Les notes étaient ajustées en conséquence de cette analyse statistique, de manière à faire concorder ces éléments.
En Suède, un système de coexistence des sources de preuve existait également :
  • L’apprentissage des élèves au niveau du lycée est évalué directement par leurs enseignants.
  • Parallèlement, un examen externe, le Swedish Scholastic Aptitude Test (SweSAT) est accessible à tous les élèves. 
  • La meilleure des deux notes est par la suite prise en compte pour l’accès à l’université. 



Combiner évaluation standardisée et évaluation pilotée par les enseignants


Il y a un intérêt pour la valeur de l’évaluation sommative, qu’elle soit alimentée à la fois par des épreuves standardisées et des épreuves pilotées par les enseignants eux-mêmes. La qualité de l’information qui en ressort se retrouve accrue.

Sur la manière de les associer, Dylan Wiliam (2022) développe un point de vue intéressant. Selon lui, la solution qui consiste à décider de la manière de combiner les résultats est plus intéressante que de les laisser coexister.

Si nous laissons ces deux résultats coexister séparément, nous courrons un risque. Nous permettons à ceux qui utilisent les informations liées à la certification, comme les employeurs ou les filières sélectives de l’enseignement supérieur, la possibilité de faire le choix de la note qu’ils estiment la plus fiable. En ce sens, cela diminue la valeur ajoutée de la certification fournie par l’enseignement secondaire en rendant les critères plus flous. 

Le principe est qu’en combinant les sources internes et externes de notes, nous produisons une seule information liée à la certification. Chaque source de données peut à la fois atténuer la faiblesse de l’autre et renforcer la pertinence de l’ensemble :
  • L’évaluation standardisée, pas sa dimension ponctuelle, nous donne les informations les plus récentes et les meilleures à un moment donné. Elle permet de rendre le système plus égalitaire, car tous les élèves passent la même épreuve, dans les mêmes conditions et au même moment. 
  • L’évaluation pilotée par l’enseignant ou à l’échelle d’une école par équipe d’enseignants, va nous donner des informations beaucoup plus complètes et précises sur l’apprentissage des élèves. Elle peut être distribuée dans le temps et prendre en compte la connaissance du contexte et de l’élève.
Ces deux sources ont leurs limites, mais nous pouvons penser qu’ensemble elles peuvent partiellement compenser leurs faiblesses réciproques et aboutir à une image plus juste de l’apprentissage des élèves. Dès lors, l’enjeu est de trouver des moyens efficients et justes de combiner les différentes sources et établir des critères de réussite.

La question de la pondération se pose. Quel poids accorder aux notes évaluées par les enseignants par rapport aux examens externes ? Comment combiner les preuves de maitrise de part et d’autre ? Comment associer les différentes informations ?

Selon Dylan Wiliam (2022), il ne devrait pas y avoir de règle absolue. Les pondérations pourraient être différentes selon les matières. Par exemple, s’il s’agit d’une matière plus pratique, il est logique que l’évaluation qui juge les compétences en matière de savoir-faire ait plus de poids. Définir des critères précis est nécessaire.



Principes et limites de l’évaluation modulaire et de l’évaluation continue


La piste de l’évaluation modulaire


Si l’évaluation standardisée est ponctuelle, l’évaluation sommative pilotée par l’enseignant gagne à avoir lieu tout au long de l’année.

Lorsque nous n’évaluons qu’au terme d’une année scolaire, nous obtenons les meilleures et les plus récentes informations. L’ennui est que ce n’est pas très fiable. Nous ne pouvons pas recueillir autant d’informations que nous le souhaitons, car le temps de l’évaluation est limité. De plus, nous mesurons une performance à un moment donné alors que l’apprentissage ne peut s’estimer que dans un temps long.

Une alternative à une épreuve sommative unique au terme des apprentissages peut être celle de l’évaluation modulaire qui consiste à découper l’évaluation sommative dans le temps en singularisant des unités de matière. Mais cette approche inclut ses propres difficultés liées à l’emplacement des évaluations :
  • Comment comparer les performances d’un module testé au début de l’année scolaire avec celles d’un module testé à la fin de l’année scolaire ? 
  • Qu’en est-il lorsque le programme est distribué sur un cycle de deux ans ? 
  • Comment pouvons-nous mettre en évidence que les élèves s’améliorent au fil du temps ? 
  • Comment mettre en évidence ces développements ?
La clé du succès de la combinaison réside dans les compromis. Nous devons être clairs sur ces compromis et dire, l’expliciter, le justifier, dire pourquoi nous le faisons et pourquoi nous pensons qu’il est important.

La découpe d’une matière en modules successifs ne peut se défaire de la nature cumulative des apprentissages sinon elle ne mesure que des performances et non des apprentissages. 

Lorsque des apprentissages sont évalués dans la première partie de l’année scolaire, les élèves doivent encore pouvoir les mobiliser avec succès dans la seconde partie de l’année scolaire et par la suite. Le processus d’évaluation soutien d’apprentissage doit se poursuivre, également dans sa dimension sommative.

Le modèle de la note constructive de Raphaël Pasquini (2021) offre des perspectives intéressantes sur ces questions en permettant potentiellement une validation progressive des apprentissages.



La piste de l’évaluation continue


Séduisant de prime abord, le principe de l’évaluation continue peut être une mauvaise piste. Selon ce principe, les élèves reçoivent régulièrement des notes, toutes les semaines ou toutes les deux semaines dans les différentes matières. Il s’agit d’une forme d’évaluation sommative distribuée et parcellaire.

Globalement, la note obtenue en fin d’année scolaire est une moyenne générale de toutes ces notes. Certains regroupements et des facteurs de pondération plus importants pour des examens par exemple en fin d’année scolaire peuvent être organisés.

Certains élèves peuvent être stratégiques, d’autres peuvent être minimalistes et d’autres encore peuvent ne se mettre au travail que tardivement et être tirés vers le fond par des échecs précédents.

Dans ce type de système, l’accent est mis sur les performances, sur les points obtenus, et les apprentissages passent en partie au second plan.




La piste d’une évaluation distribuée, synoptique et planifiée


Pour être plus efficaces et représentatifs d’apprentissages qui visent la durabilité, nos systèmes d’évaluation doivent être à la fois :
  • Distribués : collecter des informations sur l’ensemble du cours, selon un temps long, dans une perspective d’évaluation soutien d’apprentissage et de mise en évidence des progrès.
  • Synoptiques : l’évaluation devrait exiger des élèves à certains moments clés qu’ils fassent la synthèse de tout ce qu’ils ont appris pendant le cours.
Pour évaluer, nous devons pouvoir poser à certains moments un jugement global sur l’ensemble du domaine d’étude, incluant une forme de transfert. Nous ne devons pas permettre aux élèves d’apprendre des contenus (savoirs, savoir-faire) pour un test et d’oublier l’essentiel par la suite.

Nos élèves doivent savoir exactement quand ils seront évalués et sur quoi. Le principe d’évaluations aléatoire et surprise est contreproductif.

Par conséquent, nous devons planifier les moments d’évaluation sommative. Les élèves doivent absolument savoir quand l’évaluation a lieu. La première raison est une question d’équité élémentaire. La seconde concerne le sens de l’évaluation.

La mémorisation et de l’oubli ont un caractère fluctuant au fil du temps, qui se stabilisent progressivement sur la voie d’un apprentissage durable. Cependant, lorsque nous procédons à des évaluations furtives, il y a des chances que le même élève évalué à des moments différents espacés de quelques jours à quelques semaines dans le temps manifeste des résultats très différents. Lorsque l’évaluation est planifiée, nous permettons aux élèves de se synchroniser avec le moment où leur niveau de connaissance doit être optimum.

Dire aux élèves qu’ils sont évalués n’est qu’une exigence fondamentale d’équité et de validité. 

Les élèves doivent également avoir la possibilité de prendre des risques. S’il faut jouer la sécurité dans tout ce que l’on fait, parce qu’il y a une chance que cela contribue à un score, les élèves deviendront des automates. C’est là qu’intervient l’évaluation formative, car elle est à faible enjeu. Elle doit être stratégique, mais ne doit pas toujours être planifiée, elle permet de sonder les élèves sans conséquences graves pour eux.



Garder sous contrôle la charge de travail des enseignants face à l’évaluation


Lorsque l’évaluation des enseignants est sommative et a une valeur certificative, elle doit régulièrement répondre à toute une série de codes et règles administratives, ce qui peut constituer une charge de travail significative pour les enseignants. 

L’enjeu est que l’évaluation sommative des enseignants ressemble à celle des examens externes. Il y a le souhait d’apporter la même rigueur à ce processus, ce qui peut le rendre bureaucratique et excessif. L’enseignant comprend qu’il a des comptes à rendre et doit pouvoir justifier ses notes, ce qui alourdit ses tâches administratives.

L’avantage de l’évaluation formative et qu’elle peut échapper à cette charge administrative qui ne vise que la rigueur et assez peu le soutien des élèves. 

L’enjeu de l’évaluation formative est pour l’enseignant de découvrir ce que ses élèves apprennent, de manière à l’aider à mieux enseigner et à les soutenir pour mieux apprendre. 

Dans la perspective de l’utilisation de l’évaluation sommative, nous devons réfléchir à mettre en place un système qui ne devrait pas nécessiter de charge de travail supplémentaire et excessive aux enseignants. 



La préparation aux épreuves externes ou sommatives


Un défi qui reste important pour les enseignants est de préparer leurs élèves à une épreuve externe. 

L’une des approches évidentes est d’utiliser les tests sommatifs de manière formative. Nous pouvons utiliser les examens antérieurs comme des exemples de ce que les élèves doivent faire le jour même de l’examen.

La condition est de ne pas commencer trop tôt, mais une fois que nous avons établi une base solide de connaissances. La pratique d’anciens examens est probablement le meilleur moyen d’obtenir un bon score et d’analyser les faiblesses pour y remédier par la suite.

Une autre technique consiste à demander aux élèves de faire une tâche en classe dans les conditions du test. L’enseignant ramasse ensuite les copies, mais ne les corrige pas. 

Le lendemain, l’enseignant répartit les élèves en groupes de quatre et leur rend les copies, ainsi qu’une nouvelle copie d’examen vierge. En groupe, les élèves doivent ensuite construire la meilleure réponse. Ils peuvent comparer leurs réponses et voir qui a la meilleure. 
Nous savons que les élèves se disent souvent des choses qui ne sont pas correctes. 

L’enseignant doit donc faire une séance avec toute la classe pour s’assurer qu’ils sont sur la bonne voie et demander : « Quelle est la réponse de cette table à la première question ? Et à la question deux ? »


Mis à jour le 28/02/2024

Bibliographie


Dylan Wiliam, Dylan Wiliam’s vision for fair and accurate assessment, 2022, https://www.tes.com/magazine/teaching-learning/secondary/dylan-wiliam-exams-assessment-fair-accurate 

Raphaël Pasquini, Quand la note devient constructive, 2021, Presses universitaires de Laval 

0 comments:

Enregistrer un commentaire