mardi 7 novembre 2023

Soutenir l’apprentissage par l’évaluation

Les tests, lorsqu’ils sont utilisés comme stratégie d’enseignement, améliorent le stockage et la récupération des connaissances. Ils incitent également l’esprit à organiser les informations dans la mémoire de manière à ce qu’elles puissent être appliquées avec flexibilité dans différents contextes (Putnam et coll., 2016).

(Photographie : coji.)



Associer défi et satisfaction pour soutenir l’apprentissage


Les défis stimulent l’intérêt de l’élève et partant de la mobilisation de ses connaissances personnelles. Cependant, c’est dans la mesure où ils sont résolus et se traduisent par un apprentissage qu’ils deviennent satisfaisants.

Selon Kirschner (2020) :
  1. Les expériences d’apprentissage, en plus d’être efficaces et efficientes, devraient aussi être satisfaisantes. Les apprenants devraient y faire une expérience satisfaisante de succès.
  2. C’est le succès dans l’apprentissage qui stimule la poursuite de l’apprentissage plutôt que l’inverse.
Faire face à un défi en tant que tel est aversif. Toutefois, c’est la confiance dans sa résolution et la satisfaction ressentie qui en résulte, qui constituent le moteur des apprentissages. La prise en compte du défi est facilitée lorsque celui-ci fait sens.

Il ne suffit pas de donner un sens à un travail d’apprentissage en créant des situations et des expériences auxquelles les élèves peuvent s’identifier ou dont ils peuvent constater l’utilité.

Le sens ne se concrétise que s’il existe une relation claire et explicite entre l’effort nécessaire et fourni, et l’expérience de la réussite. Le succès donne à l’élève un sentiment de satisfaction par rapport à l’effort fourni, contribue à son sentiment d’efficacité personnelle et le motive ensuite à continuer à vouloir apprendre.



La nature du défi de l’évaluation formative


L’enjeu d’un test sommatif généralement effectué à la fin d’un cours ou d’un chapitre est de fournir des preuves des résultats de l’apprentissage. Il peut également être certificatif dans le cas où sa réussite contribue à l’acquisition d’un diplôme ou du passage à l’année supérieure.

Si les tests sommatifs se contentent de fournir une note ou un résultat de réussite ou d’échec, leur utilité pour améliorer l’apprentissage est limitée.

De fait, le domaine de la rétroaction est plutôt lié au champ de l’évaluation sommative et de la pratique de récupération. Face à la fonction de récupération ou à la fonction formative de l’évaluation, la rétroaction fait sens, car l’élève a encore des opportunités futures de s’améliorer. De plus, ces approches répondent de l’effet test et correspondent à des difficultés désirables, deux atouts pour l’apprentissage.

Des pratiques qui augmentent la difficulté perçue de l’apprentissage et diminuent dans un premier temps les performances améliorent généralement la rétention à moyen et long terme. L’acte de récupération lui-même, plutôt que l’exposition répétée, renforce la mémoire.

L’effet positif direct du test se manifeste à moyen et long terme, mais pas à court terme.

Ainsi, une fonction formative associée à une fonction sommative doit l’être avec précaution, car la première peut dans un premier temps baisser les performances mesurées par la seconde.



L’importance de la valeur informative de la rétroaction


La rétroaction doit être associée d’emblée à la fonction formative, car elle doit contribuer à améliorer la manière dont les élèves mobilisent leurs ressources limitées pour apprendre.

Le retour d’information, ou la connaissance des résultats des tests, peuvent rendre explicite l’écart entre l’apprentissage actuel et l’apprentissage précisé par les objectifs d’apprentissage. Cette prise de conscience doit permettre aux apprenants de répartir stratégiquement leur temps d’étude dans les domaines où existe un besoin d’amélioration.

Les apprenants consacrent plus de temps et d’attention à l’examen lorsqu’il y a un écart entre leurs attentes et leurs résultats. Cela a lieu à la fois lorsqu’ils répondent incorrectement à une question à laquelle ils croyaient avoir répondu correctement et lorsqu’ils répondent correctement à une question à laquelle ils croyaient avoir répondu incorrectement. 

Le retour d’information qui indique à la fois les réponses correctes et incorrectes et qui fournit des justifications pour toutes les réponses, facilite la compréhension conceptuelle ainsi que le rappel. Ainsi, un retour d’information détaillé devrait être disponible pour chaque quiz et test.



Différents biais pour expliquer la sous-utilisation des tests


Les élèves tendent à ne pas mobiliser suffisamment tôt et suffisamment régulièrement la pratique de récupération, privilégiant souvent des stratégies moins efficaces comme la relecture ou la réalisation de synthèses. Différents biais expliquent cette sous-utilisation.

Le biais de fluidité exprime le fait que les élèves ont tendance à être trop confiants dans leur capacité à récupérer des informations plus tard, lorsque le traitement de ces informations est facile. Relire rend les contenus plus fluides. Ce biais touche également les enseignants. Ceux-ci ont tendance à être trop confiants et vont interpréter erronément la performance habile de leurs élèves pendant le cours comme une preuve d’apprentissage. Ils vont la considérer pour ce qu’elle n’est pas, c’est-à-dire une prédiction de la performance future lors d’une évaluation (Soderstrom & Bjork, 2013).

Le biais de prévoyance exprime le fait que les élèves ont tendance à être trop confiants dans leur capacité à récupérer des informations plus tard. Il est lié au fait que des indices sont présents pendant l’apprentissage et non pendant le test (Koriat & Bjork, 2005 ; Tullis & Benjamin, 2011). Le fait de voir les réponses ou les contenus pendant que l’on étudie crée un biais de prévoyance.

Le biais de stabilité exprime le fait que les élèves et les enseignants ont tendance à être trop confiants. Ils vont considérer que le degré de mémorisation démontré pendant l’étude ou la formation sera maintenu dans le temps (Kornell & Bjork, 2009).

Les enseignants et les élèves peuvent également être victimes du biais de capacité innée. C’est la croyance que les différences de performance entre les apprenants sont attribuables à des différences d’aptitude ou d’intelligence plutôt qu’à l’efficacité de la formation et de la pratique (Bjork, 1994). Ce sophisme particulier peut décourager les individus d’essayer d’apprendre. Il peut également conduire à la poursuite d’approches de formation inefficaces au niveau des organisations en considérant que les différences de capacités ne sont pas modifiables. Cela revient à privilégier la performance à l’apprentissage. 
 
Ainsi, en raison de puissants biais cognitifs et de facteurs organisationnels, tant les enseignants que les élèves ont tendance à résister à l’adoption de nouvelles pratiques comme le fait de se tester. Leur difficulté est qu’elles entravent l’apprentissage initial, ce qui cache le fait qu’elles entraînent également une meilleure rétention à long terme (Bjork, 1999).



Concevoir des tests pour soutenir l’apprentissage


La manière et le moment de procéder aux tests peuvent varier lorsque l’objectif des tests est d’améliorer l’apprentissage plutôt que de l’évaluer. 

Les pratiques suivantes visant à soutenir l’apprentissage par le biais de tests sont confirmées par les données actuelles : 
  • Les tests de production sont meilleurs que les tests de reconnaissance. Les tests qui demandent aux apprenants de produire des réponses à des questions sont supérieurs aux tests à choix multiples ou à d’autres types de tests de reconnaissance. La récupération est plus difficile lorsque les tests nécessitent le rappel ou la production d’informations par opposition à la reconnaissance de matériel déjà vu, comme dans les tests à choix multiples. Ainsi, pour améliorer l’apprentissage, les tests à réponses courtes devraient être utilisés en faveur des tests à choix multiples, en particulier dans les premiers stades de l’apprentissage.
  • La technique PUREMEM (Pure Memory) consiste à demander à des apprenants de rédiger des réponses courtes à des questions de quiz sur le contenu de cours à la fin d’un cours. Le quiz est alors révisé au début du cours suivant. Lyle et Crawford (2011) ont testé la technique dans le cadre d’un cours de statistiques en psychologie. Les résultats aux examens ultérieurs ont été significativement et nettement plus élevés dans une section du cours dispensée avec la procédure PUREMEM que dans une section dispensée sans cette procédure. De plus, les étudiants ont apprécié la procédure.
  • Le retour d’information améliore les résultats d’apprentissage par rapport à l’absence de retour d’information. Un retour d’information optimal indique à la fois les réponses correctes et incorrectes et explique pourquoi les réponses sont correctes ou incorrectes.

Afin d’adopter la pratique de récupération de manière autonome comme stratégie d’apprentissage, les apprenants doivent remarquer une amélioration de l’apprentissage qui accompagne les tests et attribuer cette amélioration aux tests. 

Cette activité métacognitive pèse lourdement sur les ressources de la mémoire de travail. De même, les élèves n’adoptent pas spontanément l’autotest même après en avoir expérimenté les avantages. Dès lors, l’enseignement doit être conçu de manière à rendre l’effet du test explicite (Tullis, Finlay et Benjamin, 2013). Les stratégies efficaces d’autotest comprennent l’utilisation de flashcards. 



L’évaluation formative comme moyen d’aboutir à la finalité de l’évaluation sommative 


Comme le dit Christodoulou (2018), nous ne devrions pas faire trop souvent des tests ayant une fonction sommative. Sinon, c’est comme si nous demandons trop vite aux élèves de courir un marathon, alors qu’ils ont besoin de temps et de pratique pour pouvoir apprendre à le faire. 

En d’autres termes, il est important d’examiner si nous ne testons pas trop de performances momentanées dans l’éducation avec un effet à court terme. Il est plus intéressant de s’investir dans une vision de l’apprentissage avec un effet à long terme.

Les recherches nous ont appris que les notes et les scores quantitatifs ont peu d’effet sur l’apprentissage et ne donnent aux étudiants aucune information sur la façon de procéder. Les notes peuvent être pertinentes lorsqu’il s’agit de prendre une décision sommative, mais surtout comme une sorte de « point de référence ». 

L’alternative est de développer des notes à haute valeur informative comme dans le cadre de la note constructive. Ce type de notes fondées sur des critères évitent de voir les élèves simplement se focaliser sur la valeur chiffrée.

Pour réellement valider et établir des apprentissages, il nous faut une histoire riche en matière d’évaluation formative et de rétroactions qui mettent l’élève en mouvement jusqu’à ce qu’il maîtrise les objectifs d’apprentissage.

Lorsque nous tenons compte des notes, que nous les conservons au fil du temps et que nous calculons des moyennes indépendantes de leur valeur informative, nous réalisions des moyennes de performances ce qui nous éloigne de la réalité des apprentissages. Ce type de moyennes ne fournit qu’un niveau de preuve faible pour une décision finale et sommative quant à la réussite ou à l’échec d’un élève. 

Prendre des décisions importantes sur la base de l’addition, de la pondération et des ressources d’un certain nombre de notes mesurant chacune des résultats instantanés au fil du temps peut parfois être douteux.

Considérons que nous établissions un résultat sur base de la moyenne d’une série d’évaluations qui ne mesurent que la performance sur une partie réduite des contenus à un moment donné. Dès lors, nous nous retrouvons avec la vision d’une école pour laquelle l’objectif est principalement de stimuler un apprentissage à court terme.



Le rôle de l’évaluation dans le pilotage d'un enseignement adaptatif


Pour remplir pleinement sa mission, une évaluation doit être régulière. Une évaluation régulière doit offrir des opportunités d’apprentissage pour au final réellement les vérifier.

L’évaluation qui vise à prendre des décisions formatives est davantage un processus d’enseignement adaptatif, dans lequel l’enseignant va mobiliser un certain nombre d’activités pour soutenir l’apprentissage de ses élèves. Parallèlement, il va recueillir des informations sur leur progression. Sur cette base, il détermine ce qui est encore nécessaire pour atteindre les objectifs d’apprentissage visés et les valider.

La démarche d’évaluation se retrouve alors tellement ancrée dans le quotidien de l’enseignement. Dès lors, il est inévitable que l’enseignant prenne en charge une bonne partie de son pilotage et de sa détermination plutôt que de l’externaliser.

Dans la logique d’un alignement curriculaire, il importe de rapprocher les tâches d’évaluation des objectifs d’apprentissage, de même que le contenu du cours de ces derniers. Parallèlement, nous nous assurons une correspondance avec les objectifs pédagogiques issus du programme.

Pour les élèves, l’évaluation soit souvent perçue comme directive et comme une finalité qui oriente leur comportement d’apprentissage afin d’obtenir une note suffisante. Toutefois, ce sont les objectifs d’apprentissage et la clarté des critères de réussite qui guident la conception pédagogique et le pilotage de l’enseignement. Ils déterminent les informations nécessaires pour prendre des décisions judicieuses concernant l’apprentissage (à long terme) des élèves, et leur permettent d’orienter leurs efforts. 



Donner la primauté à l’apprentissage sur l’évaluation


Premièrement, cela implique de privilégier l’enseignement de ce que nous estimons important dans le programme scolaire plutôt que de réduire ce qui est enseigné à ce qui est demandé dans le test. 

Si nous tombons dans le piège de l’enseignement pour le test, nous donnons la primauté à l’évaluation et il en résulte un manque de validité :
  • Tous les aspects à apprendre ne sont pas abordés dans le test.
  • Des éléments qui ne devraient pas avoir d’importance sont testés (par exemple la compréhension de la lecture dans un test de mathématiques).

À partir du moment où nous considérons que l’éducation est là pour apprendre et non pour réussir des tests, cela amène à abandonner l’idée que tout doit être évalué.

Deuxièmement, il ne faut pas laisser les données normatives sur les élèves guider les décisions les concernant. Au contraire, nous devons nous concentrer sur les informations nécessaires pour décider si un apprenant a atteint un objectif d’apprentissage ou sur ce qui est nécessaire pour atteindre cet objectif. Cela signifie que les tests ne sont pas construits rétrospectivement. Les enseignants déterminent à partir des objectifs les informations dont ils ont besoin de la part de leurs élèves pendant l’enseignement afin de prendre des décisions sur l’apprentissage aussi soigneusement que possible. Le test est le début et non la fin dans une planification à rebours.

Aussi longtemps que l’apprentissage se poursuit, rien n’est définitivement joué pour l’élève, mais tout se prépare. D’une certaine manière, l’examen final ne devrait avoir qu’un caractère cérémoniel et ne devrait pas être une surprise sauf cas tangents pour savoir si la réussite est au rendez-vous.



Soutenir une évaluation soutien d’apprentissage à l’échelle d’une école


Pour intégrer de manière plus poussée une évaluation permettant de soutenir qualitativement les apprentissages, il est nécessaire d’examiner ce qui se passe déjà dans la pratique quotidienne de l’enseignement et dans sa conception.

En général, les enseignants organisent déjà de nombreuses activités sur lesquelles nous apposons désormais le label « formatif » et c’est à partir de cette base qu’il faut élargir un dispositif. 

Il est judicieux d’investir dans un travail de réflexion sur la culture de l’école pour développer cette dimension formative concernant l’apprentissage (Sluijsmans & Valk, 2019) :
  • Où voulons-nous aller en tant qu’école ?
  • Où en sommes-nous aujourd’hui ?

Les questions suivantes peuvent être un point de départ pour un enseignant ou pour une équipe d’enseignants : 
  • Quelles sont mes motivations en tant qu’enseignant ?
  • Qui sont mes élèves ?
  • Quels sont les objectifs du programme que mes élèves doivent apprendre cette année scolaire ? 
  • Quels sont mes objectifs d’apprentissage pour le cours de demain, dans six semaines et à la fin de l’année scolaire ?
  • Qu’est-ce que ces objectifs d’apprentissage signifient pour le contenu qui doit être enseigné et appris ?
  • Quelles questions dois-je poser pour déterminer si mes élèves ont compris la matière enseignée ? 
  • Quelles activités dois-je organiser au fil du temps pour déterminer, entretenir et approfondir ce que mes élèves connaissent et comprennent de ces contenus ? 
  • Quelles sont les informations dont j’ai besoin pour fournir des activités stimulantes aux élèves qui leur feront progresser dans leurs apprentissages au fil du temps ? 
  • Que puis-je constater pour que mes commentaires soutiennent et stimulent la réflexion, l’engagement et l’apprentissage de mes élèves ?
  • Quelles sont la qualité et la fréquence des informations dont j’ai besoin pour déterminer que les élèves ont appris ? 
  • Comment communiquer clairement le sens de ces démarches et en assurer le pilotage ? 

Mis à jour le 19/03/2024

Bibliographie


Paul A. Kirschner, Zinvol leren, 2020, https://www.kirschnered.nl/posts/zinvol_leren

Binks, S. (2018). Testing enhances learning: A review of the literature. Journal of Professional Nursing, 24, 205-210. https://doi.org/10.1016/j.profnurs.2017.08.008

Lyle, K. B., & Crawford, N. A. (2011). Retrieving Essential Material at the End of Lectures Improves Performance on Statistics Exams. Teaching of Psychology, 38(2), 94–97. https://doi.org/10.1177/0098628311401587

Sluijsmans, D. M. A. & Valk, R. (2019). Toetsing als kans om te leren. Van twaalf tot achttien, Mei 2019

Daisy Christodoulou - Formative & Summative Assessment (MSH 2018) https://www.youtube.com/watch?v=8kGRS6BX_Kw&ab_channel=AcademicaUniversityofAppliedSciences

Putnam, A. L., Nestojko, J. F., & Roediger, H. L. (2016). Improving student learning: Two strategies to make it stick. In J. C. Horvath, J. Lodge, & J. A. C. Hattie (Eds.), From the laboratory to the classroom: Translating the science of learning for teachers (pp. 94–121). Oxford, U.K.: Routledge. 

Soderstrom, N., & Bjork, R. (2013). Learning versus performance. Oxford Bibliographies Online Datasets. http://dx.doi.org/10.1093/obo/9780199828340-0081.

Koriat, A., & Bjork, R. (2005). Illusions of competence in monitoring one’s knowledge during study. Journal of Experimental Psychology. Learning, Memory, and Cognition, 31(2),  187–194. http://dx.doi.org/10.1037/0278-7393.31.2.187.

Tullis, J., & Benjamin, A. (2011). On the effectiveness of self-paced learning. Journal of Memory and Language, 64(2), 109–118. http://dx.doi.org/10.1016/j.jml.2010.11.002. 

Kornell, N., & Bjork, R. (2009). A stability bias in human memory: Overestimating remembering and underestimating learning. Journal of Experimental Psychology: General, 138(4), 449–468. http://dx.doi.org/10.1037/a0017350.

Bjork, R. (1994). Institutional impediments to effective training. In D. Druckman, & R. A. Bjork (Eds.), Learning, remembering, believing: Enhancing individual and team performance (pp. 295–306). Washington, DC: National Academy Press.

Bjork, R. (1999). Assessing our own competence: Heuristics and illusions. In D. Gopher, & A. Koriat (Eds.), Attention and performance XVII: Cognitive regulation of performance: Interaction of theory and application (pp. 435–459). Cambridge, MA: MIT Press.

Tullis, J., Finlay, J., & Benjamin, A. (2013). Metacognition of the testing effect: Guiding  learners to predict the benefits of retrieval. Memory and Cognition, 41(3), 429–442. 
http://dx.doi.org/10.3758/s13421-012-0274-5.

0 comments:

Enregistrer un commentaire