mardi 2 janvier 2024

Caractéristiques et usages des grilles critériées au service de l’apprentissage

Un domaine largement sous-exploité dans le cadre de l’évaluation est l’usage de critères de réussite dans le cadre du soutien à l’apprentissage. Une des raisons est que leur conception et leur mobilisation sont complexes.

(Photographie : remindereminder)




Un décalage entre le terrain et la recherche au sujet de l’évaluation


La recherche scientifique reconnait d’un côté les effets positifs des démarches d’évaluation formative sur les apprentissages des élèves. De l’autre, il existe un constat général sur le fait que les enseignants rencontrent des difficultés à les mettre en œuvre.

Si l’importance accordée à l’évaluation formative est nette, la réflexion gagne à être pleinement élargie. Il s’agit de s’intéresser aux conditions nécessaires pour que les pratiques d’évaluation sommative et les pratiques de notation soient également au service de la progression de tous les élèves. 

Dès lors, l’évaluation réalisée en classe devrait toujours constituer un des outils les plus puissants pour soutenir des apprentissages significatifs et durables. 

Il y a un enjeu à comprendre dans quelle mesure la certification des apprentissages permet également au plus grand nombre d’élèves de progresser en favorisant notamment les processus de régulation.

Comme pour la dimension de l’évaluation formative, la réalité des pratiques semble toutefois résister à cette orientation. Dans ce cadre, les grilles critériées ont un rôle à jouer.



La note, mal-aimée en contexte scolaire


Une des difficultés liées à la mise en œuvre d’une évaluation soutien d’apprentissage, dans ses dimensions formatives et sommatives tient au fait que la note est souvent considérée négativement dans la sphère éducative.

La note est associée à des enjeux élevés pour les élèves, car c’est souvent sur son unique base que leur parcours scolaire est déterminé. Elle est assimilée à une sanction au service de la sélection des élèves. Elle est associée au stress, à l’anxiété et au culte de la performance.

C’est effectivement potentiellement le cas quand les pratiques évaluatives restent dans la logique d’une justice méritocratique, de l’égalité des chances ou des traitements. Dans cette perspective, elles peuvent rester centrées sur l’établissement d’une note et sur un calcul de moyenne. Cette approche traite tous les élèves de la même manière, sans réels retours d’informations constructifs et individualisés pour soutenir leur progression personnelle. 

Un autre effet potentiellement négatif des notes est ce que la recherche a appelé « teaching to the test ». Des enseignants vont spécifiquement réaliser un surentraînement de leurs élèves pour augmenter leurs chances de réussir une épreuve standardisée officielle qui établit leur réussite ou leur échec. Cette démarche peut se faire au détriment d’autres activités d’enseignement, réduisant ainsi les opportunités d’apprentissage. Elle fonctionne à court terme et ne réfléchit pas spécifiquement à l’établissement d’assises pour des apprentissages ultérieurs.

Différentes études ont documenté la faible valeur informative des notes chiffrées (ou lettres) pour les élèves et les enseignants ainsi que leur rapport régulièrement ténu aux apprentissages certifiés. La note est souvent au service d’une logique sélective et de gestion des flux d’élèves.

Ces constats partagés dans divers contextes mettent en lumière la nécessité de mieux comprendre les conditions qui seraient nécessaires pour que les pratiques d’évaluation sommative et de notation puissent réellement soutenir les apprentissages des élèves.



Les enjeux de l’évaluation sommative


Toute démarche d’évaluation sommative notée doit prioritairement poursuivre trois objectifs (Carey & Carifio, 2012) : 
  • Certifier les apprentissages considérés comme importants dans les programmes scolaires.
  • Fournir une rétroaction formative aux élèves
  • Donner des informations aux enseignants pour leur permettre de planifier les apprentissages à poursuivre.
Articuler les fonctions de certification et de régulation, les fonctions sommative et formative, est un défi.

Ce défi impose de dépasser le débat opposant les promoteurs et les opposants en ce qui concerne les notes, les examens ou les tests et de reconnaitre qu’il est une impasse. Il ne permet pas aux pratiques de notation de progresser significativement à large échelle (Brookhart et coll., 2016). 



L’usage des grilles d’évaluation


Les grilles d’évaluation sont des instruments permettant d’évaluer les réponses des élèves à des tâches complexes et ouvertes. 

Toutes les grilles d’évaluation ont deux caractéristiques fondamentales en commun : 
  • Premièrement, afin d’aider à identifier les qualités à évaluer, une grille contient des informations sur les aspects ou les critères à rechercher dans la performance de l’élève. 
  • Deuxièmement, pour aider à juger de la qualité de la performance de l’élève, une grille comprend des descriptions de la performance de l’élève à différents niveaux de qualité
La forme typique des grilles d’évaluation est la combinaison de ces deux caractéristiques dans une matrice à deux dimensions.

Les grilles d’évaluation peuvent être utilisées à la fois à des fins sommatives et formatives et peuvent donc être conçues différemment :
  • Les grilles d’évaluation sommative peuvent être holistiques, spécifiques à une tâche et comporter peu de niveaux de qualité afin d’accroître la fiabilité de l’évaluation.
  • Les grilles d’évaluation formative peuvent être analytiques, s’appliquer à plusieurs tâches similaires et comporter plusieurs niveaux de qualité afin de faciliter l’autorégulation des étudiants à l’aide des grilles d’évaluation.
Les recherches sur la fiabilité des grilles suggèrent que la fiabilité intraévaluateur (c’est-à-dire la comparaison d’évaluations réalisées par le même évaluateur à différentes occasions) est souvent satisfaisante. La fiabilité interévaluateurs (c’est-à-dire la comparaison d’évaluations réalisées par différents évaluateurs) ne l’est pas. Cela signifie que les grilles ne suffisent généralement pas à elles seules à élever la fiabilité interévaluateurs à des niveaux seuils, sans l’utilisation d’exemples ou d’une formation pour l’étalonnage. 



La notion de critère en évaluation et ses implications


Selon Sadler (1987), un critère est une propriété ou une caractéristique distinctive de quelque chose, par laquelle sa qualité peut être jugée ou estimée, ou par laquelle une décision ou une classification peut être faite.

L’utilisation de critères à des fins d’évaluation est un processus à deux niveaux :
  • Discerner les propriétés distinctives d’un texte, d’une présentation, d’un produit ou de tout autre format utilisé
  • Porter un jugement sur la qualité de la performance. 
Premièrement, les évaluations critériées peuvent aboutir à un jugement qualitatif sur le potentiel d’un travail particulier de l’élève, qui peut être exprimé en matière de points forts et de suggestions d’amélioration en fonction des critères. 

Les caractéristiques susmentionnées des évaluations critériées sont responsables du potentiel de ces évaluations pour l’apprentissage des élèves. Premièrement, en se concentrant sur les points forts et les suggestions de développement, les évaluations critériées constituent un excellent matériel pour le retour d’information formatif. 

Deuxièmement, sans échelle commune, les évaluations critériées ne sont pas facilement comparables entre les élèves, ce qui permet d’éviter les comparaisons sociales. 

Troisièmement, l’évaluation se concentre sur la tâche à accomplir (c’est-à-dire que l’évaluation est directe). Elle peut (avec le temps) aider les élèves à apprendre à juger de la qualité de leurs propres performances ou de celles des autres. 

Quatrièmement, une autre possibilité offerte par les évaluations critériées consiste à communiquer les critères aux élèves avant leur performance. Comme le suggèrent par exemple Panadero et coll. (2016), les élèves pourraient bénéficier d’une familiarisation avec les critères à toutes les phases du cycle d’autorégulation (Zimmerman, 2013). Ils peuvent utiliser les critères pour fixer des objectifs plus réalistes pour l’activité pendant la phase de planification, contrôler leur travail pendant la phase de performance, et également autoévaluer leur performance pendant la phase d’évaluation. 

Cinquièmement, les critères peuvent être associés à une pondération et servir à générer une note.



L’importance de la dimension explicite des critères dans une perspective formative


Les critères doivent être explicites pour être communiqués aux élèves à l’avance.

Il existe plusieurs approches pour rendre les critères explicites.

Les grilles critériées sont l’une d’elles. Ces instruments aident les évaluateurs à juger de la qualité des performances des étudiants dans le cadre de tâches ouvertes ou complexes. Cette démarche leur évite de tirer des conclusions sur les compétences des étudiants en se basant sur la quantité de réponses correctes. 

Selon Brookhart (2018), les « vraies rubriques » se distinguent par « l’énumération des critères pour le travail et les descriptions des niveaux de performance sur un continuum de qualité ».

Les grilles critériées se distinguent des listes de contrôle qui demandent de poser des décisions dichotomiques (par exemple, oui/non). 

Les grilles critériées se distinguent également des « échelles d’évaluation » qui comprennent des échelles numériques (par exemple, 1-5), évaluatives (par exemple, Excellent-Bon-Moyen-Pauvre) ou de fréquence (par exemple, Toujours-Exactement-Parfois-Jamais). 

Les listes de contrôle et les échelles d’évaluation peuvent être utiles pour évaluer les élèves. Cependant, elles ne leur offrent aucune description de la qualité de leurs performances, dont ils ont besoin pour passer à l’étape suivante de leur apprentissage. 



Effets positifs liés aux grilles critériées


Selon Jönsson et Svingby (2007), l’utilisation de grilles d’évaluation peut promouvoir l’apprentissage ou améliorer l’enseignement en rendant les attentes et les critères explicites. Cela facilite le retour d’information et l’auto-évaluation. 
Cette proposition a été corroborée par une étude ultérieure sur les grilles d’évaluation, qui s’est concentrée exclusivement sur la fonction formative des grilles (Panadero & Jönsson, 2013). 

Panadero & Jönsson (2013) ont montré que la transparence apportée par l’utilisation de grilles d’évaluation est susceptible de : 
  • Réduire l’anxiété des élèves
  • Faciliter le processus de retour d’information
  • Soutenir l’autorégulation des étudiants
Tous ces éléments peuvent indirectement faciliter l’amélioration des performances des élèves. 

Des études empiriques faisant état d’effets positifs de l’utilisation de grilles d’évaluation sur les performances des apprenants ont été publiées. La plupart des études de ce type se situent dans un contexte d’enseignement supérieur, mais certaines existent pour le primaire et le secondaire. Les résultats suggèrent, par exemple, que les élèves sont en mesure d’utiliser la grille pour guider leur travail et qu’elle a eu un effet positif sur la motivation et l’efficacité personnelle.

Jönsson (2014) a réalisé des études de cas dans différents contextes d’enseignement professionnel (santé publique, courtiers en immobilier et enseignement dentaire), où des grilles d’évaluation étaient utilisées. Dans ces contextes, les étudiants ont déclaré utiliser les grilles d’évaluation comme guide lors de la planification de leurs travaux. Plusieurs étudiants ont également indiqué qu’ils utilisaient les grilles pour évaluer l’avancement de leur travail pendant l’exécution de la tâche. Ils utilisent les critères comme des cibles pour s’assurer qu’ils ont inclus tous les aspects importants dans le travail, ainsi que pour effectuer un contrôle final avant de soumettre le travail à l’évaluation sommative. D’autres études font état de résultats similaires (Andrade & Du, 2005 ; Reynolds-Keefer, 2010). 

Ces études suggèrent que lorsque les étudiants (du moins dans l’enseignement supérieur) reçoivent des grilles d’évaluation, ils les utilisent pour soutenir toutes les phases du cycle d’autorégulation. Ce sont les phases de réflexion préalable, d’exécution et d’autoréflexion : 
  • Pendant la phase de planification, les grilles peuvent aider les élèves à planifier et à structurer l’exécution d’une tâche, ainsi qu’à se fixer des objectifs plus réalistes. 
  • Pendant la phase de performance, les grilles critériées facilitent le contrôle par les élèves de leurs propres performances. 
  • Durant la phase d’évaluation, les grilles d’évaluation peuvent aider les étudiants à juger de la qualité de leur travail par rapport à des objectifs préétablis au lieu de s’appuyer sur des comparaisons sociales.
Panadero et ses collègues (Panadero et coll., 2012 ; Panadero & Romero, 2014) ont étudié les dimensions de l’apprentissage autorégulé. Ils ont analysé comment elles étaient associées aux émotions négatives et au stress, aux actions dirigées par l’anxiété, à la pression externe de la performance et à l’évitement de la tâche. Ils ont montré que l’utilisation de grilles d’évaluation peut réduire les stratégies d’apprentissage autorégulé axées sur la performance et l’évitement, typiquement défavorables à l’apprentissage. Toutefois, elle n’augmente pas nécessairement l’utilisation des stratégies d’apprentissage autorégulé axées sur l’apprentissage. 



Effets négatifs des grilles critériées sur l’auto-efficacité


Intuitivement, nous pourrions penser que les grilles critériées qui peuvent améliorer les performances et faciliter l’auto-évaluation devraient accroître l’auto-efficacité des étudiants et favoriser une orientation vers la maîtrise. 

Cette image idéale n’apparaît toutefois pas vraiment dans la recherche empirique. Par exemple, dans une étude de Panadero et coll. (2012), aucun effet significatif n’a été trouvé pour l’auto-efficacité des étudiants. Les conclusions de Balan et Jönsson (2018) vont dans le même sens.
 
Une méta-analyse sur les effets des interventions d’auto-évaluation sur les stratégies d’autorégulation a révélé une corrélation intéressante (Panadero et coll., 2017). Les étudiants qui utilisent des grilles d’évaluation (ou des instruments similaires) font état d’une auto-efficacité plus faible après l’intervention que les participants qui ne les utilisent pas. 

Il pourrait s’agir d’un effet de la prise de conscience par les étudiants de la complexité d’une performance de haute qualité et, par conséquent, d’une moindre auto-efficacité. 

Ces résultats correspondent à ceux d’Andrade et Du (2005). Certains étudiants ont trouvé qu’il était trop difficile de lire tous les niveaux de la grille d’évaluation avant de recevoir un retour d’information de l’enseignant. Cependant, certains étudiants qui visaient des performances élevées n’ont pas lu les niveaux décrivant une qualité inférieure dans la grille. Cela suggère que les étudiants peuvent réagir différemment aux grilles d’évaluation en fonction de leurs performances antérieures et de leur estime de soi. 



Grilles critériées et évaluation holistique


L’explicitation des critères présente incontestablement des avantages, mais comporte également des risques. 

Selon Sadler (2009, 2014), peu importe le nombre de critères définis, ils ne seront toujours pas en mesure de représenter la richesse et la complexité des performances dans le monde réel. Il est toujours possible de trouver des performances d’élèves jugées de grande qualité, mais qui ne correspondent pas à l’ensemble de critères prédéfinis. 

Les critères explicites ne peuvent pas représenter pleinement la richesse et la complexité des performances dans le monde réel. Cela signifie également que l’évaluation des différentes parties ou aspects des performances ne correspond pas nécessairement à l’ensemble. 

Cela est particulièrement évident dans les cas où les notes partielles des évaluations analytiques sont arithmétiquement additionnées pour obtenir une note de synthèse. Cela peut aboutir à une note qui ne correspond pas à une évaluation holistique de la qualité globale.

Cependant, cette forme de notation d’une évaluation critériée est discutable. Elle implique de placer des dimensions qualitativement différentes de la performance sur la même échelle et de créer une situation où l’effet compensatoire se manifeste (Sadler, 1987).

Il serait plus raisonnable d’exprimer le résultat des évaluations critériées en matière de points forts et de suggestions d’amélioration (c’est-à-dire une évaluation qualitative). Dans ce cas, il n’y a pas nécessairement de conflit entre les évaluations analytiques et holistiques ; au contraire, elles peuvent se compléter (Tomas et coll., 2019). 



Risque du biais de conformité aux critères


Un danger potentiel de la transformation de critères implicites en critères explicites est que l’utilisation de critères explicites peut détourner l’attention des étudiants d’un apprentissage productif. Elle peut les amener à se concentrer sur des stratégies de surface et sur la « conformité aux critères » (Torrance, 2007). 

Lorsqu’ils sont informés des critères, les apprenants peuvent s’efforcer de répondre à ces critères avec un minimum d’efforts et limiter leurs performances à ce qui est explicité par les critères, laissant de côté les autres éléments. 

Comme le notent Panadero et Jönsson (2020), dans un examen critique des arguments contre l’utilisation des grilles d’évaluation, le soutien empirique à la « conformité aux critères » est relativement faible. La plupart des critiques fondent leurs affirmations sur des preuves anecdotiques et des expériences personnelles, ou sur des hypothèses théoriques. Des recherches supplémentaires sont donc nécessaires pour comprendre comment les étudiants utilisent des critères explicites pour soutenir leur apprentissage.



Critères d’évaluation et critères de notation 


Il existe une différence entre les critères d’évaluation et les critères de notation :
  • Le terme critère d’évaluation (évaluation critériée) fait référence à l’appréciation ou à l’estimation de la qualité des performances des étudiants sur des tâches individuelles en fonction de critères
  • Le terme critère de notation signifie établir une note pour prendre une décision sur les performances globales des élèves sur la base des données accumulées sur la durée de l’enseignement. Les critères de notation sont donc susceptibles d’être plus globaux et abstraits que les critères d’évaluation. La notation implique généralement de résumer les performances des étudiants dans un format standardisé, exprimé sur une échelle. 
Par conséquent, les critères de notation ne présentent pas plusieurs des caractéristiques qui rendent l’évaluation critériée apte à soutenir l’apprentissage et l’autorégulation des élèves. 



Mis à jour le 24/04/2024


Bibliographie


Pasquini, R. (2022). Dans le champ de l’évaluation aussi, la nouveauté naît probablement dans le retour aux sources : introduction du numéro 6 de La Revue LEeE. La Revue LEeE, 6. https://revue.leee.online/index.php/info/article/view/152 

Carey, T., & Carifio, J. (2012). The minimum grading controversy: Results of a quantitative study of seven years of grading from an urban high school. Educational Researcher, 41(6), 201–208. https://doi.org/10.3102/0013189X12453309

Brookhart, S., Guskey, T. R., Bowers, A. J. McMillan, J. H., Smith, J. K., Smith, L. F., Stevens, M. T. & Welsh, M. E. (2016). A century of grading research: meaning and value in the most common educational measure. Review of Educational Research, 86(4), 803–848. https://doi.org/10.3102/0034654316672069 

Jönsson, A. (2022). Scoring Rubrics. Routledge. https://doi.org/10.4324/9781138609877-REE2-1

Jönsson, A. (2022). L’utilisation par de jeunes élèves de critères d’évaluation explicites à des fins d’auto-régulation. La Revue LEeE, (6). https://doi.org/10.48325/rleee.006.02 (Original work published 20 décembre 2021)

Balan, Andreia & Jönsson, Anders. (2018). Increased Explicitness of Assessment Criteria: Effects on Student Motivation and Performance. Frontiers in Education. 3. 10.3389/feduc.2018.00081.

Sadler, R. D. (1987). Specifying and promulgating achievement standards. Oxf. Rev. Educ. 13, 191–209.

Panadero, E., Jönsson, A., and Strijbos, J.-W. (2016). “Scaffolding self-regulated learning through self-assessment and peer assessment: guidelines for classroom implementation,” in Assessment for Learning: Meeting the Challenge of Implementation, eds D. Laveault and L. Allal (Dordrecht: Springer), 311–326. 

Zimmerman, B. J. (2013). From cognitive modeling to self-regulation: a social cognitive career path. Educ. Psychol. 48, 135–147. doi: 10.1080/00461520.2013.794676 

Brookhart SM (2018) Appropriate Criteria: Key to Effective Rubrics. Front. Educ. 3:22. doi: 10.3389/feduc.2018.00022

Jonsson, A., and Svingby, G. (2007). The use of scoring rubrics: Reliability, validity and educational consequences. Educ. Res. Rev. 2, 130–144. doi: 10.1016/j.edurev.2007.05.002

Panadero, E., and Jonsson, A. (2013). The use of scoring rubrics for formative assessment purposes revisited: a review. Educ. Res. Rev. 9, 129–144. doi: 10.1016/j.edurev.2013.01.002

Jonsson, A. (2014). Rubrics as a way of providing transparency in assessment. Assess. Eval. High. Educ. 39, 840–852. doi: 10.1080/02602938.2013.875117

Andrade, H., and Du, Y. (2005). Student perspectives on rubric-referenced assessment. Pract. Assess. Res. Eval. 10, 1–11. Available online at: http:// pareonline.net/pdf/v10n3.pdf 

Reynolds-Keefer, L. (2010). Rubric-referenced assessment in teacher preparation: an opportunity to learn by using. Pract. Assess. Res. Eval. 15, 1–9. Available online at: http://pareonline.net/getvn.asp?v=15&n=8

Panadero, E., Alonso-Tapia, J., and Huertas, J. A. (2012). Rubrics and self-assessment scripts: effects on self-regulation, learning and self-efficacy in secondary education. Learn. Indiv. Diff. 22, 806–813. doi: 10.1016/j.lindif.2012.04.007

Panadero, E., and Romero, M. (2014). To rubric or not to rubric? The effects of self-assessment on self-regulation, performance and self- efficacy. Assessment in Education. Princ. Policy Pract. 21, 133–148. doi: 10.1080/0969594X.2013.877872

Panadero, E., Jönsson, A., and Botella, J. (2017). Effects of self-assessment on self-regulated learning and self-efficacy: four meta-analyses. Educ. Res. Rev. 22, 74–98. doi: 10.1016/j.edurev.2017.08.004

Sadler, R. D. (2009). Indeterminacy in the use of preset criteria for assessment and grading. Assess. Eval. High. Educ. 34, 159–179. doi: 10.1080/02602930801956059 

Sadler, R. D. (2014). The futility of attempting to codify academic achievement standards. High. Educ. 67, 273–288. doi: 10.1007/s10734-013-9649-1

Tomas, C., Whitt, E., Lavelle-Hill, R., & Severn, K. (2019). Modeling holistic marks with analytic rubrics. Frontiers in Education, 4(89). https://doi.org/10.3389/feduc.2019.00089.

Torrance, H. (2007). Assessment as learning? How the use of explicit learning objectives, assessment criteria and feedback in post-secondary education and training can come to dominate learning. Assess. Educ. 14, 281–294. doi: 10.1080/09695940701591867

Ernesto Panadero, Anders Jonsson, A critical review of the arguments against the use of rubrics, Educational Research Review, Volume 30, 2020

0 comments:

Enregistrer un commentaire