mardi 11 avril 2023

Facteurs propres aux élèves ou aux enseignants pouvant influencer le jugement évaluatif

Voici une synthèse personnelle d’éléments de la note de Chesné et ses collaborateurs (2023) pour la conférence de consensus du Cnesco sur l’évaluation en classe, au service de l’apprentissage des élèves.

(Photographie : Clemens Fantur)




Tous les enseignants ne notent pas leurs élèves selon les mêmes critères ni avec les mêmes exigences. 

La notation par l’enseignant est biaisée par les informations dont celui-ci dispose sur l’élève qu’il évalue. La connaissance d’informations scolaires ou extrascolaires spécifiques à chaque élève peut influencer le jugement évaluatif dans un sens comme dans l’autre. 

En outre, dans le cadre des évaluations dans le quotidien de la classe, les enseignants peuvent alors adapter en partie leur notation au regard de leurs propres représentations des élèves et attentes personnelles. 



L’influence de la connaissance du niveau scolaire d’un élève par l’enseignant


Une certaine valeur scolaire est imputée à un élève en fonction de son parcours scolaire, de ses précédentes notes, de son comportement, de son éventuel retard ou redoublement.

Dans le cadre d’une recherche, Caverni, Fabre et Noizet (1975) ont inscrit aléatoirement un score sur différentes copies d’élèves correspondant prétendument à une évaluation antérieure.

Ces copies ont alors été soumises à des correcteurs pour qu’ils les évaluent à leur tour. Le processus de notation a été influencé par les notes antérieures fournies. 

Pensant avoir eu connaissance du niveau scolaire de l’élève qu’ils évaluaient (alors même que celui-ci était fictif), les évaluateurs ont assimilé dans leur jugement les notes précédemment attribuées : 
  • Ils ont eu tendance à attribuer de meilleures notes à des copies dont les notes aléatoires étaient élevées.
  • Ils ont eu tendance à attribuer de moins bonnes notes à celles dont les notes aléatoires étaient faibles. 

Une contagion des résultats antérieurs des élèves est observable dans leurs nouveaux résultats (Crahay, Mottier Lopez & Marcoux, 2019). 



L’influence de l’origine sociale de l’élève 


Pourtois (1978) a mis en évidence dans une étude l’influence que l’origine sociale peut avoir dans la notation des élèves. En indiquant sur la copie d’un élève une information relative à son milieu social, le chercheur constate que certains correcteurs ont tendance à attribuer de meilleures notes aux élèves issus des milieux sociaux les plus favorisés.

Face à ce constat, Merle (2007) s’interroge sur la pertinence pour l’enseignant de la connaissance du milieu social de l’élève. Ces informations peuvent contribuer à la construction d’attentes différenciées selon les élèves. 

Le jugement des enseignants peut varier en fonction de la convergence ou de la divergence des deux milieux sociaux. Une situation donnée peut être aussi bien favorable que défavorable pour l’élève (Moinet, 2018) : 
  • Convergence des milieux : elle pourrait être favorable, lorsque ce dernier appartient au même milieu social que son enseignant.
  • Divergence des milieux : elle pourrait être défavorable lorsque l’élève et l’enseignant appartiennent à un milieu social différent. 



L’influence de l’origine ethnique de l’élève 


Amigues et ses collaborateurs (1975) ont soumis à différents correcteurs des copies d’élèves auxquelles ont été fictivement attribués des noms de famille différents (consonance française ou étrangère). Comment le rapporte Merle (2018), ils n’ont pas constaté d’emblée de différence significative. 

Toutefois, lorsque ces derniers observent cette fois-ci le patronyme des enseignants, ils se rendent compte que ceux d’origine française ont tendance à surévaluer les copies dont l’auteur fictif a un patronyme d’origine étrangère.  

Merle (2018) suggère que cet ajustement de notation résulterait d’un processus de compensation de préjugés défavorables dont l’évaluateur peut avoir conscience. Certains enseignants ont des comportements qui visent à compenser des biais dont ils ont conscience. Cela confirme que l’information, détenue par un enseignant sur un élève, est susceptible d’influencer le processus d’évaluation, dans un sens ou dans un autre. 

Une étude plus récente rapportée par Autin et ses collaborateurs (2019) aboutit également des résultats indiquant une influence de l’information concernant l’origine ethnique des élèves sur l’évaluation de leurs copies 

Après avoir attribué de manière aléatoire des noms typiques allemands ou turcs à des copies de dissertation, il a été demandé à des enseignants allemands de noter ces rédactions d’élèves, sur lesquelles ces nouveaux noms étaient indiqués. 

Les résultats démontrent que les élèves considérés comme autochtones obtiennent des notes plus élevées que leurs camarades présupposés issus de l’immigration. Les enseignants ont attribué des notes plus basses dès lors qu’ils pensaient que les élèves étaient issus de l’immigration. 

Autin, Batruch et Butera (2019) précisent dans leur analyse que ces résultats ne seraient que le reflet de préjugés internes d’une société. Les élèves issus de l’immigration sont généralement défavorisés sur le plan socio-économique par rapport aux autres élèves. Il apparaît comme une discrimination dans la notation, mais ce n’est en réalité qu’un effet des préjugés des enseignants.



L’influence du genre de l’élève 


Terrier (2014) rend compte d’une analyse effectuée au sein de l’académie de Créteil qui a consisté à comparer les notes attribuées à 4 519 élèves en classe de 6e, de façon anonyme et non anonyme. 

Un biais de genre positif en faveur des filles est constaté avec des divergences en fonction des disciplines. À notes anonymes égales, les notes des enseignants sont en moyenne 6,2 % plus élevées pour les filles que pour les garçons en mathématiques.

Une étude menée par Duru-Bellat et Mingat (1993) avait déjà abouti à des résultats analogues. Les notes obtenues en mathématiques et en français par différents élèves à des épreuves standardisées ont été comparées avec celles qui leur ont été attribuées par leur enseignant dans le cadre d’une évaluation en classe. Le constat était que les filles sont globalement mieux notées que les garçons par leurs enseignants. 



L’influence du comportement de l’élève 


Les enseignants peuvent développer des attentes comportementales différentes selon les caractéristiques des élèves. 

Réputées comme étant plus calmes et plus studieuses, les filles font ainsi l’objet d’un biais positif de notation. En raison d’un comportement souvent jugé meilleur, elles se rapprochent du comportement idéalement attendu par l’enseignant, comme rapporté par Leclercq et ses collaborateurs (2004). 

Bennet et ses collaborateurs (1993) ont mené une étude aux États-Unis auprès d’élèves scolarisés en fin d’école maternelle et début d’école primaire. Il s’avère que plus le comportement en classe est apprécié par l’enseignant, meilleur est le jugement scolaire que celui-ci porte sur l’élève (comme rapporté par Merle, 2018). 



L’influence de l’apparence physique de l’élève 


Dans de nombreuses situations évaluatives, les chercheurs ont révélé que les élèves jugés plus beaux ou plus proches des idéaux médiatiques par leurs enseignants ont tendance à être mieux notés que leurs camarades (Leyens & Yzerbit, 1997 ; Merle, 1998). 

Cet effet de l’apparence physique a également été le résultat de l’expérience menée par Nilson et Nias (1977) auprès d’élèves scolarisés en France. En associant au hasard une photo d’élève plus ou moins attrayante à un livret scolaire, il en ressort que ceux associés à un visage plus agréable obtiennent une notation plus favorable (Merle 1998). 



Biais, équité et validité dans l’évaluation scolaire


Les démarches d’évaluation en classe peuvent servir à la fois : 
  • À un enseignement adaptatif dans une perspective formative
  • À des décisions externes (orientation, certification) dans une perspective sommative.
L’évaluation scolaire, comme toute évaluation, n’est pas une science exacte. Lorsque des évaluations fréquentes ou pilotées par l’enseignant sont utilisées hors de leur contexte formatif, des biais non contrôlés peuvent prendre une importance critique pour l’avenir scolaire des élèves (Kane, 2019 ; Black & Wiliam, 1998).


Une diversité de facteurs d’influence subjectifs


À trois moments clés du processus d’évaluation, des variables différentes interviennent et en influencent le cours : 
  • Au moment de la production de l’élève : 
    • Des facteurs peuvent affecter la performance sans refléter fidèlement les compétences sous-jacentes : 
      • Elles peuvent être internes comme l’anxiété, la compréhension de la consigne, la stratégie de réponse ou l’état de santé.
      • Elles peuvent être externes comme les conditions matérielles, la durée ou l’aide reçue.
    • Les chercheurs insistent sur la nécessité de distinguer l’artefact (la performance observée lors de la production) du construit (la maîtrise des objectifs d'apprentissage concernés) (Linn, Baker & Dunbar, 1991).
  • Au moment de la formation du jugement par l’enseignant à la lecture de la production : 
    • De nombreux biais cognitifs et sociaux peuvent intervenir sous la forme : 
      • D’un effet de halo lié à la connaissance de l’élève : 
        •  Un effet d’attente ou de prophétie autoréalisatrice : des attentes antérieures sur un élève influencent l’interprétation de ses performances (Crooks, 1988).
        • Le fait de savoir qu'un élève réussisse bien dans une autre matière ou réussissait l'année précédente peut influencer l'enseignant.
      • De stéréotypes : 
        • Un jugement évaluatif peut être influencé par des caractéristiques de l’élève sans rapport avec la compétence mesurée, telles que son genre, son origine ethnique ou son statut socio-économique.
        • Par exemple, des études ont montré que les enseignants peuvent accorder des notes différentes à des travaux de qualité égale en fonction du genre de l’élève. Ce biais semble favoriser les filles dans les matières littéraires et les garçons dans les sciences (Lievore, 2018).
      • De la prise en compte de comportements non reliés à l’apprentissage : 
        • Les notes peuvent être influencées par le comportement ou la participation au-delà de la compétence évaluée (Ferman et coll., 2022 ; Wiseman, 2012). 
        • Les enseignants peuvent être influencés par des facteurs liés au comportement ou à la perception de l’effort. Les jugements sur l’assiduité, la participation en classe, l’effort perçu ou même la « communicativité » de l’élève peuvent se refléter dans la note finale, indépendamment de la performance solaire réelle (Diaconu-Gherasim, 2019).  
      • Des biais liés aux tâches : 
        • Certaines formes d’épreuve (essais longs, tâches ouvertes) sont plus difficiles à évaluer de façon fiable. La difficulté de notation peut varier selon le contenu et le style des réponses (Wolfe, 2016 ; Ahmadi Shirazi, 2019). 
  • Lorsque l’enseignant traduit ce jugement en une note ou décision officielle : 
    • La littérature sur la notation en classe montre l’existence de variations systématiques entre enseignants et dans le temps (Brookhart, 2013 ; Crooks, 1988).
    • Différents facteurs peuvent intervenir dans la conversion du jugement en note : 
      • Des problèmes de cohérence intercorrecteurs : des différences individuelles peuvent exister dans l’usage des critères et l’engagement de l’évaluateur (Wiseman, 2012)
      • Une dérive de notation dans le temps
      • Une tendance à la sévérité ou à la clémence 
      • Une centralisation autour d’une note moyenne
      • Des décisions pragmatiques (p. ex., des ajustements pour passage/maintien). 
    • Des biais institutionnels ou systémiques peuvent se manifester : 
      • Ils peuvent venir d’une pression sur les résultats qui amène à « enseigner pour le test », ou à l’inflation des notes lorsque les évaluations servent à des fins externes, ce qui modifie le sens des notes (Koretz, 2008).
L’ampleur et la diversité de ces facteurs font qu’on ne peut ignorer leurs conséquences potentielles.


Une prise en compte des facteurs d’influence subjectifs


Comme l’a souligné Brookhart (2013), la subjectivité fait inévitablement partie de l’évaluation, parce que les enseignants sont des êtres humains qui ne peuvent fonctionner de manière purement impartiale. Chaque enseignant a des caractéristiques personnelles qui lui sont propres. Il ne peut fonctionner comme une machine à évaluer, sans préjugés ni préférences, sans erreurs ni omission, sans lassitude et sans ennui (Perrenoud, 2004).

Toutefois, ces biais ne doivent pas amener à un rejet absolu de la notation subjective, car selon Leclercq, Nicaise & Demeuse (2004) : 
  • Refuser tout crédit au jugement évaluatif des enseignants reviendrait à remettre en cause l’éthique et l’expertise des évaluateurs.
  • L’exercice évaluatif est complexe et doit être satisfait par les enseignants dans le cadre de leur profession (Perrenoud, 2004).
  • Il existe des situations où il peut être souhaitable le fait qu’un évaluateur prenne en compte des éléments extérieurs à la prestation d’un élève. C’est par exemple le cas lors d’une décision de passage ou de maintien, ou lors de l’évaluation d’une épreuve de rattrapage
L’évaluation est à aborder dans une perspective professionnelle et éthique. Nier toute valeur aux jugements professionnels serait contraire à la fonction enseignante (Brookhart, 2013).

Rejeter l’expertise des enseignants serait une erreur, car leur jugement subjectif est souvent le seul moyen d’évaluer des compétences complexes. Comme le mentionne Tierney (2016), l’équité en évaluation ne consiste pas à éliminer la subjectivité, mais plutôt à garantir que les jugements de l’enseignant sont fondés sur des critères pertinents.


Prendre conscience des bais sur l’évaluation et réduire leur influence


La prise de conscience de ces facteurs d’influence subjectifs est cruciale, car un jugement évaluatif totalement objectif est impossible. Nous devons identifier les biais potentiels qui nous concernent pour les gérer et les réduire.

Les biais liés à l’évaluation doivent constituer des points de vigilance pour les enseignants selon deux dimensions : 
  • Nous devons nous assurer que l’évaluation soutient effectivement et de manière équitable l’apprentissage des élèves.
  • Nous devons prendre conscience que les évaluations réalisées dans le quotidien de leur classe sont susceptibles d’être utilisées pour des fonctions extérieures à la régulation de l’enseignement et de l’apprentissage en classe. Ce sont par exemple l’orientation ou la certification. Ces évaluations peuvent avoir d’importantes conséquences sur la suite du parcours scolaire des élèves. 
Différentes pistes opérationnelles existent : 
  1. Clarifier et partager les objectifs d’apprentissage et les critères et conditions de réussite pour expliciter les attentes et réduire l’arbitraire (Brookhart, 2013).
  2. Anonymiser les productions des élèves quand c’est possible pour limiter l’effet d’attente et les biais d’identité et corriger de manière sérielle les questions.
  3. Trianguler les preuves (plusieurs tâches, formats et occasions) et ne pas fonder de décisions lourdes sur une seule épreuve (Linn et coll., 1991 ; Koretz, 2008).
  4. Assurer la formation et la calibration des correcteurs : des séances de modulation et d’étalonnage entre enseignants peuvent améliorer la fiabilité intercorrecteurs (Wiseman, 2012).
  5. Documenter les décisions (comment la note a été construite), surtout pour les décisions à fort enjeu (passage, orientation).
  6. Utiliser l’évaluation formative comme finalité première : rétroaction descriptive pour guider l’apprentissage avant la conversion en note (Black & Wiliam, 1998).
Un jugement évaluatif strictement objectif semble hors d’atteinte. En revanche, l’évaluation peut être rendue plus juste, transparente et informative. Il s’agit d’identifier les sources de biais et de mettre en place des procédures (rubriques, anonymisation, triangulation, calibration) qui limitent leur impact tout en préservant l’expertise professionnelle des enseignants (Koretz, 2008 ; Brookhart, 2013 ; Kane, 2019).



Mis à jour le 19/09/2025

Bibliographie


Ahmadi Shirazi, M. (2019). Bias analysis in writing assessment. SAGE Open, 9(1), 1–12. https://doi.org/10.1177/2158244019832706

Amigues, R., Bonniol, J.-J., & Caverni, J.-P. (1975). Les comportements d’évaluation dans les systèmes éducatifs : Influence d’une catégorisation ethnique sur la notation de productions scolaires. International Journal of Psychology, 10(2), 135–145. https://doi.org/10.1080/00207597508247327

Autin, F., Batruch, A., & Butera, F. (2019). The function of selection of assessment leads evaluators to artificially create the social class achievement gap. Journal of Educational Psychology, 111(4), 717–735. https://doi.org/10.1037/edu0000307

Bennett, R. E., Gottesman, R. L., Rock, D. A., & Cerullo, F. (1993). Influence of behavior perceptions and gender on teachers’ judgments of students’ academic skill. Journal of Educational Psychology, 85(2), 347–356. https://doi.org/10.1037/0022-0663.85.2.347

Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80(2), 139–148.

Brookhart, S. M. (2013). Classroom assessment and educational measurement. Routledge.

Caverni, J.-P., Fabre, J.-M., & Noizet, G. (1975). Dépendance des évaluations scolaires par rapport à des évaluations antérieures : Études en situation simulée. Le Travail humain, 38(2), 213–222.

Chesné, J.-F., Piedfer-Quêney, L., & Jeanneau, F. (2023). Limites et biais de l’évaluation : Synthèse des travaux de recherche. Cnesco-Cnam.

Crahay, M., Mottier Lopez, L., & Marcoux, G. (2019). L’évaluation des élèves : Docteur Jekyll and Mister Hyde de l’enseignement. In M. Crahay, Peut-on lutter contre l’échec scolaire ? (pp. 357–425). De Boeck Supérieur. https://doi.org/10.3917/dbu.craha.2019.01.0357

Crooks, T. J. (1988). The impact of classroom evaluation practices on students. Review of Educational Research, 58(4), 438–481. https://doi.org/10.3102/00346543058004438

Diaconu-Gherasim, L. R. (2019). The relationship between grading and teacher judgment. Learning and Instruction, 65, 101502. https://doi.org/10.1016/j.learninstruc.2019.101502

Duru-Bellat, M., & Mingat, A. (1993). Pour une approche analytique du fonctionnement du système éducatif (1re éd.). Presses universitaires de France.

Ferman, B., Müller, S. M., & Stanat, P. (2022). Assessing knowledge or classroom behavior? Evidence of teachers conflating behavior and academic competence. Studies in Educational Evaluation, 73, 101123. https://doi.org/10.1016/j.stueduc.2022.101123

Kane, M. T. (2019). Perspectives on the validity of classroom assessments. Educational Measurement: Issues and Practice, 38(4), 4–12. https://doi.org/10.1111/emip.12283

Koretz, D. (2008). Measuring up: What educational testing really tells us. Harvard University Press.

Leclercq, D., Nicaise, J., & Demeuse, M. (2004). Docimologie critique : Des difficultés de noter des copies et d’attribuer des notes aux élèves. In M. Demeuse (Éd.), Introduction aux théories et aux méthodes de la mesure en sciences psychologiques et en sciences de l’éducation (pp. 273–292). Les Éditions de l’Université de Liège.

Lievore, F. (2018). When the teacher marks the difference: Grading practices, social inequalities and the role of teacher judgment [Doctoral dissertation, Università degli Studi di Trento].

Linn, R. L., Baker, E. L., & Dunbar, S. B. (1991). Complex, performance-based assessment: Expectations and validation criteria. Educational Researcher, 20(8), 15–21. https://doi.org/10.3102/0013189X020008015

Leyens, J.-Ph., & Yzerbyt, V. (1997). Psychologie sociale. Mardaga.

Merle, P. (1998). Sociologie de l’évaluation scolaire. Presses universitaires de France.

Merle, P. (2007). Les notes : Secrets de fabrication (1re éd.). Presses universitaires de France.

Merle, P. (2018). Les pratiques d’évaluation scolaire : Historique, difficultés, perspectives. Presses universitaires de France.

Moinet, A. (2018). La notation scolaire : Inconvénients et alternatives. https://hal.archives-ouvertes.fr/hal-01700229

Nilson, G., & Nias, L. (1977). Le charme a ses raisons. Tchou.

Perrenoud, P. (2004). Évaluer des compétences. L’Éducateur, 8–11.

Pourtois, J.-P. (1978). Le niveau d’expectation de l’examinateur est-il influencé par l’appartenance sociale de l’enfant ? Revue française de pédagogie, 44, 34–37.

Terrier, C. (2014). Un coup de pouce pour les filles ? Les biais de genre dans les notes des enseignants et leurs effets sur le progrès des élèves. Notes de l’IPP.

Tierney, R. D. (2016). Fairness in classroom assessment. Practical Assessment, Research & Evaluation, 21(1), 1–10. https://doi.org/10.7275/hz9w-qp66

Wiseman, C. S. (2012). Rater effects: Ego engagement in rater decision-making. Assessing Writing, 17(3), 150–173. https://doi.org/10.1016/j.asw.2012.02.002

Wolfe, E. W. (2016). Features of difficult-to-score essays. Assessing Writing, 30, 1–10. https://doi.org/10.1016/j.asw.2016.07.001

0 comments:

Enregistrer un commentaire