dimanche 24 septembre 2023

L’évaluation face à ses dérives : enseigner pour le test, stéréotypes et préjugés

Il est difficile de préparer les élèves à l’évaluation impartialement, comme de les évaluer en retour sans être sensible à l’un ou l’autre facteur et biais, avec parmi ceux-ci les stéréotypes et les préjugés.

(Photographie : PersistentRain)



L’intérêt des évaluations standardisées et leurs potentielles dérives


La présence d’évaluations standardisées à enjeux élevés dans le cursus des élèves est l’objet de controverses et de débats. Pour leurs dimensions positives, ils sont de formidables outils d’uniformisation, d’émulation et d’analyse en retour des résultats.

Ces éléments peuvent contribuer à tirer un système éducatif vers le haut et guider d’une certaine manière le pilotage de son amélioration. Chaque école peut être comparée aux résultats d’autres écoles qui appartiennent à sa même catégorie en fonction des caractéristiques de sa population, ce qui offre un facteur de comparaison.

Comme l’a mis en évidence Nuno Crato (2021), un constat global favorable et bénéfique peut être fait sur les apports de ces évaluations standardisées. De nombreuses études menées dans le monde entier nous montrent que la présence d’évaluations standardisées à enjeux élevés améliore les performances des élèves. Il est important de noter que ce ne sont pas seulement les compétences testées qui sont améliorées. La présence d’évaluations à enjeux élevés améliore les performances du système éducatif en général.

Au-delà de cet avantage global, certains aspects négatifs se manifestent face à des aspects positifs pourtant indéniables. Les évaluations standardisées sont soumises à des contraintes qui font qu’elles n’évaluent jamais tous les éléments importants d’un programme d’étude.

Une manière de le comprendre est que de nombreuses matières (les langues, mais pas seulement) vont à des degrés divers exploiter quatre dimensions de compétence : 
  • La compréhension à la lecture
  • L’expression écrite
  • La compréhension orale
  • L’expression orale
Régulièrement lors des évaluations standardisées, les dimensions de la compréhension à la lecture et de l’expression écrite sont survalorisées face aux deux autres qui sont parfois absentes. En effet, leur évaluation est plus simple à organiser. Des phénomènes analogues se produisent dans différentes matières.

Inévitablement, la pression sociale en faveur de la réussite va faire que pour améliorer les résultats, l’enseignant va privilégier ces dimensions surreprésentées dans l’évaluation. L’amélioration des résultats d’élèves dans le cadre d’évaluations standardisées à enjeux élevés se marque donc plus spécifiquement sur les dimensions testées. Toutefois, dans l’ensemble, la démarche reste bénéficiaire et plus équitable. 

Pour répondre au biais des compétences réellement évaluées par rapport à toutes celles du programme, les élèves et les enseignants vont tendre à se concentrer sur les éléments qui auront la plus forte probabilité d’être testés. Ils vont pour une part négliger ceux qui ont la plus faible probabilité de l’être. C’est le fait d’enseigner pour le test ou d’apprendre pour le test. 

Les conséquences sont que certaines connaissances et compétences qui sont préalables à la réussite des cours concernés dans les années suivantes risquent de ne pas être suffisamment travaillées et apprises.



L’existence de potentielles dérives en l’absence d’évaluations standardisées


L’absence d’évaluations externes à enjeux élevés est dangereuse, car les évaluations des enseignants, par exemple, sont biaisées de toutes sortes de façons étranges.

Les notes ne sont pas toujours une mesure juste des compétences spécifiques à une matière, car elles peuvent également refléter les attitudes des enseignants à l’égard des élèves. 

Comme pour toutes les personnes ordinaires, les attitudes des enseignants sont susceptibles d’être influencées par des attributs qui ne sont pas pertinents pour les résultats cognitifs, tels que :
  • Le sexe de l’élève
  • Son origine
  • Ses caractéristiques physiques. 
Ces attributs peuvent susciter des stéréotypes sur les compétences des élèves et conduire ainsi à une discrimination dans la notation.



L’influence du genre sur les matières STEM


Salikutluk et Heyne (2017) se sont intéressés au fait que bien que les filles obtiennent de meilleurs résultats scolaires que les garçons en général, il reste une sous-représentation dans les professions STEM (science, technology, engineering and mathematics). 

Ceci s’expliquerait par des croyances culturellement ancrées sur l’infériorité des femmes et la supériorité des hommes en mathématiques et dans les disciplines connexes :
  • D’une part, ces croyances peuvent conduire à des stratégies d’investissement différentes selon les matières chez les étudiantes et les étudiants. 
  • D’autre part, la présence de stéréotypes négatifs sur les compétences inférieures des filles en mathématiques peut entraver leurs performances en classe. Cela se produit par le biais d’une menace de stéréotype liée aux attentes de leurs pairs. Les attitudes des camarades de classe peuvent renforcer les modèles de comportement des adolescents se conformant aux normes de genre dominantes. 

Salikutluk et Heyne (2017) ont utilisé les données d’une enquête longitudinale sur les enfants d’immigrés dans quatre pays européens. Leurs résultats indiquent un écart de genre distinct en faveur des garçons. Les élèves féminins obtiennent des résultats particulièrement mauvais dans les classes où les normes de masculinité traditionnelles sont présentes. À l’opposé, dans les classes où ces normes ne sont pas ou peu approuvées, aucun écart statistiquement significatif n’est apparent.



L’influence de l’origine sur l’évaluation des performances scolaires


Bonefeld et Dickhäuser (2018) se sont intéressés au stéréotype selon lequel les élèves issus de l’immigration ont un potentiel inférieur. Celui-ci pourrait être à l’origine de biais dans l’évaluation des performances des élèves par les enseignants en formation initiale. 

Leur étude a examiné les effets de l’origine immigrée, du niveau de performance et des attitudes implicites envers les personnes issues de l’immigration. Ces effets se mesuraient sur l’évaluation de la performance (notes attribuées et nombre d’erreurs comptées dans une dictée). 

Des enseignants allemands en formation initiale (N. = 203) ont évalué la performance d’un élève qui semblait issu de l’immigration de manière statistiquement significative plus mauvaise que celle d’un élève non issu de l’immigration. 

Les différences étaient plus prononcées lorsque le niveau de performance était faible et lorsque les enseignants en formation initiale avaient des attitudes implicites relativement positives envers les personnes issues de l’immigration. 

Les résultats de cette étude soutiennent l’hypothèse selon laquelle les enseignants en formation initiale font preuve de préjugés lorsqu’ils notent des élèves (8-9 ans) issus de l’immigration.



L’influence du poids dans le cadre du modèle attribution-valeur des préjugés


Alors que le sexe et l’origine migratoire sont généralement considérés comme immuables, le surpoids est perçu comme un attribut contrôlable qui est en même temps culturellement indésirable. 

Le modèle attribution-valeur des préjugés soutient que les attributions de contrôlabilité et de valeur culturelle de l’attribut concerné par le stéréotype doivent être simultanément présentes pour conduire à un préjugé. 

Lorsqu’on pense que le poids peut être contrôlé volontairement, les personnes en surpoids peuvent être tenues pour responsables de leur situation et être traitées comme si elles méritaient le blâme. Mais le surpoids n’est considéré comme un attribut négatif que s’il existe une préférence culturelle pour la minceur. Sans cette valeur culturelle négative, les gens ne seraient pas blâmés pour leur surpoids.

L’aspect contrôlable du modèle attribution-valeur des préjugés correspond au fait que les individus en surpoids sont perçus comme manquants de contrôle personnel, étant paresseux, moins consciencieux et moins disciplinés. 

Comme le contrôle et la discipline sont importants pour le développement des compétences, les stéréotypes concernant les personnes en surpoids incluent également la stupidité, la lenteur de la réflexion, une compétence moindre et le laisser-aller. 

Par rapport aux préjugés à l’encontre d’autres groupes, les attitudes négatives à l’égard des personnes en surpoids sont largement répandues et exprimées plus ouvertement. La désirabilité sociale ne retient pas les opinions autant que dans le cas du racisme ou de l’homophobie. 

La préférence culturelle pour la minceur dans les pays occidentaux est également bien documentée. Dans toutes les sociétés socioéconomiques très développées, les corps minces sont les plus attrayants.



Différentes recherches qui démontrent l’existence d’un préjugé évaluatif lié au surpoids des élèves


Dans leur recherche sur les préjugés à l’encontre des élèves en surpoids, Dian et Triventi (2021) se sont appuyés sur le modèle Attribution-Valeur des préjugés (AVMP).

Ils se sont intéressés à un échantillon d’élèves allemands de 12-13 ans. Ils ont cherché à évaluer si les élèves en surpoids et obèses reçoivent systématiquement des notes inférieures de la part de leurs enseignants en allemand (langue maternelle) et en mathématiques. Ils ont pris comme élément de comparaison les compétences spécifiques à la matière mesurées par un test standardisé. Ils ont également pris en compte un riche ensemble de caractéristiques sociodémographiques et sociopsychologiques des élèves.

Leurs résultats suggèrent que les élèves en surpoids et obèses sont plus sévèrement notés dans les deux matières. La pénalité pour les élèves en surpoids, et surtout pour les élèves obèses, était légèrement plus importante en allemand et dans la partie inférieure de la distribution des notes. Il y avait également des indications de pénalités hétérogènes selon le sexe, les élèves masculins en surpoids étant particulièrement pénalisés en mathématiques. 

Les deux stéréotypes selon lesquels les garçons sont moins assidus que les filles et que les personnes en surpoids sont moins disciplinées que les personnes de poids normal, peuvent être simultanément présents. Cela peut conduire à un double désavantage pour les garçons en surpoids. En revanche, pour les filles en surpoids, le stéréotype de genre selon lequel elles sont plus assidues peut contrebalancer le stéréotype de poids selon lequel elles sont moins disciplinées, ce qui réduit les préjugés.

Les notes plus sévères auxquelles les élèves en surpoids ou obèses sont exposés dans le premier cycle du secondaire sont principalement concentrées chez les garçons, un schéma particulièrement prononcé en allemand et moins en mathématiques.

Les élèves obèses et en surpoids obtiennent en moyenne des notes inférieures à celles des élèves de poids normal. Cette tendance se retrouve indépendamment du fait que l’on ajuste pour les seules caractéristiques sociodémographiques de base. De même, elle n’est pas modifiée pour un ensemble plus large de caractéristiques individuelles, y compris les traits de personnalité des élèves, les attitudes et le comportement liés à l’école. Le riche ensemble de variables de contrôle et la taille plutôt importante des différences estimées semblent suggérer une conclusion claire. Les élèves en surpoids, et surtout obèses, sont soumis à certaines formes de pénalisation dans les évaluations qu’ils reçoivent de leurs enseignants. Cette pénalisation n’est pas seulement statistiquement significative, elle est aussi substantielle. 

En effet, la taille de l’effet de l’obésité par rapport au poids normal est plus importante que celle de l’homme par rapport à la femme. Pourtant cette comparaison de genre a attiré beaucoup plus d’attention parmi les chercheurs.

Il est important de noter deux autres aspects :
  • Premièrement, les conséquences du surpoids et de l’obésité ne peuvent pas être attribuées à un simple effet de déviance par rapport à la norme. En effet, les élèves en sous-poids ne sont pas pénalisés dans les évaluations des enseignants. 
  • Deuxièmement, la prise en compte d’un large éventail de traits, d’attitudes et de comportements des élèves ne modifie pas sensiblement l’estimation du biais d’évaluation des enseignants. Cela indique la possibilité qu’une grande partie du biais d’évaluation total des enseignants découle des processus de discrimination et de stigmatisation.
  • Bien que les mathématiques soient généralement considérées comme une matière plus objective, cette discipline n’est pas non plus exempte de biais de notation des enseignants liés à l’apparence corporelle.

Les notes incluent d’autres mesures plus subjectives que les compétences, ce qui peut pénaliser les élèves ayant les mêmes compétences, mais des notes inférieures en raison de facteurs non liés à l’apprentissage. 

MacCann et Roberts (2013) se sont intéressés au fait que les élèves obèses obtiennent de moins bons résultats scolaires. Ils ont comparé les résultats aux tests et les notes scolaires d’élèves obèses, en surpoids et de poids normal dans l’enseignement secondaire (N = 383, 13-14 ans) et supérieur (N. = 1036). Ils ont contrôlé les variables démographiques, la personnalité, les capacités et les facteurs de confusion liés au bien-être. Ils ont montré que les élèves obèses obtiennent des notes significativement plus basses au secondaire (d=0,83) et dans l’enseignement supérieur (d=0,35). Cela se produit malgré le fait qu’ils ne présentent aucune différence statistiquement significative dans les résultats des tests d’intelligence ou de réussite. Ces notes inférieures reflètent les préjugés des pairs et des enseignants à l’égard des élèves en surpoids et obèses plutôt qu’un manque de capacités chez ces élèves.

Burmeister et ses collègues (2013) se sont intéressais au biais sur le poids dans le processus d’admission aux études supérieures. Ils ont examiné si l’indice de masse corporelle (IMC) était lié à la qualité des lettres de recommandation et au nombre d’offres d’admission que les candidats ont reçues après avoir participé à des entretiens en personne. Les participants étaient 97 candidats à un programme d’études supérieures en psychologie dans une grande université des États-Unis. Les résultats ont montré qu’un IMC plus élevé prédit significativement moins d’offres d’admission dans les programmes d’études supérieures en psychologie après l’entretien. Les résultats suggèrent également que cette relation est plus forte pour les candidates. 

L’IMC n’était pas lié à la qualité générale ou au nombre d’adjectifs stéréotypés liés au poids dans les lettres de recommandation. De manière surprenante, un IMC plus élevé était lié à un plus grand nombre d’adjectifs positifs dans les lettres. Par conséquent, il apparait que les personnes qui interviewent les candidats aux programmes d’études supérieures peuvent systématiquement favoriser les candidats plus minces. Un préjugé conscient ou inconscient à l’encontre des candidats ayant un surpoids est une explication plausible. 

Finn et ses collègues (2020) se sont intéressés aux préjugés liés au poids pour les adolescents dans les contextes scolaires. Le but de cette étude était de tester expérimentalement si les enseignants du secondaire (N. = 133) aux États-Unis évaluent injustement les élèves en surpoids et les perçoivent comme moins compétents. Les enseignants ont évalué la qualité d’un faux devoir de qualité moyenne d’une élève de 11 ans, accompagné de photographies qui présentaient l’élève soit comme n’étant pas en surpoids, soit comme étant en surpoids. Le biais lié au poids a été évalué en demandant aux enseignants de noter la rédaction et de donner leur avis sur les compétences de l’élève (effort perçu, besoin de tutorat et réussite scolaire globale).

Les enseignants étaient beaucoup plus susceptibles de recommander aux élèves en surpoids de suivre un tutorat ou de bénéficier d’une aide corrective. Ils jugeaient leur travail moins soigné que celui de leurs homologues sans surpoids. Ils attribuaient à leurs rédactions des notes inférieures dans l’ensemble, même lorsque les rédactions étaient exactement les mêmes.

Ils ont également jugé que les élèves en surpoids avaient travaillé beaucoup plus dur que les autres, peut-être parce qu’ils étaient considérés comme moins capables et avaient donc davantage besoin d’essayer. Il est intéressant de noter que, même si les enseignants ont attribué des notes inférieures aux élèves en surpoids, ils n’ont pas considéré que la qualité de leurs rédactions était inférieure.

Ces résultats illustrent les attitudes biaisées par le poids souvent présentes chez les enseignants. Bien que les élèves puissent faire autant d’efforts ou produire un travail de qualité égale, les stéréotypes sur ce que signifie le surpoids déforment la perception des enseignants.



L’importance d’une prise en compte des préjugés et stéréotypes dans l’évaluation


L’impératif de considérer les préjugés et les stéréotypes dans le contexte scolaire émane de préoccupations fondamentales relatives à la validité, à la fiabilité et à l’équité des processus d’évaluation.

Une première évidence est que nous ne pouvons nier que les enseignants ont une tendance générale à attribuer des notes plus élevées aux élèves qu’ils apprécient et à ceux qui partagent la même origine culturelle qu’eux.

De manière opposée, certains biais cognitifs, préjugés ou stéréotypes liés aux catégorisations sociales peuvent amoindrir l’objectivité du jugement évaluatif de l’enseignant :

1. L’influence des stéréotypes peut engendrer des erreurs systématiques dans l’évaluation pour l’enseignant :
  • Les stéréotypes sont définis comme des croyances généralisées concernant les attributs d’un groupe social (Allport, 1954). Ils peuvent induire les évaluateurs à interpréter les informations d’une manière qui confirme ces croyances, même en présence de données contradictoires. 
  • L’appartenance d’un élève à un groupe social peut influencer les perceptions liées à l’évaluation et biaiser les inférences qui en découlent, faites par les enseignants.
  • Jennifer Eberhardt (2019) a montré que les biais raciaux implicites peuvent influencer les jugements dans des contextes variés, y compris l’éducation. Ces biais, souvent inconscients, peuvent conduire à surévaluer ou sous-évaluer les performances d’élèves selon leur origine ethnique, sociale ou culturelle.
  • Différentes recherches montrent l’existence de préjugés et de stéréotypes liés au poids, au genre et à l’origine des élèves. L’apparence corporelle est une dimension qui peut être délicate à assumer. Pour les adolescents, cela peut être encore plus difficile. L’adolescence est une période charnière pour le développement d’une image corporelle positive ou négative avec un impact sur l’estime de soi globale.
2. L’effet Pygmalion ou la prophétie autoréalisatrice liés aux attentes des enseignants : 
  • Rosenthal et Jacobson (1968) ont démontré que les attentes des enseignants influencent directement les performances des élèves. Des enseignants à qui l’on avait dit que certains élèves avaient un « potentiel intellectuel élevé » ont involontairement amélioré les résultats de ces élèves, alors qu’ils avaient été choisis au hasard. 
3. La menace du stéréotype peut influencer négativement les performances des élèves.
  • La notion de menace du stéréotype (Steele & Aronson, 1995) met en évidence un mécanisme par lequel la conscience des stéréotypes négatifs associés à son propre groupe social peut altérer la performance d’un individu lors d’une évaluation.
  • Ce phénomène a été mis en évidence dans une étude. Des étudiants afro-américains obtenaient de moins bons résultats à un test de logique lorsqu’ils pensaient qu’il mesurait leur intelligence, en raison de la peur inconsciente de confirmer un stéréotype négatif.
  • Ces résultats ont été largement reproduits et généralisés à d’autres groupes (femmes en mathématiques, élèves issus de classes sociales défavorisées, etc.). 
  • L’internalisation de la pression liée aux stéréotypes peut conduire à une sous-performance, ne reflétant pas fidèlement les compétences ou les capacités réelles de l’évalué.
4. Les enseignants peuvent manifester des préjugés, introduisant un manque d’équité dans l’évaluation :
  • Les préjugés sont définis comme des attitudes affectives négatives envers un groupe social et ses membres (Dovidio, Gaertner, Kawakami, & Hodson, 2002).
  • Les préjugés peuvent se manifester de manière explicite ou implicite (Greenwald & Banaji, 1995), influençant les jugements et les décisions de manière souvent inconsciente. 
Ne pas prendre en compte ces biais peut conduire à des évaluations injustes, à des décisions d’orientation biaisées et à une démotivation des élèves victimes de discrimination. Les élèves ont très peu d’impact et plus régulièrement quasiment aucune possibilité d’action face à ces facteurs (sexe, origine…). Ces facteurs, ces stéréotypes et ces préjugés ne changent pas seulement la perception qu’un adolescent a de lui-même, ils peuvent aussi changer la façon dont les autres les évaluent. 

De tels phénomènes semblent inévitables et nécessitent une prise de conscience de la part des enseignants pour des raisons éthiques et inclusives. Il est essentiel d’être plus conscient des différents facteurs qui influencent notre perception des autres. 

Tous les élèves doivent pouvoir être traités de la même manière face à leurs apprentissages. S’attaquer à ces biais, à ces stéréotypes et à ces préjugés est une étape essentielle pour soutenir le développement d’adultes heureux et en bonne santé. Mais pour y parvenir, il faudra défaire les attitudes profondément enracinées. 

En conséquence, une prise en compte rigoureuse des préjugés et des stéréotypes est essentielle pour renforcer la fiabilité interévaluateurs et la validité globale des processus d’évaluation.

La première étape consiste peut-être simplement à reconnaître leur existence et la façon dont ils peuvent influencer notre évaluation. Cette prise de conscience peut permettre d’avoir un regard critique sur nos processus d’évaluation.  

La première étape consiste à agir. Cela implique l’adoption de méthodologies d’évaluation structurées, la formation des évaluateurs à la reconnaissance et à la mitigation des biais, et la mise en œuvre de protocoles visant à garantir l’impartialité des jugements. Des pratiques d’évaluation équitables, comme l’anonymisation des copies, les grilles d’évaluation objectives ou la formation aux biais cognitifs, permettent de limiter de tels effets.



Mis à jour le 27/02/2024

Bibliographie


Dian M, Triventi M (2021) The weight of school grades: Evidence of biased teachers’ evaluations against overweight students in Germany. PLoS ONE 16(2): e0245972. https://doi. org/10.1371/journal.pone.0245972 

David Didau, What if everything you knew about education was wrong?, 2016, Crown House.

Zerrin Salikutluk, Stefanie Heyne, Do Gender Roles and Norms Affect Performance in Maths? The Impact of Adolescents’ and their Peers’ Gender Conceptions on Maths Grades, European Sociological Review, Volume 33, Issue 3, June 2017, Pages 368–381, https://doi.org/10.1093/esr/jcx049

Bonefeld M, Dickha ̈ user O. (Biased) grading of students’ performance: Students’ names, performance level, and implicit attitudes. Front Psychol. 2018; 9(1):1– 13. https://doi.org/10.3389/fpsyg.2018.00481 PMID: 29867618 

MacCann C, Roberts RD. Just as smart but not as successful: obese students obtain lower school grades but equivalent test scores to nonobese students. Int J Obes (Lond). 2013 Jan;37(1):40-6. doi: 10.1038/ijo.2012.47. Epub 2012 Apr 24. PMID: 22531092.

Burmeister, J.M., Kiefner, A.E., Carels, R.A. and Musher-Eizenman, D.R. (2013), Weight bias in graduate school admissions. Obesity, 21:918–920. https://doi.org/10.1002/oby.20171

Finn, K.E., Seymour, C.M. and Phillips, A.E. (2020), Weight bias and grading among middle and high school teachers. Br J Educ Psychol, 90:635– 647. https://doi.org/10.1111/bjep.12322

Emily Reynolds, Teachers show biases against overweight kids, 2019, https://www.bps.org.uk/research-digest/teachers-show-biases-against-overweight-kids

Dylan Wiliam, Dylan Wiliam’s vision for fair and accurate assessment, 2022, https://www.tes.com/magazine/teaching-learning/secondary/dylan-wiliam-exams-assessment-fair-accurate 

Crato, Nuno, Setting up the Scene: Lessons Learned from PISA 2018 Statistics and Other International Student Assessments, pp 1–24, in Improving a Country’s Education PISA 2018 Results in 10 Countries Editors: Crato, Nuno (Ed.), Springer, 2021

Allport, G. W. (1954). The nature of prejudice. Addison-Wesley.

Dovidio, J. F., Gaertner, S. L., Kawakami, K., & Hodson, G. B. (2002). Why can't we just get along? Interpersonal biases and interracial distrust. In J. F. Dovidio & S. L. Gaertner (Eds.), Intergroup relations: 
Bridging theory and practice (pp. 3-27). Psychology Press.

Greenwald, A. G., & Banaji, M. R. (1995). Implicit social cognition: Attitudes, self-esteem, and stereotypes. Psychological Review, 102(1), 4-27.

Steele, C. M., & Aronson, J. (1995). Stereotype threat and the intellectual test performance of African Americans. Journal of Personality and Social Psychology, 69(5), 797-811.

Rosenthal, R., & Jacobson, L. (1968). "Pygmalion in the Classroom: Teacher Expectation and Pupils’ Intellectual Development." Holt, Rinehart & Winston.

Eberhardt, J. L. (2019). "Biased: Uncovering the Hidden Prejudice That Shapes What We See, Think, and Do." Viking.

0 comments:

Enregistrer un commentaire