dimanche 24 septembre 2023

L’évaluation face à ses dérives : enseigner pour le test, stéréotypes et préjugés

Il est difficile de préparer les élèves à l’évaluation impartialement, comme de les évaluer en retour sans être sensible à l’un ou l’autre facteur et biais, avec parmi ceux-ci les stéréotypes et les préjugés.

(Photographie : PersistentRain)



L’intérêt des évaluations standardisées et leurs potentielles dérives


La présence d’évaluations standardisées à enjeux élevés dans le cursus des élèves est l’objet de controverses et de débats. Pour leurs dimensions positives, ils sont de formidables outils d’uniformisation, d’émulation et d’analyse en retour des résultats.

Ces éléments peuvent contribuer à tirer un système éducatif vers le haut et guider d’une certaine manière le pilotage de son amélioration. Chaque école peut être comparée aux résultats d’autres écoles qui appartiennent à sa même catégorie en fonction des caractéristiques de sa population, ce qui offre un facteur de comparaison.

Comme l’a mis en évidence Nuno Crato (2021), un constat global favorable et bénéfique peut être fait sur les apports de ces évaluations standardisées. De nombreuses études menées dans le monde entier nous montrent que la présence d’évaluations standardisées à enjeux élevés améliore les performances des élèves. Il est important de noter que ce ne sont pas seulement les compétences testées qui sont améliorées. La présence d’évaluations à enjeux élevés améliore les performances du système éducatif en général.

Au-delà de cet avantage global, certains aspects négatifs se manifestent face à des aspects positifs pourtant indéniables. Les évaluations standardisées sont soumises à des contraintes qui font qu’elles n’évaluent jamais tous les éléments importants d’un programme d’étude.

Une manière de le comprendre est que de nombreuses matières (les langues, mais pas seulement) vont à des degrés divers exploiter quatre dimensions de compétence : 
  • La compréhension à la lecture
  • L’expression écrite
  • La compréhension orale
  • L’expression orale
Régulièrement lors des évaluations standardisées, les dimensions de la compréhension à la lecture et de l’expression écrite sont survalorisées face aux deux autres qui sont parfois absentes. En effet, leur évaluation est plus simple à organiser. Des phénomènes analogues se produisent dans différentes matières.

Inévitablement, la pression sociale en faveur de la réussite va faire que pour améliorer les résultats, l’enseignant va privilégier ces dimensions surreprésentées dans l’évaluation. L’amélioration des résultats d’élèves dans le cadre d’évaluations standardisées à enjeux élevés se marque donc plus spécifiquement sur les dimensions testées. Toutefois, dans l’ensemble, la démarche reste bénéficiaire et plus équitable. 

Pour répondre au biais des compétences réellement évaluées par rapport à toutes celles du programme, les élèves et les enseignants vont tendre à se concentrer sur les éléments qui auront la plus forte probabilité d’être testés. Ils vont pour une part négliger ceux qui ont la plus faible probabilité de l’être. C’est le fait d’enseigner pour le test ou d’apprendre pour le test. 

Les conséquences sont que certaines connaissances et compétences qui sont préalables à la réussite des cours concernés dans les années suivantes risquent de ne pas être suffisamment travaillées et apprises.



L’existence de potentielles dérives en l’absence d’évaluations standardisées


L’absence d’évaluations externes à enjeux élevés est dangereuse, car les évaluations des enseignants, par exemple, sont biaisées de toutes sortes de façons étranges.

Les notes ne sont pas toujours une mesure juste des compétences spécifiques à une matière, car elles peuvent également refléter les attitudes des enseignants à l’égard des élèves. 

Comme pour toutes les personnes ordinaires, les attitudes des enseignants sont susceptibles d’être influencées par des attributs qui ne sont pas pertinents pour les résultats cognitifs, tels que :
  • Le sexe de l’élève
  • Son origine
  • Ses caractéristiques physiques. 

Ces attributs peuvent susciter des stéréotypes sur les compétences des élèves et conduire ainsi à une discrimination dans la notation.



L’influence du genre sur les matières STEM


Salikutluk et Heyne (2017) se sont intéressés au fait que bien que les filles obtiennent de meilleurs résultats scolaires que les garçons en général, il reste une sous-représentation dans les professions STEM (science, technology, engineering and mathematics). 

Ceci s’expliquerait par des croyances culturellement ancrées sur l’infériorité des femmes et la supériorité des hommes en mathématiques et dans les disciplines connexes :
  • D’une part, ces croyances peuvent conduire à des stratégies d’investissement différentes selon les matières chez les étudiantes et les étudiants. 
  • D’autre part, la présence de stéréotypes négatifs sur les compétences inférieures des filles en mathématiques peut entraver leurs performances en classe. Cela se produit par le biais d’une menace de stéréotype liée aux attentes de leurs pairs. Les attitudes des camarades de classe peuvent renforcer les modèles de comportement des adolescents se conformant aux normes de genre dominantes. 

Salikutluk et Heyne (2017) ont utilisé les données d’une enquête longitudinale sur les enfants d’immigrés dans quatre pays européens. Leurs résultats indiquent un écart de genre distinct en faveur des garçons. Les élèves féminins obtiennent des résultats particulièrement mauvais dans les classes où les normes de masculinité traditionnelles sont présentes. À l’opposé, dans les classes où ces normes ne sont pas ou peu approuvées, aucun écart statistiquement significatif n’est apparent.



L’influence de l’origine sur l’évaluation des performances scolaires


Bonefeld et Dickhäuser (2018) se sont intéressés au stéréotype selon lequel les élèves issus de l’immigration ont un potentiel inférieur. Celui-ci pourrait être à l’origine de biais dans l’évaluation des performances des élèves par les enseignants en formation initiale. 

Leur étude a examiné les effets de l’origine immigrée, du niveau de performance et des attitudes implicites envers les personnes issues de l’immigration. Ces effets se mesuraient sur l’évaluation de la performance (notes attribuées et nombre d’erreurs comptées dans une dictée). 

Des enseignants allemands en formation initiale (N. = 203) ont évalué la performance d’un élève qui semblait issu de l’immigration de manière statistiquement significative plus mauvaise que celle d’un élève non issu de l’immigration. 

Les différences étaient plus prononcées lorsque le niveau de performance était faible et lorsque les enseignants en formation initiale avaient des attitudes implicites relativement positives envers les personnes issues de l’immigration. 

Les résultats de cette étude soutiennent l’hypothèse selon laquelle les enseignants en formation initiale font preuve de préjugés lorsqu’ils notent des élèves (8-9 ans) issus de l’immigration.



L’influence du poids dans le cadre du modèle attribution-valeur des préjugés


Alors que le sexe et l’origine migratoire sont généralement considérés comme immuables, le surpoids est perçu comme un attribut contrôlable qui est en même temps culturellement indésirable. 

Le modèle attribution-valeur des préjugés soutient que les attributions de contrôlabilité et de valeur culturelle de l’attribut concerné par le stéréotype doivent être simultanément présentes pour conduire à un préjugé. 

Lorsqu’on pense que le poids peut être contrôlé volontairement, les personnes en surpoids peuvent être tenues pour responsables de leur situation et être traitées comme si elles méritaient le blâme. Mais le surpoids n’est considéré comme un attribut négatif que s’il existe une préférence culturelle pour la minceur. Sans cette valeur culturelle négative, les gens ne seraient pas blâmés pour leur surpoids.

L’aspect contrôlable du modèle attribution-valeur des préjugés correspond au fait que les individus en surpoids sont perçus comme manquants de contrôle personnel, étant paresseux, moins consciencieux et moins disciplinés. 

Comme le contrôle et la discipline sont importants pour le développement des compétences, les stéréotypes concernant les personnes en surpoids incluent également la stupidité, la lenteur de la réflexion, une compétence moindre et le laisser-aller. 

Par rapport aux préjugés à l’encontre d’autres groupes, les attitudes négatives à l’égard des personnes en surpoids sont largement répandues et exprimées plus ouvertement. La désirabilité sociale ne retient pas les opinions autant que dans le cas du racisme ou de l’homophobie. 

La préférence culturelle pour la minceur dans les pays occidentaux est également bien documentée. Dans toutes les sociétés socioéconomiques très développées, les corps minces sont les plus attrayants.



Différentes recherches qui démontrent l’existence d’un préjugé évaluatif lié au surpoids des élèves


Dans leur recherche sur les préjugés à l’encontre des élèves en surpoids, Dian et Triventi (2021) se sont appuyés sur le modèle Attribution-Valeur des préjugés (AVMP).

Ils se sont intéressés à un échantillon d’élèves allemands de 12-13 ans. Ils ont cherché à évaluer si les élèves en surpoids et obèses reçoivent systématiquement des notes inférieures de la part de leurs enseignants en allemand (langue maternelle) et en mathématiques. Ils ont pris comme élément de comparaison les compétences spécifiques à la matière mesurées par un test standardisé. Ils ont également pris en compte un riche ensemble de caractéristiques sociodémographiques et sociopsychologiques des élèves.

Leurs résultats suggèrent que les élèves en surpoids et obèses sont plus sévèrement notés dans les deux matières. La pénalité pour les élèves en surpoids, et surtout pour les élèves obèses, était légèrement plus importante en allemand et dans la partie inférieure de la distribution des notes. Il y avait également des indications de pénalités hétérogènes selon le sexe, les élèves masculins en surpoids étant particulièrement pénalisés en mathématiques. 

Les deux stéréotypes selon lesquels les garçons sont moins assidus que les filles et que les personnes en surpoids sont moins disciplinées que les personnes de poids normal, peuvent être simultanément présents. Cela peut conduire à un double désavantage pour les garçons en surpoids. En revanche, pour les filles en surpoids, le stéréotype de genre selon lequel elles sont plus assidues peut contrebalancer le stéréotype de poids selon lequel elles sont moins disciplinées, ce qui réduit les préjugés.

Les notes plus sévères auxquelles les élèves en surpoids ou obèses sont exposés dans le premier cycle du secondaire sont principalement concentrées chez les garçons, un schéma particulièrement prononcé en allemand et moins en mathématiques.

Les élèves obèses et en surpoids obtiennent en moyenne des notes inférieures à celles des élèves de poids normal. Cette tendance se retrouve indépendamment du fait que l’on ajuste pour les seules caractéristiques sociodémographiques de base. De même, elle n’est pas modifiée pour un ensemble plus large de caractéristiques individuelles, y compris les traits de personnalité des élèves, les attitudes et le comportement liés à l’école. Le riche ensemble de variables de contrôle et la taille plutôt importante des différences estimées semblent suggérer une conclusion claire. Les élèves en surpoids, et surtout obèses, sont soumis à certaines formes de pénalisation dans les évaluations qu’ils reçoivent de leurs enseignants. Cette pénalisation n’est pas seulement statistiquement significative, elle est aussi substantielle. 

En effet, la taille de l’effet de l’obésité par rapport au poids normal est plus importante que celle de l’homme par rapport à la femme. Pourtant cette comparaison de genre a attiré beaucoup plus d’attention parmi les chercheurs.

Il est important de noter deux autres aspects :
  • Premièrement, les conséquences du surpoids et de l’obésité ne peuvent pas être attribuées à un simple effet de déviance par rapport à la norme. En effet, les élèves en sous-poids ne sont pas pénalisés dans les évaluations des enseignants. 
  • Deuxièmement, la prise en compte d’un large éventail de traits, d’attitudes et de comportements des élèves ne modifie pas sensiblement l’estimation du biais d’évaluation des enseignants. Cela indique la possibilité qu’une grande partie du biais d’évaluation total des enseignants découle des processus de discrimination et de stigmatisation.
  • Bien que les mathématiques soient généralement considérées comme une matière plus objective, cette discipline n’est pas non plus exempte de biais de notation des enseignants liés à l’apparence corporelle.

Les notes incluent d’autres mesures plus subjectives que les compétences, ce qui peut pénaliser les élèves ayant les mêmes compétences, mais des notes inférieures en raison de facteurs non liés à l’apprentissage. 

MacCann et Roberts (2013) se sont intéressés au fait que les élèves obèses obtiennent de moins bons résultats scolaires. Ils ont comparé les résultats aux tests et les notes scolaires d’élèves obèses, en surpoids et de poids normal dans l’enseignement secondaire (N = 383, 13-14 ans) et supérieur (N. = 1036). Ils ont contrôlé les variables démographiques, la personnalité, les capacités et les facteurs de confusion liés au bien-être. Ils ont montré que les élèves obèses obtiennent des notes significativement plus basses au secondaire (d=0,83) et dans l’enseignement supérieur (d=0,35). Cela se produit malgré le fait qu’ils ne présentent aucune différence statistiquement significative dans les résultats des tests d’intelligence ou de réussite. Ces notes inférieures reflètent les préjugés des pairs et des enseignants à l’égard des élèves en surpoids et obèses plutôt qu’un manque de capacités chez ces élèves.

Burmeister et ses collègues (2013) se sont intéressais au biais sur le poids dans le processus d’admission aux études supérieures. Ils ont examiné si l’indice de masse corporelle (IMC) était lié à la qualité des lettres de recommandation et au nombre d’offres d’admission que les candidats ont reçues après avoir participé à des entretiens en personne. Les participants étaient 97 candidats à un programme d’études supérieures en psychologie dans une grande université des États-Unis. Les résultats ont montré qu’un IMC plus élevé prédit significativement moins d’offres d’admission dans les programmes d’études supérieures en psychologie après l’entretien. Les résultats suggèrent également que cette relation est plus forte pour les candidates. 

L’IMC n’était pas lié à la qualité générale ou au nombre d’adjectifs stéréotypés liés au poids dans les lettres de recommandation. De manière surprenante, un IMC plus élevé était lié à un plus grand nombre d’adjectifs positifs dans les lettres. Par conséquent, il apparait que les personnes qui interviewent les candidats aux programmes d’études supérieures peuvent systématiquement favoriser les candidats plus minces. Un préjugé conscient ou inconscient à l’encontre des candidats ayant un surpoids est une explication plausible. 

Finn et ses collègues (2020) se sont intéressés aux préjugés liés au poids pour les adolescents dans les contextes scolaires. Le but de cette étude était de tester expérimentalement si les enseignants du secondaire (N. = 133) aux États-Unis évaluent injustement les élèves en surpoids et les perçoivent comme moins compétents. Les enseignants ont évalué la qualité d’un faux devoir de qualité moyenne d’une élève de 11 ans, accompagné de photographies qui présentaient l’élève soit comme n’étant pas en surpoids, soit comme étant en surpoids. Le biais lié au poids a été évalué en demandant aux enseignants de noter la rédaction et de donner leur avis sur les compétences de l’élève (effort perçu, besoin de tutorat et réussite scolaire globale).

Les enseignants étaient beaucoup plus susceptibles de recommander aux élèves en surpoids de suivre un tutorat ou de bénéficier d’une aide corrective. Ils jugeaient leur travail moins soigné que celui de leurs homologues sans surpoids. Ils attribuaient à leurs rédactions des notes inférieures dans l’ensemble, même lorsque les rédactions étaient exactement les mêmes.

Ils ont également jugé que les élèves en surpoids avaient travaillé beaucoup plus dur que les autres, peut-être parce qu’ils étaient considérés comme moins capables et avaient donc davantage besoin d’essayer. Il est intéressant de noter que, même si les enseignants ont attribué des notes inférieures aux élèves en surpoids, ils n’ont pas considéré que la qualité de leurs rédactions était inférieure.

Ces résultats illustrent les attitudes biaisées par le poids souvent présentes chez les enseignants. Bien que les élèves puissent faire autant d’efforts ou produire un travail de qualité égale, les stéréotypes sur ce que signifie le surpoids déforment la perception des enseignants.



L’importance d’une prise en compte des préjugés et stéréotypes dans l’évaluation


Nous savons que les enseignants attribuent des notes plus élevées aux élèves qu’ils apprécient et à ceux qui partagent la même origine culturelle qu’eux.

Les recherches que nous avons présentées montrent l’existence de préjugés et de stéréotypes liés au poids, au genre et à l’origine des élèves. Elles montrent comment de tels phénomènes semblent inévitables et nécessitent une prise de conscience de la part des enseignants pour des raisons éthiques et inclusives.

L’apparence corporelle est une dimension qui peut être délicate à assumer. Pour les adolescents, cela peut être encore plus difficile. L’adolescence est une période charnière pour le développement d’une image corporelle positive ou négative avec un impact sur l’estime de soi globale.

De plus, les élèves ont très peu d’impact et plus régulièrement aucune possibilité d’action face à ces facteurs (sexe, origine…).

Ces facteurs, ces stéréotypes et ces préjugés ne changent pas seulement la perception qu’un adolescent a de lui-même, ils peuvent aussi changer la façon dont les autres les évaluent. 

S’attaquer à ces biais, à ces stéréotypes et à ces préjugés est une étape essentielle pour soutenir le développement d’adultes heureux et en bonne santé. Mais pour y parvenir, il faudra défaire les attitudes profondément enracinées. 

La première étape consiste peut-être simplement à reconnaître leur existence et la façon dont ils peuvent influencer notre évaluation. Cette prise de conscience peut permettre d’avoir un regard critique sur nos processus d’évaluation.  

Il est essentiel d’être plus conscient des différents facteurs qui influencent notre perception des autres. Tous les élèves doivent pouvoir être traités de la même manière face à leurs apprentissages.


Mis à jour le 27/02/2024

Bibliographie


Dian M, Triventi M (2021) The weight of school grades: Evidence of biased teachers’ evaluations against overweight students in Germany. PLoS ONE 16(2): e0245972. https://doi. org/10.1371/journal.pone.0245972 

David Didau, What if everything you knew about education was wrong?, 2016, Crown House.

Zerrin Salikutluk, Stefanie Heyne, Do Gender Roles and Norms Affect Performance in Maths? The Impact of Adolescents’ and their Peers’ Gender Conceptions on Maths Grades, European Sociological Review, Volume 33, Issue 3, June 2017, Pages 368–381, https://doi.org/10.1093/esr/jcx049

Bonefeld M, Dickha ̈ user O. (Biased) grading of students’ performance: Students’ names, performance level, and implicit attitudes. Front Psychol. 2018; 9(1):1–13. https://doi.org/10.3389/fpsyg.2018.00481 PMID: 29867618 

MacCann C, Roberts RD. Just as smart but not as successful: obese students obtain lower school grades but equivalent test scores to nonobese students. Int J Obes (Lond). 2013 Jan;37(1):40-6. doi: 10.1038/ijo.2012.47. Epub 2012 Apr 24. PMID: 22531092.

Burmeister, J.M., Kiefner, A.E., Carels, R.A. and Musher-Eizenman, D.R. (2013), Weight bias in graduate school admissions. Obesity, 21:918–920. https://doi.org/10.1002/oby.20171

Finn, K.E., Seymour, C.M. and Phillips, A.E. (2020), Weight bias and grading among middle and high school teachers. Br J Educ Psychol, 90:635–647. https://doi.org/10.1111/bjep.12322

Emily Reynolds, Teachers show biases against overweight kids, 2019, https://www.bps.org.uk/research-digest/teachers-show-biases-against-overweight-kids

Dylan Wiliam, Dylan Wiliam’s vision for fair and accurate assessment, 2022, https://www.tes.com/magazine/teaching-learning/secondary/dylan-wiliam-exams-assessment-fair-accurate 

Crato, Nuno, Setting up the Scene: Lessons Learned from PISA 2018 Statistics and Other International Student Assessments, pp 1–24, in Improving a Country’s Education PISA 2018 Results in 10 Countries Editors: Crato, Nuno (Ed.), Springer, 2021

0 comments:

Enregistrer un commentaire