Toutefois, toute école adoptant un système de récompenses ou de sanctions en vue de gérer le comportement des élèves utilise de manière implicite une approche béhavioriste.
Le béhaviorisme dans les dimensions qu’en a développées Burrhus F. Skinner (1904-1990) mérite cependant plus que des critiques stéréotypées et des raccourcis, d’autant que nombre de recherches depuis ont affiné et précisé ses découvertes. Voici une synthèse des principes généraux du conditionnement opérant :
À partir de 1945, Burrhus F. Skinner (1904-1990) est porteur d’un nouveau courant au sein du béhaviorisme classique (voir article) que l’on appelle béhaviorisme radical. Il conçoit une science entièrement dédiée à l’étude du comportement, sans référence aux explications internes de nature mentale.
Le comportement selon Skinner désigne l’interaction et les rapports qu’un organisme entretient avec son environnement. Ce comportement peut être public. Il peut être privé, s’il n’est accessible qu’à la personne qui le réalise.
Selon Skinner, les événements mentaux, comme penser ou imaginer, ne sont pas les causes de comportements, ce sont plutôt des exemples de comportements causés par des stimuli environnementaux.
Pour Skinner, si nous voulons comprendre les raisons d’un comportement, il n’est pas nécessaire de comprendre les états psychologiques internes. Il suffit de comprendre les principes d’apprentissage qui permettent d’acquérir une association entre un comportement et une récompense.
Selon Edward L. Thorndike (1874-1969), qui a étudié le comportement chez le chat, et a été une influence prépondérante pour Skinner :
L’apprentissage dépend directement du nombre de fixations d’une connexion entre une situation et une réponse.
Thorndike en est venu à voir l’apprentissage comme le produit de l’association entre un stimulus et une réponse apprise, une connexion stimulus-réponse (S-R).
L’apprentissage de ces connexions S-R a lieu graduellement et automatiquement de façon mécanique au fur et à mesure que l’animal expérimente les conséquences de ses actions par des essais et des erreurs en aveugle.
Le conditionnement opérant est un concept du béhaviorisme initié par Edward Thorndike et développé par Skinner au milieu du XXe siècle. Cette théorie s’intéresse à un apprentissage qui résulte en une modification du comportement, en fonction des conséquences de ce dernier. Récompenses et punitions vont rendre plus ou moins probable la reproduction d’un comportement donné.
Le conditionnement opérant repose ainsi sur deux éléments, le renforcement et la punition. Chacun d’entre eux peut être soit positif soit négatif.
Le conditionnement opérant ne prend aucunement en considération des états internes (mentaux ou neuronaux. Ce qui compte c’est ce qu’on peut observer.
Skinner distingue le conditionnement opérant du conditionnement classique par le fait que la conduite humaine est conditionnée par les conséquences du comportement. La réponse du sujet est volontaire, parce que motivée par ses conséquences.
Le comportement opérant figure déjà dans le répertoire d’un organisme et il est causé par des conditions internes et il est exécuté régulièrement de manière spontanée en l’absence de stimuli externes particuliers.
La plupart des comportements volontaires sont opérants tandis que le conditionnement classique traite plutôt de réponses réflexes. Le comportement opérant n’est pas suscité par des stimuli précis, comme le sont les réponses dans un conditionnement classique.
L’analyse de Skinner était essentiellement expérimentale et empirique avant d’être théorique. Skinner organisait des expériences, collectait et évaluait les données sans être guidé par une théorie préalable.
Dans un contexte scolaire, l’intérêt du conditionnement opérant est qu’un agent extérieur [enseignant, parent, entraîneur ou coach] peut organiser, chez un individu, des contingences de renforcement [récompenses et punitions]. Elles permettent d’accroître la probabilité d’apparition de réponses opérantes devant un ou plusieurs stimuli.
La contingence de comportement est une relation stable entre un comportement et les conséquences qu’il produit de manière régulière, mais non systématique. La contingence est l’éventualité de la relation entre ces deux événements, l’un étant conséquence contingente [probable, mais pas certaine d’avoir lieu] de l’autre événement.
Une contingence comportementale est une relation de dépendance entre le comportement et ses conséquences :
Les stimuli renforçateurs [conséquences contingences] sont toujours définis de façon empirique quant à leurs effets sur le changement de la probabilité d’une réponse.
Il existe trois types de stimuli :
Le fait de savoir s’ils seront effectivement des renforçateurs positifs ou négatifs va dépendre également du comportement propre à l’individu. Certains aliments, certaines activités, certains privilèges ou formes de reconnaissance ou de récompense peuvent être neutres pour certains, appétants ou aversifs pour d’autres.
Si nous voulons utiliser un stimulus pour un conditionnement, il faut donc au préalable s’assurer qu’il jouera effectivement le rôle escompté pour le public visé.
Les renforçateurs modifient ou maintiennent le comportement. Ils peuvent être appris par l’expérience.
Les renforçateurs primaires sont innés et biologiquement déterminés : la faim, la soif, la peur, le besoin de sécurité, etc.
Avec le temps, par conditionnement, des stimuli initialement neutres se sont associés à des renforçateurs primaires et fonctionnent aujourd’hui en tant que renforçateurs conditionnels pour des réponses opérantes.
Comme dans le conditionnement classique, nous mettons en évidence qu’un stimulus neutre peut être conditionné lorsqu’il est associé à un renforçateur primaire. Ce stimulus neutre devient alors un renforçateur conditionné ou secondaire.
Il semble que le comportement humain soit moins façonné par des renforçateurs primaires importants sur le plan biologique que par une grande variété de renforçateurs conditionnés ou secondaires [par exemple de l’argent, des notes, des privilèges, des éloges].
Dans le cadre de la gestion du comportement en contexte scolaire, ce sont des renforçateurs conditionnels qui sont utilisés :
Le renforcement positif vise une augmentation de la fréquence d’un comportement, grâce à la présence contingente d’un stimulus appétant.
Ce stimulus appétant joue le rôle d’une conséquence qui entraîne le fait que le comportement qui l’a précédé, et auquel il est contingent, aura une plus forte probabilité de réapparaitre dans le futur sous les mêmes conditions.
Exemples :
1) Afin de souligner l’engagement de ses élèves, un enseignement leur donne des jetons de temps à autre sous forme de renforcement positif. Les élèves savent que lorsqu’ils auront accumulé vingt jetons, une sortie qu’ils attendent avec impatience sera organisée. Chaque fois que l’enseignant donne un jeton à la classe, il s’associe explicitement à certains comportements attendus qu’il a observés en classe. De cette manière, les élèves associent les jetons et la sortie à venir à l’adoption de certains comportements spécifiques.
2) L’enseignant félicite un élève en classe brièvement après qu’il ait répondu correctement à une question sur un point de matière nouveau, montrant ainsi sa compréhension et sa volonté de faire des efforts. L’élève sourit et son sentiment d’auto-efficacité s’en trouve renforcé, ce qui l’incite à rester engagé et à participer encore par la suite.
Le renforcement négatif vise une augmentation de la fréquence d’un comportement grâce à l’absence contingente d’une conséquence aversive.
Lorsqu’un comportement est suivi par le retrait d’un stimulus aversif, ce qui rend sa manifestation plus probable, nous parlons de renforcement négatif.
Le renforcement devient négatif si l’absence d’un comportement est suivie d’une conséquence négative (stimulus déplaisant ou dérangeant). Il l’est également lorsque le retrait ou l’évitement d’une conséquence de ce genre accroît la probabilité que ce comportement survienne de nouveau.
Les renforçateurs négatifs affaiblissent et font disparaître les comportements non voulus qui les font survenir et augmentent les comportements recherchés qui les suppriment.
Il existe différents types de circonstances d’apprentissage où s’applique ce renforcement négatif.
Essentiellement, elles prennent la forme de conditionnement d’évasion ou d’évitement. Nous adoptons ou acquérons un comportement qui permet d’échapper ou d’éviter des stimuli aversifs avant qu’ils n’arrivent.
Sans pour autant donner de renforcement positif ou de punition à l’élève, en introduisant un renforcement négatif, nous facilitons l’adoption du comportement attendu, qui devient plus facile à mobiliser que son opposé.
Exemples :
1) Selon le principe de la vérification de la compréhension en enseignement explicite, l’enseignant interroge systématiquement au hasard ses élèves sur la matière en cours. De manière à éviter de répondre une question sur un élément enseigné durant un temps où ils n’auraient pas été attentifs, les élèves vont apprendre à être plus engagés au cours. Ainsi, ils peuvent échapper à cette situation.
2) Un enseignant donne de manière régulière des préparations et devoirs à réaliser. Il vérifie régulièrement avant une correction commune leur réalisation. Les élèves sont incités à les réaliser parce qu’ils savent que s’ils ne sont pas dans les temps, un devoir supplémentaire leur sera attribué pour soutenir leurs apprentissages. En remettant leurs travaux dans les temps, les élèves peuvent échapper à des travaux de récupération ultérieurs.
3) Lors d’une séance de pratique autonome, un élève ne travaille pas. L’élève sait que l’enseignant circule et que s’il ne fait rien, il va s’en apercevoir et réagir par un rappel à l’ordre. L’élève se met au travail, car il sait que de cette manière il aura des interactions de soutien avec son enseignant s’éloigne. Se mettre au travail permet à l’élève d’échapper au stimulus négatif.
La punition est une autre manière d’éteindre un comportement. Nous cherchons à faire décroître la probabilité que survienne un comportement souvent jugé indésirable.
Une punition correspond à tout stimulus qui, lorsqu’il est contingent d’une réponse, en diminue la probabilité d’expression. Une punition est toute conséquence qui diminue la probabilité d’un comportement.
Les punitions ne sont pas d’emblée efficaces : il faut les mettre à l’essai et constater empiriquement leur efficacité. Nous devons nous assurer que les élèves connaissent les comportements attendus de remplacement et que ceux-ci sont suffisamment renforcés.
La punition positive est une procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à diminuer à la suite de l’ajout d’un stimulus aversif ou conséquence aversive contingente au comportement cible.
Par exemple, à la suite d’un comportement perturbateur, un élève peut avoir des tâches à accomplir ou devoir rester en retenue à l’école. Il peut également recevoir de la désapprobation de son enseignant, de la direction ou de ses parents.
La punition négative est une procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à diminuer à la suite du retrait d’un stimulus appétitif. La punition négative est donc le fait de baisser la fréquence d’apparition d’un comportement en retirant en conséquence à celui-ci qui est un stimulus appétitif pour la personne.
Par exemple, à la suite de son comportement, un élève peut être privé de récréation ou être privé de sortir sur le temps de midi. À la suite de mauvais résultats scolaires, ses parents peuvent limiter son usage de la console de jeux.
(photographie : Paul Graham)
Le béhaviorisme radical de Skinner
À partir de 1945, Burrhus F. Skinner (1904-1990) est porteur d’un nouveau courant au sein du béhaviorisme classique (voir article) que l’on appelle béhaviorisme radical. Il conçoit une science entièrement dédiée à l’étude du comportement, sans référence aux explications internes de nature mentale.
Le comportement selon Skinner désigne l’interaction et les rapports qu’un organisme entretient avec son environnement. Ce comportement peut être public. Il peut être privé, s’il n’est accessible qu’à la personne qui le réalise.
Selon Skinner, les événements mentaux, comme penser ou imaginer, ne sont pas les causes de comportements, ce sont plutôt des exemples de comportements causés par des stimuli environnementaux.
Pour Skinner, si nous voulons comprendre les raisons d’un comportement, il n’est pas nécessaire de comprendre les états psychologiques internes. Il suffit de comprendre les principes d’apprentissage qui permettent d’acquérir une association entre un comportement et une récompense.
La loi de l’effet de Thorndike
Selon Edward L. Thorndike (1874-1969), qui a étudié le comportement chez le chat, et a été une influence prépondérante pour Skinner :
- Les comportements suivis de manière répétée par des récompenses génèrent de la satisfaction. Cela a pour conséquence de les renforcer jusqu’au point où les récompenses ne sont plus systématiquement nécessaires pour les entraîner.
- À l’opposé, les comportements suivis par des conséquences désagréables s’affaiblissent et le caractère inhibant de la situation peut même les neutraliser et les faire disparaître.
- Une réponse qui est suivie de conséquences satisfaisantes devient de plus en plus probable .
- Une réponse suivie de conséquences non satisfaisantes devient de moins en moins probable .
L’apprentissage dépend directement du nombre de fixations d’une connexion entre une situation et une réponse.
Thorndike en est venu à voir l’apprentissage comme le produit de l’association entre un stimulus et une réponse apprise, une connexion stimulus-réponse (S-R).
L’apprentissage de ces connexions S-R a lieu graduellement et automatiquement de façon mécanique au fur et à mesure que l’animal expérimente les conséquences de ses actions par des essais et des erreurs en aveugle.
Le conditionnement opérant selon Skinner
Le conditionnement opérant repose ainsi sur deux éléments, le renforcement et la punition. Chacun d’entre eux peut être soit positif soit négatif.
Le conditionnement opérant ne prend aucunement en considération des états internes (mentaux ou neuronaux. Ce qui compte c’est ce qu’on peut observer.
Skinner distingue le conditionnement opérant du conditionnement classique par le fait que la conduite humaine est conditionnée par les conséquences du comportement. La réponse du sujet est volontaire, parce que motivée par ses conséquences.
Le comportement opérant figure déjà dans le répertoire d’un organisme et il est causé par des conditions internes et il est exécuté régulièrement de manière spontanée en l’absence de stimuli externes particuliers.
La plupart des comportements volontaires sont opérants tandis que le conditionnement classique traite plutôt de réponses réflexes. Le comportement opérant n’est pas suscité par des stimuli précis, comme le sont les réponses dans un conditionnement classique.
L’analyse de Skinner était essentiellement expérimentale et empirique avant d’être théorique. Skinner organisait des expériences, collectait et évaluait les données sans être guidé par une théorie préalable.
Dans un contexte scolaire, l’intérêt du conditionnement opérant est qu’un agent extérieur [enseignant, parent, entraîneur ou coach] peut organiser, chez un individu, des contingences de renforcement [récompenses et punitions]. Elles permettent d’accroître la probabilité d’apparition de réponses opérantes devant un ou plusieurs stimuli.
La contingence de comportement
Une contingence comportementale est une relation de dépendance entre le comportement et ses conséquences :
- Les conséquences [punitions ou récompenses] doivent être contingentes au comportement donné ou être perçues comme telles. Les conséquences doivent aussi avoir lieu régulièrement après ce comportement, mais pas après des comportements différents. Il doit y avoir une relation de spécificité entre les deux.
- La nature des conséquences détermine la probabilité que ce même comportement se reproduise dans des conditions similaires. Il y a une sélection par les conséquences : en agissant, un individu entraîne des conséquences dans son environnement immédiat et celles-ci renforcent ou non son comportement.
- Un stimulus : un renforçateur positif ou négatif, une punition positive ou négative
- Une réponse : c’est le comportement visé
- Un effet : le renforcement ou la punition augmentent ou diminuent la fréquence de la réponse
Les renforçateurs
Les stimuli renforçateurs [conséquences contingences] sont toujours définis de façon empirique quant à leurs effets sur le changement de la probabilité d’une réponse.
Il existe trois types de stimuli :
- Neutres, s’ils nous laissent indifférents.
- Appétants, s’ils nous attirent.
- Aversifs, si nous cherchons à les éviter.
Si nous voulons utiliser un stimulus pour un conditionnement, il faut donc au préalable s’assurer qu’il jouera effectivement le rôle escompté pour le public visé.
Les renforçateurs modifient ou maintiennent le comportement. Ils peuvent être appris par l’expérience.
Renforçateurs primaires ou conditionnels
Avec le temps, par conditionnement, des stimuli initialement neutres se sont associés à des renforçateurs primaires et fonctionnent aujourd’hui en tant que renforçateurs conditionnels pour des réponses opérantes.
Comme dans le conditionnement classique, nous mettons en évidence qu’un stimulus neutre peut être conditionné lorsqu’il est associé à un renforçateur primaire. Ce stimulus neutre devient alors un renforçateur conditionné ou secondaire.
Il semble que le comportement humain soit moins façonné par des renforçateurs primaires importants sur le plan biologique que par une grande variété de renforçateurs conditionnés ou secondaires [par exemple de l’argent, des notes, des privilèges, des éloges].
Dans le cadre de la gestion du comportement en contexte scolaire, ce sont des renforçateurs conditionnels qui sont utilisés :
- Les renforçateurs primaires ne sont pas accessibles tandis que tout ce qui est sous le contrôle de l’enseignant est susceptible de devenir un renforçateur conditionnel.
- Les renforçateurs conditionnels sont susceptibles d’être distribués facilement et rapidement.
- Leur effet est immédiat, car il dépend de la façon dont l’élève les reçoit et non d’un processus biologique.
- Ils peuvent être utilisés dans des systèmes d’économie à jetons. Ces jetons peuvent être accumulés et valorisés plus tard.
Quatre types de conditionnement opérant
Il est important de distinguer deux notions :
- Le renforcement correspond à un objectif d’augmentation de la fréquence d’apparition d’un comportement.
- La punition correspond à un objectif de diminution de la fréquence d’apparition d’un comportement
Ces deux notions sont associées d’un qualificatif :
- Positif, signifie qu’on ajoute un stimulus [ou renforçateur]
- Négatif, signifie qu’on retire un stimulus [ou renforçateur]
Les renforcements positifs et négatifs
Renforcement positif
Le renforcement positif vise une augmentation de la fréquence d’un comportement, grâce à la présence contingente d’un stimulus appétant.
Ce stimulus appétant joue le rôle d’une conséquence qui entraîne le fait que le comportement qui l’a précédé, et auquel il est contingent, aura une plus forte probabilité de réapparaitre dans le futur sous les mêmes conditions.
Exemples :
1) Afin de souligner l’engagement de ses élèves, un enseignement leur donne des jetons de temps à autre sous forme de renforcement positif. Les élèves savent que lorsqu’ils auront accumulé vingt jetons, une sortie qu’ils attendent avec impatience sera organisée. Chaque fois que l’enseignant donne un jeton à la classe, il s’associe explicitement à certains comportements attendus qu’il a observés en classe. De cette manière, les élèves associent les jetons et la sortie à venir à l’adoption de certains comportements spécifiques.
2) L’enseignant félicite un élève en classe brièvement après qu’il ait répondu correctement à une question sur un point de matière nouveau, montrant ainsi sa compréhension et sa volonté de faire des efforts. L’élève sourit et son sentiment d’auto-efficacité s’en trouve renforcé, ce qui l’incite à rester engagé et à participer encore par la suite.
Renforcement négatif
Le renforcement négatif vise une augmentation de la fréquence d’un comportement grâce à l’absence contingente d’une conséquence aversive.
Lorsqu’un comportement est suivi par le retrait d’un stimulus aversif, ce qui rend sa manifestation plus probable, nous parlons de renforcement négatif.
Le renforcement devient négatif si l’absence d’un comportement est suivie d’une conséquence négative (stimulus déplaisant ou dérangeant). Il l’est également lorsque le retrait ou l’évitement d’une conséquence de ce genre accroît la probabilité que ce comportement survienne de nouveau.
Les renforçateurs négatifs affaiblissent et font disparaître les comportements non voulus qui les font survenir et augmentent les comportements recherchés qui les suppriment.
Il existe différents types de circonstances d’apprentissage où s’applique ce renforcement négatif.
Essentiellement, elles prennent la forme de conditionnement d’évasion ou d’évitement. Nous adoptons ou acquérons un comportement qui permet d’échapper ou d’éviter des stimuli aversifs avant qu’ils n’arrivent.
Sans pour autant donner de renforcement positif ou de punition à l’élève, en introduisant un renforcement négatif, nous facilitons l’adoption du comportement attendu, qui devient plus facile à mobiliser que son opposé.
Exemples :
1) Selon le principe de la vérification de la compréhension en enseignement explicite, l’enseignant interroge systématiquement au hasard ses élèves sur la matière en cours. De manière à éviter de répondre une question sur un élément enseigné durant un temps où ils n’auraient pas été attentifs, les élèves vont apprendre à être plus engagés au cours. Ainsi, ils peuvent échapper à cette situation.
2) Un enseignant donne de manière régulière des préparations et devoirs à réaliser. Il vérifie régulièrement avant une correction commune leur réalisation. Les élèves sont incités à les réaliser parce qu’ils savent que s’ils ne sont pas dans les temps, un devoir supplémentaire leur sera attribué pour soutenir leurs apprentissages. En remettant leurs travaux dans les temps, les élèves peuvent échapper à des travaux de récupération ultérieurs.
3) Lors d’une séance de pratique autonome, un élève ne travaille pas. L’élève sait que l’enseignant circule et que s’il ne fait rien, il va s’en apercevoir et réagir par un rappel à l’ordre. L’élève se met au travail, car il sait que de cette manière il aura des interactions de soutien avec son enseignant s’éloigne. Se mettre au travail permet à l’élève d’échapper au stimulus négatif.
Les punitions positives ou négatives
La punition est une autre manière d’éteindre un comportement. Nous cherchons à faire décroître la probabilité que survienne un comportement souvent jugé indésirable.
Une punition correspond à tout stimulus qui, lorsqu’il est contingent d’une réponse, en diminue la probabilité d’expression. Une punition est toute conséquence qui diminue la probabilité d’un comportement.
Les punitions ne sont pas d’emblée efficaces : il faut les mettre à l’essai et constater empiriquement leur efficacité. Nous devons nous assurer que les élèves connaissent les comportements attendus de remplacement et que ceux-ci sont suffisamment renforcés.
Punition positive
La punition positive est une procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à diminuer à la suite de l’ajout d’un stimulus aversif ou conséquence aversive contingente au comportement cible.
Par exemple, à la suite d’un comportement perturbateur, un élève peut avoir des tâches à accomplir ou devoir rester en retenue à l’école. Il peut également recevoir de la désapprobation de son enseignant, de la direction ou de ses parents.
Punition négative
La punition négative est une procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à diminuer à la suite du retrait d’un stimulus appétitif. La punition négative est donc le fait de baisser la fréquence d’apparition d’un comportement en retirant en conséquence à celui-ci qui est un stimulus appétitif pour la personne.
Par exemple, à la suite de son comportement, un élève peut être privé de récréation ou être privé de sortir sur le temps de midi. À la suite de mauvais résultats scolaires, ses parents peuvent limiter son usage de la console de jeux.
Comparaison entre punition ou renforcement positif dans un cadre éducatif
- La punition s’avère souvent moins efficace que le renforcement positif :
- Souvent, elle va venir supprimer temporairement un comportement, mais sans réellement l’affaiblir à long terme.
- La raison principale est que la punition est souvent détachée du comportement punissable :
- De ce fait, l’élève a du mal à lui donner sens et elle est rarement une occasion d’apprendre le comportement adapté.
- Elle n’enseigne pas le comportement attendu à l’élève. Dans le meilleur des cas, elle arrête le comportement inadéquat.
- Les modifications du comportement engendrées par la punition ne seront jamais aussi prévisibles que celles produites par le renforcement positif :
- Dans certaines circonstances, la punition va tendre à figer le comportement plutôt qu’à l’éliminer et amener une certaine tension.
- L’élève qui reçoit la punition peut en arriver à détester la personne qui a administré la punition et le lieu où il l’a subie. Il crée une association entre les deux qui peut avoir des conséquences défavorables pour lui.
- La punition ne devient réellement efficace que lorsque l’individu adopte un autre comportement que nous pouvons ensuite soutenir par du renforcement positif :
- Il est dès lors important de s’assurer que l’élève soit dans de bonnes conditions et accompagné dans l’apprentissage du comportement souhaité.
- L’élève doit connaitre le comportement attendu et être en pleine capacité de l’exprimer.
- L’intervention la plus efficace pour modifier des comportements inadéquats est le recours au renforcement positif :
- Les stratégies générales liées au renforcement positif sont facilement adoptables par n’importe quel enseignant en classe sous des formes non tangibles, verbales ou non verbales, contingentes ou non contingentes.
- En dehors des techniques habituelles non tangibles, il existe des approches plus organisées susceptibles d’être bénéficiaires dans des contextes plus difficiles. Ce sont par exemple :
- Les systèmes d’économie à jeton : un élève se voit octroyer un jeton pour l’adoption de bons comportements, préalablement enseignés. Il peut les accumuler et les échanger par la suite contre un privilège.
- La contingence de groupe : il s’agit d’une déclinaison des systèmes d’économie à jeton. L’ensemble des élèves d’une classe ou des équipes d’élèves accumulent des jetons en fonction des performances d’un membre du groupe ou de l’ensemble du groupe. Dans ce cadre, les élèves sont amenés à se soutenir mutuellement dans l’adoption des comportements attendus. La démarche entend agir sur la culture de classe et le sentiment d’appartenance des élèves.
- En milieu scolaire, la majorité des systèmes de renforcement mise sur des approches nettement moins efficaces que le renforcement positif, comme le renforcement négatif, la punition ou le coût de la réponse.
- Le système de coût de la réponse est un système d’économie à jetons où un élève peut se voir retirer des points ou des jetons qu’il a obtenus auparavant pour ses bons comportements.
- Dans le cadre du renforcement négatif, le progrès dans l’adoption de comportements attendus se voir assorti du retrait d’une conséquence aversive. Par exemple, à la suite du bon comportement de ses élèves, un enseignant peut alléger le devoir qu’il allait leur donner.
Extinction opérante et restauration opérante
Si le renforcement est retiré, l’extinction opérante a lieu, c’est-à-dire que le conditionnement opérant s’atténue peu à peu. Par exemple, si l’enseignant cesse de vérifier les préparations durant une période prolongée, celles-ci ont de grandes chances de ne plus être faites correctement par nombre d’élèves.
Ainsi, si un comportement ne produit plus les conséquences prévisibles, il retrouve son niveau d’avant le conditionnement opérant.
La restauration spontanée est également une caractéristique du conditionnement opérant. Lorsqu’un conditionnement opérant a été éteint ou a quasi disparu, il est rapidement réinstallé si le système de renforcement ou de punition qui avait permis de l’instaurer est rétabli.
Exemples :
1) Si l’enseignant cesse d’interroger au hasard les élèves, mais sélectionne uniquement les volontaires, bon nombre d’élèves peuvent en conclure qu’ils peuvent se reposer et leur engagement diminue.
2) Si l’enseignant recommence à vérifier les préparations ou à interroger au hasard les élèves après un temps d’arrêt, ils vont rapidement retrouver les comportements opérants antérieurs.
3) Une conséquence naturelle et utile de ces phénomènes intervient au retour d’une période de vacances prolongées. Il est alors opportun et préventif de rappeler les règles et routines de classe de manière concrète et positive aux élèves.
Le phénomène de satiété
Le phénomène de satiété apparait lorsque les élèves perdent l’intérêt pour certains types de renforçateurs (punitions ou renforcements) utilisés par l’enseignant. D’appétants ou aversifs, ils peuvent devenir neutres.
Les élèves ont tendance à rapidement remarquer qu’ils sont manipulés par l’instauration d’un système de renforcement. Parfois, ils peuvent détourner le système pour en détecter les failles et les utiliser à leur avantage contre celui de l’enseignant en manipulant le critère amenant à la distribution du renforçateur. Ce problème mène souvent l’enseignant à constamment alimenter les élèves de nouvelles récompenses ou augmenter la fréquence du renforçateur pour que les élèves manifestent le comportement attendu.
Initialement, les techniques béhavioristes en contexte scolaire ont été centrées sur des approches telles que le :
- L’utilisation de renforcements :
- Les comportements désirés étaient renforcés par des félicitations ou du matériel de récompense (jetons) et ceux non désirés étaient éteints par l’ignorance de leur existence.
- Concrètement, il s’agit d’utiliser un système d’économie à jetons dont l’accumulation donne accès à des récompenses et à des privilèges pour les élèves
- Le façonnement du comportement :
- Il s’agit du renforcement différentiel d’approximations successives d’un comportement cible jusqu’à ce que la personne fasse le bon comportement.
- Concrètement, nous allons renforcer le comportement d’un élève dans sa phase d’amélioration et de progression et ne pas attendre que les attentes soient pleinement respectées pour le faire.
Des recherches ultérieures ont ajouté à ces techniques :
- L’enseignement explicite des comportements :
- Il s’agit d’enseigner les attentes scolaires traduites en comportements et routines à adopter en classe, comme n’importe quelle matière.
- Il comporte des stratégies de modelage. L’enseignant illustre le comportement désiré, il exécute le geste, verbalise ses pensées en l’exécutant afin d’en guider l’exécution.
- Les élèves ont alors l’occasion d’exécuter le comportement sous la supervision de l’enseignant.
- Pour finir, les élèves réalisent l’activité par eux-mêmes, de façon autonome sous la vigilance de l’enseignant.
- L’apprentissage vicariant où l’enfant apprend par imitation de ses pairs également.
- Un accent sur l’usage du renforcement positif dont l’impact a été démontré sur l’amélioration des relations, sur la motivation et l’engagement des élèves.
- Des stratégies de modification du comportement à partir d’approches faisant davantage appel à la cognition, comme l’analyse appliquée du comportement.
Des programmes de gestion des comportements au niveau de l’école, comme le PBIS (Positive Behavioral Intervention and Supports, SCP ou soutien au comportement en français), ont été créés en associant différentes approches probantes pour la gestion du comportement.
L’enseignement programmé et les machines à enseigner
Skinner est parti de différentes constatations sur l’enseignement traditionnel :
- Le degré de difficulté de certaines tâches scolaires est régulièrement trop élevé en rapport avec les capacités de certains élèves. Cette situation les incite à adopter des comportements de désengagement et affaiblit les comportements d’engagement.
- Le délai entre la réalisation d’une tâche et la réception d’un renforcement en rapport avec celle-ci est souvent trop long dans un cadre scolaire.
- Une pédagogie traditionnelle, à la fois autoritaire, arbitraire et répressive laisse l’élève dans l’incertitude et l’indétermination.
Cette situation selon le point de vue de Skinner est susceptible de générer chez les élèves de l’anxiété, de l’insécurité et de l’agressivité, toutes nuisibles au comportement scolaire. Elle peut être corrigée par l’instauration et l’application rigoureuse de systèmes de contingences de renforcements.
Cependant, selon le point de vue de Skinner, un enseignant face à 20 ou 30 élèves ne sera pas en capacité de respecter dans ses interactions en classe, les principes pédagogiques qu’il a déduits à travers le conditionnement opérant.
Pour y remédier, Skinner s’est investi dans deux approches permettant un enseignement plus individualisé :
- L’enseignement programmé
- Les machines à enseigner
L’enseignement programmé
Le bilan de l’enseignement programmé est plutôt mitigé, car il n’a pas permis une véritable amélioration de la réussite scolaire. Son idée dans les deux cas était de libérer du temps pour que l’enseignant puisse multiplier des contacts humains (affectifs, culturels et intellectuels) favorisant leur engagement.
La démarche consiste à découper les objectifs d’apprentissage en fragments plus petits.
Il y avait deux problèmes :
- Manque de sens pour les élèves qui ne pouvaient pas globaliser la matière, celle-ci étant fragmentée.
- L’accent est mis sur la performance à chaque tâche. Il laisse de côté la question des stratégies cognitives qui sont pourtant cruciales à l’apprentissage, la tendance du béhaviorisme à ne pas rentrer dans la boîte noire de l’esprit humain y contribuant.
Certains éléments de l’enseignement programmé ont été mis en évidence par les recherches empiriques qui ont mené à l’établissement de l’enseignement explicite. C’est par exemple comme le besoin d’aller du simple vers le complexe en découpant les apprentissages selon une approche systématique et graduelle, de même que l’idée d’un temps actif d’apprentissage ou du surapprentissage.
Les machines à enseigner
Les prototypes de machine à enseigner créés par Skinner proposaient aux élèves des problèmes de mathématiques selon un ordre aléatoire et offraient une rétroaction immédiate après chaque résolution.
Cette machine permettait d’exercer des habiletés déjà acquises, mais elle ne conduisait pas à l’apprentissage de nouveaux savoir-faire. Les élèves sont donc mis dans des situations d’entraînement, d’exercice intensif.
Le but de la machine à enseigner selon Skinner est de donner plus d’importance au rôle humain de l’enseignant. L’enseignant est dès lors plus disponible pour l’observation de leurs comportements d’apprentissage et l’application de renforcements appropriés.
La machine ne remplaçait pas l’enseignant, c’était un dispositif auxiliaire que l’enseignant utilise de manière à optimiser les conditions d’apprentissage.
Trois avantages :
- Chaque élève fournit une réponse à chaque problème réalisé.
- Validation et rétroaction immédiate.
- Focalisation de l’attention sur des éléments ciblés de l’apprentissage.
Les caractéristiques des machines à enseigner sont :
- Plus de temps disponible pour la supervision des apprentissages par les élèves.
- Chaque élève avance à son rythme.
- La machine à enseigner fournit des rétroactions et des renforcements immédiats.
- Les élèves sont confrontés à des tâches réduites qui vont du simple vers le complexe de manière précédemment planifiée par l’enseignant. La résolution de chaque tâche demande que les précédentes aient été résolues.
- L’attrait de la technologie peut présenter un attrait pour les élèves.
Certains de ces principes se retrouvent dans des applications numériques actuelles destinées à soutenir l’apprentissage en classe.
Mis à jour le 12/04/2023
Bibliographie
Gerrig & Zimbardo. Psychologie 18e édition. Pearson. 2013, p 145-154
Jean-François Desbiens, Le béhaviorisme et l’approche scientifique de l’enseignement, in Clermont Gauthier & Maurice Tardif, La Pédagogie (4e Édition), Chenelière Éducation, 2017, PP 199-206
David Didau & Nick Rose, What every teacher needs to know about psychology, John Catt, 2016, pp 151–161
Franck Ramus, De la perturbation à l’implication : comment faire adhérer les élèves ?, 2019, https://soundcloud.com/institutcatholiquedeparis/de-la-perturbation-a-limplication-comment-faire-adherer-les-eleves
Steve Bissonnette, Clermont Gauthier & Mireille Castonguay, L’enseignement explicite des comportements, Chenelière, 2017
Franck Ramus, De la perturbation à l’implication : comment faire adhérer les élèves ?, 2019, https://soundcloud.com/institutcatholiquedeparis/de-la-perturbation-a-limplication-comment-faire-adherer-les-eleves
Steve Bissonnette, Clermont Gauthier & Mireille Castonguay, L’enseignement explicite des comportements, Chenelière, 2017
Merci pour votre occupation, je crois que c'est un document important pour faire comprendre la théorie du Behavior ( ou le comportementalisme) et son application dans l'enseignement. Toutefois, il est un peu difficile d'utiliser leur terminologie pour faire apprendre aux enseignants cambodgiens.
RépondreSupprimer