La théorie cognitive de l’apprentissage multimédia de Richard E. Mayer décrit comment notre cerveau traite le multimédia.
La notion de multimédia dans la théorie cognitive de l’apprentissage multimédia
Toute présentation multimédia comporte à la fois des mots et des images :
- Typiquement en classe, un élève écoute et regarde.
- Lorsqu’un élève utilise de manière autonome un support écrit, celui-ci contient régulièrement des images et du texte en lien. De plus, les contenus écrits sont généralement structurés visuellement.
Elle propose divers principes mis en évidence par des recherches pour optimiser les supports pédagogiques de manière à promouvoir l’apprentissage.
Dans l'ensemble, elle nous amène à prendre en compte à la fois les canaux verbaux et visuels pour la perception par les sens, le traitement par la mémoire de travail et l’intégration des nouvelles connaissances aux connaissances préalables dans la mémoire à long terme.
Hypothèses de base de la théorie cognitive de l’apprentissage multimédia
Selon Mayer (2021), quand nous présentons de nouvelles informations à nos élèves dans une perspective d’apprentissage, nous devons prendre en compte des trois hypothèses de base suivantes :
- La théorie du double codage suppose que nous apprenons par deux canaux qui communiquent l’un avec l’autre durant le traitement de l’information en mémoire de travail :
- Un canal auditif/verbal
- Un canal visuel/non-verbal
- La capacité de traitement de chaque canal est limitée :
- Nous ne conservons dans la mémoire de travail qu’une fraction de ce qui nous parvient par ces deux canaux sensoriels.
- Utiliser ces deux canaux permet un meilleur usage des capacités limitées de la mémoire de travail
- Un individu se fonde sur ses expériences antérieures (ses connaissances préalables activées en mémoire à long terme) pour sélectionner de nouvelles informations, les interpréter et les traiter.
Mayer a développé une dizaine de principes dans le cadre de sa théorie cognitive de l’apprentissage multimédia :
Le principe multimédia
Les individus apprennent mieux lorsque nous combinons les médias plutôt que de présenter un seul média. Le fait d’associer des images pertinentes à un texte ou à des explications orales rend le contenu plus propice à l’apprentissage.
Cependant, il faut s’assurer d’en faire une utilisation judicieuse de ce principe multimédia. Il en existe diverses limites et optimisations exposées par divers autres principes détaillés plus bas.
En utilisant les principes détaillés ci-dessous, les présentations peuvent être conçues afin de présenter et organiser les connaissances en vue d’en faciliter leur sélection, leur traitement et leur intégration dans la mémoire à long terme.
Réduire les processus externes à l’apprentissage
Le principe de cohérence
Les élèves apprennent mieux lorsque les supports pédagogiques utilisés se concentrent sur des connaissances précises et excluent toutes les informations non essentielles et non pertinentes pour l’apprentissage.
Il est important d’éviter de mettre plus d’animations et d’effets sonores et visuels qu’il n’en faut. Les textes, images et sons superflus ou non contextuels sont à éviter. Nous nous assurons de disposer uniquement des composants requis pour susciter et maintenir l’attention afin de favoriser le développement de ses connaissances.
Le principe de signalement
Les élèves apprennent plus profondément lorsque leur attention est dirigée sur le contenu essentiel au moyen d’éléments visuels, voire sonores. Le processus de traitement de l’information est soutenu par des indices qui mettent en évidence l’organisation du matériel essentiel.
L’attention est attirée sur les éléments essentiels des ressources pédagogiques, en les mettant en évidence (gras, italique, souligné ou en couleur)
Nous pouvons améliorer une liste d’éléments ou les étapes d’un processus en le présentant sous forme de listes numérotées, structurées ou hiérarchisées.
Il peut s’agir également de la présentation textuelle de mots-clés, de l’utilisation de flèches ou du zoom sur des éléments clés ou de la reconstitution pas-à-pas d’un diagramme.
Le principe de redondance
Des informations redondantes conduisent à une surcharge cognitive en augmentant la charge extrinsèque.
Il est préférable d’associer une image à une explication orale, plutôt qu’une image à du texte et à des explications orales qui se répètent.
Par exemple sur une vidéo, des sous-titres dans la même langue que l’audio distraient. Elles ne sont à utiliser que pour aider les allochtones.
Relire un texte visible à l’écran est inutile. Seuls des mots-clés bénéficient à être présentés à l’écrit tandis qu’ils sont expliqués oralement.
Le principe de contiguïté spatiale et de la contiguïté temporelle
La distance entre le texte et l’image qui s’y rapporte doit rester minimale. Le texte gagne à être intégré à l’image plutôt que d’être placé à côté de l’image.
Dans la même logique, les explications orales, le visuel et l’écrit doivent être synchronisés.
Gérer les processus essentiels
Le principe de segmentation
Il faut éviter de surcharger la présentation et veiller à équilibrer la quantité de contenu à diffuser par chacun des médias utilisés.
Les élèves apprennent mieux lorsque la présentation est divisée en plusieurs séquences de courte durée. Segmenter le contenu pédagogique en étapes le rend plus facile à assimiler et permet de respecter les limites de la mémoire de travail.
Le principe de préentrainement
Il est utile de vérifier les connaissances préalables des élèves avant que le cours réel ne commence. Les individus apprennent mieux les nouveaux contenus lorsque les concepts essentiels à la compréhension sont activés et compris précédemment.
De même, il s’agit d’introduire explicitement les concepts clés en début de leçon afin que ceux-ci servent de fondements à l’acquisition de nouvelles connaissances.
Le principe de modalité
Les élèves apprennent mieux lorsqu’une narration est utilisée au lieu de l’écrit pour expliquer une animation ou un schéma, réduisant la charge cognitive du canal visuel.
Le contenu textuel gagne à être oralisé et il ne reste plus à l’écrit sur l’image que les mots-clés.
Conditions favorisant l’apprentissage
Le principe de personnalisation
L’enseignant privilégie un style conversationnel dans la narration, c’est-à-dire des constructions de phrase non impersonnelles (avec le je, tu, nous ou vous) sous forme active et non passive.
Nous pouvons personnaliser le texte à lire en nous adressant directement à l’élève.
Le principe est de décrire un processus qui a lieu dans chaque tête, donc aussi dans celle de l’élève. Parler de « nos sens » et de « notre cerveau » est moins distant que de dire « les sens » et « le cerveau ».
Le principe de différenciation individuelle
Ce principe stipule que les élèves ayant beaucoup de connaissances, ou une prise de conscience spatiale bien développée parviennent à compenser les lacunes multimédias des supports pédagogiques numériques.
Les effets design profitent donc plus fortement aux apprenants ayant peu de connaissances préalables qu’à ceux en ayant beaucoup, mais aussi plus fortement aux apprenants ayant une moins bonne conscience spatiale.
Le principe de la voix
Nous apprenons mieux à partir d’une voix humaine et sympathique que d’une voix d’ordinateur.
Quatre principes nouveaux apparaissent dans la dernière version de l’ouvrage (Mayer, 2021) :
- Principe de l’image : les gens n’apprennent pas nécessairement mieux d’une leçon multimédia lorsque l’image de l’orateur est ajoutée à l’écran.
- Principe d’incarnation : les gens apprennent plus profondément des présentations multimédias lorsqu’un instructeur à l’écran affiche une forte incarnation plutôt qu’une faible incarnation.
- Principe d’immersion : les gens n’apprennent pas nécessairement mieux dans une réalité virtuelle immersive en 3D qu’avec une présentation de bureau correspondante en 2 D.
- Principe d’activité générative : les gens apprennent mieux lorsqu’ils sont guidés dans la réalisation d’activités d’apprentissage génératives pendant l’apprentissage.
Aspects statiques ou dynamiques
Il est important de distinguer le traitement cognitif requis dans le cas d’un dispositif statique et d’un dispositif dynamique.
Devant une présentation statique, l’individu doit s’engager dans un traitement actif alors que devant une présentation animée, celle-ci exerce la simulation mentale du mouvement à la place de l’individu (Fayol, 2002).
Cela explique qu’un individu ayant une certaine expertise du thème abordé peut s’engager dans un traitement actif. Il possède des connaissances du mouvement à anticiper et il peut élaborer une représentation dynamique à partir de ce qui lui est présenté dans un format statique. Face à un tel format, l’apprenant novice n’ayant pas les connaissances préalables aura de la difficulté à s’engager dans le traitement cognitif actif que requiert une présentation statique. C’est pourquoi le soutien d’un format dynamique lui conviendra davantage (M. Bétrancourt et B. Tversky, 2000).
Puisque les apprenants novices sont difficilement capables de se faire une représentation mentale d’un concept ou d’un processus, les combinaisons animation/texte ou animation/narration lui permettent de pallier cette problématique.
En milieu scolaire, il serait possible par exemple d’utiliser cette stratégie pour expliquer la structure et le fonctionnement d’une cellule (Park et col, 2011) par une représentation animée de cette dernière.
Aspects synchrone ou asynchrone
Dans le cas d’un accès synchrone, un élève assiste un cours, regarde une vidéo ou une animation sans possibilités d’interaction, de pause, de retour en arrière ou de demande d’explication.
Dans le cadre d’un accès asynchrone, l’élève peut poser des questions, mettre la vidéo ou l’animation en pause ou visionner à nouveau des contenus qu’il n’aurait pas compris.
L’accès synchrone peut avoir un effet négatif sur l’apprentissage, car il pourrait occasionner une dissociation de l’attention chez l’élève en perturbant ou en détournant sa concentration des aspects essentiels de la présentation. Il est également susceptible de provoquer une surcharge cognitive.
Dès lors, il faut éviter de surcharger la présentation et de veiller à équilibrer la quantité de contenu à diffuser par chacun des médias utilisés. Même s’il a été démontré qu’un individu apprend plus facilement grâce à la combinaison de plusieurs médias, il faut s’assurer d’en faire une utilisation judicieuse.
Cette distinction entre mode synchrone et asynchrone permet de comprendre pourquoi des animations ne présentent pas systématiquement un avantage par rapport à des médias statiques (images, textes). De plus, certaines recherches (Ayres et Paas, 2007) ont aussi démontré que les schémas et diagrammes statiques pouvaient être plus performants que leurs équivalents animés.
La principale raison qui a été évoquée pour expliquer cette différence de performance est la surcharge cognitive créée dans la mémoire de travail par la présence d’une quantité importante d’informations (de Koning, Tabbers, Rikers et Paas, 2009). La surcharge cognitive expliquerait le plus souvent l’échec de l’utilisation d’une présentation animée comme microstratégie. Le flux continu d’information ne permet pas à l’apprenant de garder en mémoire l’information et de la structurer de manière à créer un modèle mental.
Ces difficultés peuvent être contournées par l’utilisation d’un mode asynchrone. De cette manière, nous donnons la possibilité à l’élève d’avoir un certain contrôle de la présentation, qu’il puisse faire un arrêt sur image, répéter une explication, poser une question ou reprendre du début. L’élève est alors en mesure d’utiliser le matériel à son rythme et selon ses besoins. Il peut ainsi bien emmagasiner et structurer l’information et ainsi acquérir les connaissances visées (Mayer et Chandler, 2001).
L’efficacité des présentations animées varie selon la manière dont elles sont utilisées. La prise en compte des principes de segmentation, de signalement, de modalité, de redondance et de cohérence facilite l’apprentissage.
Modèle de l’apprentissage multimédia
La théorie cognitive de l’apprentissage multimédia soutient l’idée que les apprentissages significatifs se produisent chez l’élève lorsqu’il se construit une représentation cohérente de la connaissance ciblée.
Présentation animée
L’expert peut créer ses propres images mentales à partir d’un texte. Ce n’est pas le cas d’un apprenant possédant peu de connaissances sur le sujet, nécessitant un support visuel pour être en mesure d’imager le concept.
L’apprentissage sera d’autant plus efficace que lors de l’enseignement, les principes identifiés par Mayer sont utilisés, dont la structuration des connaissances.
Un élève a plus de facilité à transférer des fragments de structures hiérarchiques bien assimilées que des éléments de connaissance isolés.
La présentation multimédia permet à l’individu de faire des liens entre les concepts et les procédures et davantage encore lorsque les connaissances sont présentées dans un contexte significatif pour la personne.
Mémoire sensorielle et sélection
Notre mémoire sensorielle absorbe ces mots et ces images à travers nos yeux et nos oreilles.
La mémoire sensorielle retient tous les mots et images entrants pendant une très courte période.
Nous utilisons à la fois le canal verbal (communication orale ou texte) et le canal visuel (animation ou image) pour les informations issues de la mémoire sensorielle.
Mémoire de travail et incorporation
Grâce à nos yeux et à nos oreilles, les mots et les images parviennent à notre mémoire de travail. C’est là que nous pouvons retenir ces informations pendant une courte période.
Pour permettre à ces processus de fonctionner sans heurt, il est essentiel d’éviter toute surcharge cognitive. La surcharge cognitive se produit lorsque les processus cognitifs dont nous avons besoin pour traiter les informations essentielles, ainsi que les processus cognitifs dont nous avons besoin pour traiter les informations non pertinentes, dépassent notre capacité cognitive.
Un message multimédia doit proposer correctement les informations qu’il contient aux canaux de traitement visuel et auditif.
Notre mémoire de travail sélectionne des sons et des images spécifiques. Parfois, notre cerveau convertit également les sons en images et vice-versa.
Lorsque nous entendons le mot « chat », par exemple, nous sommes également capables de générer l’image d’un chat dans notre esprit.
Dans notre mémoire de travail, nous incorporons les sons que nous avons sélectionnés dans un modèle verbal mental, et les images dans un modèle visuel mental.
Mémoire à long terme et intégration
La mémoire de travail sélectionne et traite des images et des mots pour ensuite les organiser en vue de les intégrer dans la mémoire à long terme
Le fait d’avoir une représentation visuelle et sonore du même élément dans la mémoire de travail permet de l’intégrer plus facilement dans la mémoire à long terme.
Dans la phase suivante, le message multimédia est transféré dans notre mémoire à long terme.
Ce n’est qu’alors que nous appelons ces connaissances nouvellement acquises.
Le processus de transfert des informations vers notre mémoire à long terme intervient lorsque nous avons intégré les modèles verbaux et visuels.
Et que nous les mettons ensuite en relation avec les connaissances antérieures activées dans notre mémoire à long terme.
Mise à jour le 01/07/2024
Bibliographie
de Koning, Björn & Tabbers, Huib & Rikers, Remy & Paas, Fred. (2009). Towards a Framework for Attention Cueing in Instructional Animations: Guidelines for Research and Design. Educational Psychology Review. 21. 113–140. 10.1007/s10648-009-9098-7.
Mayer, Richard & Chandler, Paul. (2001). When Learning Is Just a Click Away: Does Simple User Interaction Foster Deeper Understanding of Multimedia Messages? Faculty of Education—Papers. 93. 10.1037//0022–0663.93.2.390.
Fayol, M. (2002). Les documents techniques : Bilan et perspectives. Psychologie française. 47, 9-18.
Bétrancourt, M., & Tversky, B. (2000). Effect of computer animation on users’ performance: A review. Le Travail Humain : A Bilingual and Multi-Disciplinary Journal in Human Factors, 63(4), 311–329.
Park, Babette & Moreno, Roxana & Seufert, Tina & Brünken, Roland. (2011). Does cognitive load moderate the seductive details effect? A multimedia study. Computers in Human Behavior. 27. 5–10. 10.1016/j.chb.2010.05.006.
Ayres, Paul & Paas, Fred. (2007). Making instructional animations more effective: A cognitive load approach. Applied Cognitive Psychology. 21. 695 - 700. 10.1002/acp.1343.
https://wiki.teluq.ca/wikitedia/index.php/Pr%C3%A9sentation_anim%C3%A9e
http://www.digitaledidactiek.be/modules/2-ontwerp/theorie/mayer/
Mayer, R. E. (2021) Multimedia Learning (3rd Edition), Cambridge University Press.
Merci pour cette belle synthèse des travaux de Mayer !
RépondreSupprimer