
(Photographie ; sirukotonokosukoto)
L’émergence d’un modèle fonctionnel de la mémoire de travail pour l’enseignement
La longue évolution des modèles de l’architecture cognitive humaine n’est pas sans implication pour l’apprentissage.
Donald Broadbent (1958) a été l’un des premiers scientifiques à mobiliser la métaphore du traitement de l’information pour décrire le système de traitement attentionnel humain, qui traite les informations de manière successive.
George Miller (1957) a introduit le concept de capacité limitée de la mémoire, The Magical Number Seven, Plus or Minus Two, pour le traitement de l’information. Elle constitue un filtre sélectif agissant comme un goulot d’étranglement nécessaire pour le traitement de l’information.
Richard Atkinson et Richard Shiffrin (1968) ont proposé un modèle de mémoire à plusieurs niveaux. Celui-ci est composé d’une mémoire sensorielle où les informations provenant de tous nos sens entrent dans la mémoire. Elles peuvent passer ensuite dans une mémoire à court terme qui reçoit et retient les données de la mémoire sensorielle et active celles de la mémoire à long terme. Elles peuvent enfin arriver de la mémoire à long terme. Les informations qui ont été répétées à plusieurs reprises dans la mémoire à court terme sont stockées de façon permanente dans la mémoire à long terme.
Alan Baddeley et Graham Hitch (1974) ont proposé un nouveau modèle de mémoire qui remettait en question la vision dominante de la mémoire à court terme. Ils ont suggéré que la mémoire à court terme est composée de plusieurs éléments distincts qui fonctionnent ensemble, ce qui nous permet de conserver des informations dans notre esprit et de les manipuler. C’est ce que l’on a appelé la mémoire de travail. Dans leurs travaux initiaux, ils parlaient d’une mémoire verbale et visuelle. Des recherches plus récentes, par exemple, celles d’Alan Baddeley et Jackie Andrade (2000) ont élargi le concept de mémoire de travail pour inclure d’autres mémoires telles que les mémoires olfactive, gustative et tactile.
Alan Baddeley et Graham Hitch (1974) ont également abordé le rôle de la mémoire à long terme dans la mémoire de travail. Ils ont noté qu’elle joue un rôle crucial dans la capacité à conserver et à manipuler des informations sur de longues périodes. Ils ont suggéré que la mémoire de travail et la mémoire à long terme sont des systèmes distincts, mais interdépendants.
Nelson Cowan a redéfini les limites de la capacité de cette mémoire. Il a remis en question la conception de Miller (1956), selon laquelle la mémoire de travail pouvait contenir 7 ± 2 unités d’information. Cowan (2001, 2010) a montré que la capacité de la mémoire de travail est en réalité beaucoup plus restreinte, se situant autour de 4 ± 1 unités. Cette estimation plus stricte est aujourd’hui largement reprise dans les modèles contemporains.
Selon Cowan (1999, 2005), la mémoire de travail n’est pas un système séparé, mais correspond à un sous-ensemble de représentations temporairement activées de la mémoire à long terme, modulées par l’attention. Ainsi, la mémoire de travail est conceptualisée comme la portion activée et accessible de la mémoire à long terme, ce qui constitue un apport théorique important. Il a mis en avant l’idée que la capacité de la mémoire de travail dépend du focus attentionnel. Seul un petit nombre d’unités peut être maintenu simultanément au centre de l’attention, ce qui explique la limite des « 4 unités ».
Pierre Barrouillet et Valérie Camos ont élaboré le Time-Based Resource-Sharing model (TBRS). Ils ont remis en question les approches fondées uniquement sur un nombre fixe d’unités (Miller, 1956 ; Cowan, 2001). Barrouillet et Camos (2001, 2007, 2010, 2012) soutiennent que la capacité de la mémoire de travail est déterminée par un équilibre dynamique entre deux processus concurrents :
- Le maintien en mémoire par rafraîchissement attentionnel,
- Les traitements cognitifs (calcul, compréhension, raisonnement) qui détournent l’attention.
La capacité n’est donc pas une limite structurelle fixe, mais résulte de la disponibilité temporelle de l’attention pour maintenir les traces mnésiques avant qu’elles ne se dégradent.
Dans le TBRS, l’attention est une ressource partagée. Plus une tâche secondaire mobilise longtemps l’attention, moins il reste de temps pour rafraîchir les représentations en mémoire de travail. La capacité dépend donc du taux d’occupation attentionnelle qui est mesurable par le rapport entre le temps consacré aux traitements et le temps libre laissé pour le maintien.
Les travaux de Barrouillet et Camos (2012 ; Barrouillet, 2015) ont montré que les différences de capacité de mémoire de travail chez les enfants comme chez les adultes s’expliquent par la vitesse et l’efficacité de ces processus de rafraîchissement attentionnel. Le modèle TBRS offre une alternative aux conceptions « structurelles » de la capacité (Miller, Cowan) en l’ancrant dans une dynamique temporelle et attentionnelle.
Actuellement, nous pouvons considérer que la mémoire de travail est à la fois un espace de maintien temporaire et un outil de traitement actif de l’information.
Ces différentes recherches ont conduit à un modèle de mémoire simplifié et fonctionnellement pratique pour l’enseignement (d’après Daniel Willingham, 2021) :
La mémoire de travail face à la complexité du traitement de l’information
La mémoire de travail est essentiellement l’espace de travail cognitif dans lequel les informations sont temporairement stockées et exploitées. Elle soutient notre capacité à rester conscients de certaines informations lors de l’exécution de tâches complexes.
Elle est soumise à des contraintes et limites importantes exprimées différemment en fonction du modèle de référence considéré. Ces contraintes s’expriment en matière de complexité, de connaissances préalables, de quantité et de nouveauté de l’information stockée, d’exigence de traitement ou de temps de maintien. Les apprentissages scolaires y sont tout particulièrement confrontés.
Le principal obstacle tient au fait de devoir maintenir les informations et de s’engager alternativement dans un traitement cognitif.
Imaginons qu’on nous demande soudainement de citer des similitudes entre un smarthphone et un lave-vaisselle. La tâche est inédite.
Directement, nous allons activer dans notre mémoire à long terme toute une gamme de détails pertinents sur les smartphones et sur les lave-vaisselles. Nous explorons nos schémas cognitifs pertinents avec la tâche, de lien en lien. Nous allons maintenir notre attention sur ces éléments.
Dans un deuxième temps, mais en alternance, nous allons traiter ces caractéristiques pour déterminer si elles présentent des points communs.
Ce travail d’activation et de traitement de l’information se déroule au départ de notre mémoire de travail. La capacité de la mémoire de travail est particulièrement limitée. Elle ne peut contenir que quatre à sept éléments non connectés à un moment donné selon le modèle de la mémoire de travail considéré.
Nous ne pouvons par conséquent pas conserver beaucoup d’éléments dans notre mémoire de travail. De même, la petite quantité que nous pouvons conserver n’y reste pas très longtemps (c’est-à-dire entre 3 et 20 secondes) si rien n’est fait pour maintenir ces informations.
Nous allons naturellement trouver certaines analogies par élaboration, mais comme ce sont des informations nouvelles, nous allons sentir le besoin de les coucher sur le papier pour ne pas les oublier.
L’opération ne sera pas spécialement compliquée, car l’activation de connaissances sur le smartphone et de connaissances sur le lave-vaisselle représentera globalement deux éléments (chunks) de connaissance communs.
La même opération va devenir bien plus complexe et hypothétique si l’on nous demande d’identifier des attributs communs à un imperméable, un cahier, une cuillère à café, une guitare et un réfrigérateur. Notre mémoire de travail pourrait éventuellement retenir les noms de ces cinq objets. Cependant, les détails relatifs à chaque objet et les ressources cognitives nécessaires pour les évaluer collectivement ont toutes les chances de dépasser nos limites de traitement. Cela représenterait six chunks d’information : les cinq objets et le principe de comparaison.
Un exemple en chimie de l’impact de la mémoire à long terme sur la mémoire de travail
Considérons les deux équations suivantes. La première est vraie et la seconde est fausse :
Imaginons qu’on nous présente les deux formules pendant 30 secondes chacune. Au bout d’une minute, elles sont cachées et on nous demande de les noter.
Cette expérience a été menée avec des experts et des non-experts en chimie (Zhilin & Tkachuk, 2013).
En ce qui concerne la vraie équation chimique :
- Les experts ont immédiatement reconnu que la première équation représentait une réaction dans laquelle le cyanure de sodium (NaCN) réagit avec l’eau (H2O) et le dioxyde de carbone (CO2) pour produire du carbonate de sodium (Na2CO3) et du cyanure d’hydrogène (HCN).
- Les experts se souvenaient mieux de l’équation chimique réelle que les participants novices.
En ce qui concerne la fausse équation chimique :
- Il n’y avait pas de différence significative entre les experts et les novices en ce qui concerne la mémorisation de la fausse équation.
En ce qui concerne le mode d’apprentissage des équations :
- Les novices avaient tendance à se souvenir des vrais et des fausses équations symbole par symbole, de gauche à droite, avec des erreurs croissantes dans le même ordre.
- Les experts se souvenaient de l’équation réelle dans son ensemble et pouvaient regrouper (combiner des éléments d’information plus petits et unitaires en éléments plus grands et plus significatifs), ce qui se traduisait par une mémorisation légèrement meilleure.
Ces résultats confirment l’idée :
- Les experts peuvent regrouper des informations en fonction des connaissances qu’ils possèdent dans leur mémoire à long terme.
- Les experts sont capables d’identifier des modèles dans de nouvelles situations.
- Ils combinent ou découpent des éléments de connaissance plus petits en une seule unité de connaissance.
- Ce découpage ou ce chunking (combinaison de petites unités d’information en unités plus grandes) est fonction de nos connaissances antérieures dans notre mémoire à long terme.
La mémoire à long terme assiste la mémoire de travail pendant la réflexion :
- Elle constitue un vaste dépôt au sein de notre structure cognitive qui possède une capacité apparemment illimitée de stockage d’informations.
- Elle facilite la consolidation d’éléments discrets en ensembles cohérents (c’est-à-dire en morceaux), ce qui permet d’économiser les ressources limitées de la mémoire de travail.
La première équation chimique ne contient probablement qu’un seul élément d’information pour l’expert. Cela libère de l’espace cognitif de la mémoire de travail — un raccourci cognitif — pour prendre en compte d’autres aspects de la tâche. L’apprentissage paraît ainsi plus facile, car les informations nécessaires à la réalisation de la tâche apparaissent apparemment sans effort.
Ce que nous savons déjà n’exige pas beaucoup d’effort mental. De cette manière, les experts possèdent de vastes quantités de connaissances spécifiques à un domaine. Ces connaissances leur permettent de s’attaquer à de nouveaux problèmes dans leur domaine d’expertise. Ils le font de manière plus efficace (c’est-à-dire avec plus de rapidité et de précision) que les novices (Willingham, 2021).
Des expressions clés liées au développement de l’expertise
Le développement de l’expertise correspond à un passage progressif d’un fonctionnement novice à une maîtrise élevée caractérisée par une performance efficace, flexible et adaptative dans un domaine donné.
Les recherches montrent que l’expertise ne repose ni sur une intelligence générale abstraite ni sur des dispositions innées seules. Elle est fonction de l’acquisition graduelle de connaissances organisées, de stratégies pertinentes et de représentations mentales sophistiquées construites par la pratique délibérée et l’expérience (Ericsson et coll., 1993 ; Chi, Glaser, & Farr, 1988).
Les recherches montrent que l’expertise ne repose ni sur une intelligence générale abstraite ni sur des dispositions innées seules. Elle est fonction de l’acquisition graduelle de connaissances organisées, de stratégies pertinentes et de représentations mentales sophistiquées construites par la pratique délibérée et l’expérience (Ericsson et coll., 1993 ; Chi, Glaser, & Farr, 1988).
Plusieurs expressions clés permettent de comprendre ce processus.
L’expertise est située dans un domaine
L’expertise est fortement contextualisée. Être expert dans un domaine n’implique pas automatiquement une expertise transférable à d’autres domaines.
Par exemple, un excellent joueur d’échecs ne devient pas nécessairement performant au jeu de go ou aux dames, bien que ces activités mobilisent toutes des formes de raisonnement stratégique. De même, un chimiste expérimenté ne résoudra pas spontanément un problème de géologie ou de linguistique sans connaissances spécifiques préalables.
Cette observation remet en cause l’idée d’une compétence générale indépendante des contenus. Les performances expertes reposent surtout sur des connaissances profondes propres à un champ disciplinaire, permettant d’identifier rapidement des structures significatives et de sélectionner les procédures adaptées (Chi et coll., 1988).
Les études sur les joueurs d’échecs ont montré que leur supériorité n’est pas due à une mémoire générale exceptionnelle, mais à une mémoire spécialisée pour des configurations typiques du jeu (De Groot, 1965 ; Chase & Simon, 1973).
La compétence n’est pas générique, mais spécifique au domaine
De manière générale, toute compétence est spécifique au domaine dans lequel elle s’exprime. Les habiletés cognitives telles que la résolution de problèmes, la pensée critique ou la créativité ne s’exercent pas dans le vide : elles dépendent de connaissances disciplinaires préalables permettant d’interpréter correctement la situation rencontrée (Willingham, 2009).
Par exemple, un élève peut apparaître compétent en résolution de problèmes mathématiques, mais rencontrer des difficultés importantes face à un texte scientifique s’il ne maîtrise pas le vocabulaire ou les concepts mobilisés.
Dès lors, enseigner des compétences générales sans la présence de connaissances spécifiques au domaine limite les possibilités de transfert réel. Le développement de l’expertise suppose donc un enseignement explicite des savoirs disciplinaires, des méthodes propres à la discipline et des critères de qualité internes au domaine (Kirschner, Sweller, & Clark, 2006).
L’organisation cognitive des connaissances sous forme de schémas
Les connaissances acquises ne sont pas stockées sous forme d’éléments isolés, mais organisées en schémas au sein de la mémoire à long terme.
Un schéma peut être défini comme une structure mentale regroupant des concepts, relations, procédures et indices pertinents autour d’une idée ou d’une situation donnée (Anderson, 1983 ; Sweller, Ayres, & Kalyuga, 2011).
Chez les novices, les connaissances sont souvent fragmentées et peu connectées. Chez les experts, elles sont structurées de manière plus dense et hiérarchisée, ce qui permet :
- Une reconnaissance rapide des situations familières
- Une récupération efficace des informations pertinentes
- Une réduction de la charge cognitive en mémoire de travail
- Une meilleure anticipation des conséquences d’une action.
La théorie de la charge cognitive souligne que les schémas jouent un rôle central dans l’automatisation des traitements mentaux et dans l’efficacité de l’apprentissage (Sweller et coll., 2011).
Une structure hiérarchique et dynamique ou architecture de la connaissance
Les schémas ne sont pas de simples listes d’informations, mais des réseaux hiérarchisés et emboîtés. Un concept complexe peut contenir plusieurs sous-schémas eux-mêmes composés d’éléments plus fins. Par exemple, le concept d’arbre peut inclure racines, tronc, branches, feuilles et fruits ; chacun de ces éléments peut à son tour être détaillé en structures plus précises (Renn, 2020).
Cette organisation hiérarchique facilite la compréhension, car elle permet de naviguer entre différents niveaux d’abstraction : du général au particulier, du conceptuel au concret. Plus l’architecture cognitive est élaborée, plus l’individu peut intégrer rapidement de nouvelles informations en les rattachant à des connaissances existantes.
Les recherches sur l’apprentissage montrent que les nouvelles connaissances sont mieux retenues lorsqu’elles peuvent être reliées à des structures antérieures stables. Autrement dit, apprendre consiste souvent moins à accumuler des informations qu’à réorganiser l’architecture existante (Bransford, Brown, & Cocking, 2000).
La nature activable et dynamique des schémas
Les schémas sont activés en fonction du contexte, des buts poursuivis et des indices perçus. Une même connaissance peut être mobilisée différemment selon la situation. Ainsi, un enseignant peut activer un schéma de gestion de classe en situation de perturbation, puis un schéma didactique lors d’une explication conceptuelle.
Cette conception dynamique rejoint les travaux montrant que l’expertise repose sur la flexibilité adaptative autant que sur la possession de connaissances. Les experts ne se contentent pas d’appliquer mécaniquement des routines ; ils sélectionnent, combinent et révisent leurs schémas selon les contraintes de la tâche (Hatano & Inagaki, 1986).
Les schémas ne sont pas fixés de manière permanente. Ils prennent sens, pour nous, à partir de l’élément de connaissance que nous activons et des autres éléments que nous rappelons par lien. Les connaissances peuvent être organisées en diverses hiérarchies, formant des schémas complexes d’idées interconnectées, et servir de cintres conceptuels ou d’ancrages pour l’organisation des connaissances et l’apprentissage de nouvelles idées (Hattie, 2023).
Conclusions
Le développement de l’expertise repose donc sur une logique cumulative, structurée et située.
L’expert possède une architecture de connaissances plus dense, mieux organisée et plus facilement mobilisable dans un domaine spécifique.
Ces spécificités liées à l’expertise ont plusieurs implications pratiques concernant les buts poursuivis par une approche pédagogique :
- La construction des réseaux de connaissances riches dans un domaine précis plutôt que viser des compétences abstraites.
- Une organisation des savoirs modélisée de manière explicite, en montrant les liens entre concepts.
- Une multiplication des exemples et des contre-exemples, afin d’affiner les schémas.
- Une pratique régulière dans des contextes variés, pour rendre les schémas plus flexibles.
- Un accent sur la métacognition, afin que l’apprenant identifie quels schémas mobiliser et quand les ajuster.
Automatiser des connaissances préalables pour mieux apprendre
Le fait de posséder des connaissances et des compétences dans la mémoire à long terme libère un espace précieux dans la mémoire de travail. Ces ressources disponibles rendent possible le fait de s’attaquer à des tâches cognitives plus complexes telles que la résolution de problèmes, la réflexion critique et la compréhension de la lecture.
L’accent sur les connaissances fondamentales est particulièrement marqué dans l’enseignement primaire. Les élèves de l’école primaire doivent mémoriser les tables de multiplication, les additions et soustractions de base, apprendre la conjugaison des verbes, perfectionner leur orthographe ou enrichir leur vocabulaire. Acquérir des connaissances de base aidera à comprendre ce qui suivra. Tout est une question d’automatismes.
De manière apparemment contre-intuitive, les meilleurs moyens de devenir compétent dans une compétence ne ressembleront souvent pas à la compétence elle-même (Wiliam, 2018).
Par exemple, quelqu’un peut vouloir devenir compétent dans la pratique d’un instrument de musique comme le piano. Il se peut qu’il se rende compte que le fait de jouer du piano pendant des heures n’est pas le moyen le plus efficace de s’améliorer.
Un pianiste débutant voudra peut-être d’abord s’entraîner et automatiser certains mouvements de la main ou apprendre la théorie musicale.
En dehors de l’enseignement, cette compréhension subtile de l’importance de l’automaticité est bien comprise et est souvent considérée comme une condition préalable à la véritable maîtrise :
- Combien de jeunes joueurs de football passionnés pratiquent méticuleusement des techniques de dribble isolées pour réussir sur le terrain ?
- Combien d’acteurs ou de musiciens mémorisent leur texte ou leurs riffs pour pouvoir improviser sur scène ?
Au-delà de l’amélioration de la tâche pratiquée, cette approche présente l’avantage supplémentaire de conserver la « bande passante mentale ».
Mis à jour le 28/04/2025
Bibliographie
Surma, Tim & Vanhees, Claudio & Wils, Michiel & Nijlunsing, Jasper & Crato, Nuno & Hattie, John & Muijs, Daniel & Rata, Elizabeth & Wiliam, Dylan & Kirschner, Paul. (2025). Developing Curriculum for Deep Thinking: The Knowledge Revival. 10.1007/978-3-031-74661-1.
Atkinson, R. C., & Shiffrin, R. M. (1968). Human memory: A proposed system and its control processes. In Psychology of learning and motivation (Vol. 2, pp. 89–195). Academic press.
Baddeley, A., & Hitch, G. (1974). Working memory. In G. H. Bower (Ed.), The psychology of learning and motivation: Advances in research and theory (Vol. 8, pp. 47–89). Academic Press.
Baddeley, A. D., & Andrade, J. (2000). Working memory and the vividness of imagery. Journal of Experimental Psychology: General, 129, 126–145.
Broadbent, D. (1958). Perception and communication. Pergamon Press. https://doi.org/10.1037/10037-000
Hattie, J. (2023). Visible learning: The sequel: A synthesis of over 2,100 meta-analyses relating to achievement. Taylor & Francis.
Miller, G. A. (1957). Some effects of intermittent silence. The American Journal of Psychology, 70(2), 311–314.
Renn, J. (2020). The evolution of knowledge: Rethinking science for the Anthropocene. Princeton University Press.
Wiliam, D. (2018). Creating the schools our children need. Learning Sciences International.
Willingham, D.T. (2021). Why don’t students like school? A cognitive scientist answers questions about how the mind works and what it means for the classroom. John Wiley & Sons.
Zhilin, D. M. T., & Tkachuk, L. E. (2013). Chunking in chemistry. Eurasian Journal of Physics and Chemistry Education, 5, 39–56.
Cowan, N. (1999). An embedded-processes model of working memory. In A. Miyake & P. Shah (Eds.), Models of working memory: Mechanisms of active maintenance and executive control (pp. 62–101). Cambridge University Press.
Cowan, N. (2001). The magical number 4 in short-term memory: A reconsideration of mental storage capacity. Behavioral and Brain Sciences, 24(1), 87–185. https://doi.org/10.1017/S0140525X01003922
Cowan, N. (2005). Working memory capacity. Psychology Press.
Cowan, N., Morey, C. C., AuBuchon, A. M., Zwilling, C. E., & Gilchrist, A. L. (2010). Seven-year-olds allocate attention like adults unless working memory is overloaded. Developmental Science, 13(1), 120–133. https://doi.org/10.1111/j.1467-7687.2009.00864.x
Barrouillet, P., Bernardin, S., & Camos, V. (2004). Time constraints and resource sharing in adults’ working memory spans. Journal of Experimental Psychology: General, 133(1), 83–100. https://doi.org/10.1037/0096-3445.133.1.83
Barrouillet, P., Bernardin, S., Portrat, S., Vergauwe, E., & Camos, V. (2007). Time and cognitive load in working memory. Journal of Experimental Psychology: Learning, Memory, and Cognition, 33(3), 570–585. https://doi.org/10.1037/0278-7393.33.3.570
Barrouillet, P., & Camos, V. (2010). Working memory and executive control: A time-based resource-sharing account. Psychologia, 53(4), 236–249. https://doi.org/10.2117/psysoc.2010.236
Barrouillet, P., & Camos, V. (2012). As time goes by: Temporal constraints in working memory. Current Directions in Psychological Science, 21(6), 413–419. https://doi.org/10.1177/0963721412459513
Barrouillet, P. (2015). Working memory: Networks, development and cognitive control. Psychology Press.
Anderson, J. R. (1983). The architecture of cognition. Harvard University Press.
Bransford, J. D., Brown, A. L., & Cocking, R. R. (Eds.). (2000). How people learn: Brain, mind, experience, and school. National Academy Press.
Chase, W. G., & Simon, H. A. (1973). Perception in chess. Cognitive Psychology, 4(1), 55–81. https://doi.org/10.1016/0010-0285(73)90004-2
Chi, M. T. H., Glaser, R., & Farr, M. J. (Eds.). (1988). The nature of expertise. Lawrence Erlbaum Associates.
De Groot, A. D. (1965). Thought and choice in chess. Mouton.
Ericsson, K. A., Krampe, R. T., & Tesch-Römer, C. (1993). The role of deliberate practice in the acquisition of expert performance. Psychological Review, 100(3), 363–406. https://doi.org/10.1037/0033-295X.100.3.363
Hatano, G., & Inagaki, K. (1986). Two courses of expertise. In H. Stevenson, H. Azuma, & K. Hakuta (Eds.), Child development and education in Japan (pp. 262–272). Freeman.
Kirschner, P. A., Sweller, J., & Clark, R. E. (2006). Why minimal guidance during instruction does not work. Educational Psychologist, 41(2), 75–86. https://doi.org/10.1207/s15326985ep4102_1
Sweller, J., Ayres, P., & Kalyuga, S. (2011). Cognitive load theory. Springer.


0 comments:
Enregistrer un commentaire