Les films et les séries sont aujourd’hui omniprésents, et grâce aux plateformes de streaming, il est possible de les regarder partout et à tout moment. Grâce au choix de sous-titres, il est en outre possible de visionner des films en langue originale. Selon une enquête menée récemment en Suisse (Külling et al., Reference Külling, Waller, Suter, Willemse, Bernath, Skirgaila, Streule and Süss2022), 62% des adolescents de 12 à 19 ans regardent régulièrement des films, des documentaires et des séries sur les plateformes de streaming tels que Netflix et même 80% utilisent régulièrement des portails vidéo tels que YouTube. 86% des jeunes Suisses ont à disposition un abonnement à un site de films et de séries en streaming tel que Netflix et 43% possèdent leur propre abonnement. La quantité et le choix de films qu’offre internet présentent un énorme potentiel pour apprendre une LE et pourraient donc constituer une ressource intéressante pour l’enseignement des langues étrangères. Mais comment exploiter une telle ressource ? Ces dernières années, beaucoup d’études se sont intéressées à l’apprentissage de nouveaux mots par les films (p. ex. Muñoz et al., Reference Muñoz, Pujadas and Pattemore2021; Peters et Webb, Reference Peters and Webb2018; Rodgers et Webb, Reference Rodgers and Webb2020). Elles ont montré que les films facilitent l’apprentissage de nouveaux mots et que la présence de sous-titres dans la L2 (captions en anglais) est particulièrement utile (Burger, Reference Burger2019; Peters, Reference Peters2019; Reynolds et al., Reference Reynolds, Cui, Kao and Thomas2022). En effet, les films offrent une grande quantité d’input, plusieurs occurrences d’un même mot, et surtout parce qu’ils sont motivants, ils permettent de maintenir l’attention de l’apprenant (Peters, Reference Peters2022; Pujadas et Muñoz, Reference Pujadas and Muñoz2019). Malgré ces promesses, les études ont montré que le seul visionnage d’un film, en d’autres termes un input isolé, profite moins à l’apprentissage que le visionnage d’un film avec une forme d’activité, que nous appellerons ici un input+ (Hennebry et al., Reference Hennebry, Rogers, Macaro and Murphy2017; Hill et Laufer, Reference Hill and Laufer2003; Min, Reference Min2008; Pellicer-Sánchez et al., Reference Pellicer-Sánchez, Conklin and Vilkaitė-Lozdienė2021; Peters et al., Reference Peters, Hulstijn, Sercu and Lutjeharms2009; Schmitt, Reference Schmitt2008). Un input+ comprend une activité visant à favoriser l’apprentissage explicite que l’on pourrait exploiter en classe de langue. Néanmoins, l’élaboration d’activités didactiques peut être chronophage et il est donc important pour les enseignants de savoir à quel moment (avant ou après le visionnage du film) leurs activités favorisent au mieux cet apprentissage. L’objectif de l’étude présentée ici est ainsi de contribuer à la recherche sur l’exploitation des films en classe de langue étrangère en analysant l’utilité et le placement d’une activité accompagnant le film pour l’apprentissage de nouveaux mots en fonction du public ciblé. Comme souvent, la plupart des études ont été menées sur des apprenants de l’anglais. L’originalité de la présente étude réside ainsi dans le fait qu’elle cible (a) des apprenants de français L2 et plus particulièrement (b) dans le contexte de la scolarité obligatoire et (c) avec un niveau débutant de français.
CONSIDÉRATIONS THÉORIQUES
Ces dernières années, de nombreux chercheurs se sont intéressés aux séries à épisodes comme ressource pour l’enseignement des langues étrangères ou secondes (p. ex. Fievez et al., Reference Fievez, Montero Perez, Cornillie and Desmet2021; Gesa et Miralpeix, Reference Gesa and Miralpeix2023; Muñoz et al., Reference Muñoz, Pujadas and Pattemore2021; Pujadas et Muñoz, Reference Pujadas and Muñoz2019; Rodgers, Reference Rodgers2018), surtout après le potentiel d’apprentissage dévoilé par Rodgers et Webb (Reference Webb2011) qui ont montré que les épisodes consécutifs contenaient en général un plus grand nombre de répétitions de mêmes familles de mots par rapport aux vidéos indépendantes, facilitant ainsi l’apprentissage de ces mots et des mots à basse fréquence. Dans sa thèse, Rodgers (Reference Rodgers2013) a mené cinq études qui analysaient chacune un aspect différent de l’apprentissage par les séries à épisodes. Les participants de ces études étaient des étudiants d’anglais L2 au Japon. Il a trouvé, grâce à une combinaison de tests de compréhension et de tests de vocabulaire réceptifs, que les apprenants ont amélioré leur compréhension entre le visionnage du premier et du dixième épisode d’une série télévisée et que les connaissances lexicales préalables influençaient de manière positive cette compréhension. Il a également démontré que le groupe ayant eu accès à des sous-titres dans leur L2 obtenait de meilleurs résultats par rapport à celui ayant regardé les 10 épisodes sans sous-titres, ce qui corrobore les résultats de Vanderplank (Reference Vanderplank2010) et d’autres (p. ex. Kanellopoulou et al., Reference Kanellopoulou, Kermanidis and Giannakoulopoulos2019; Markham et al., Reference Markham, Peter and McCarthy2001; Pattemore et Muñoz, Reference Pattemore and Muñoz2022; Pujadas et Muñoz, Reference Pujadas and Muñoz2019; Teng, Reference Teng2022). Les résultats de leurs études suggèrent un effet positif du recours aux sous-titres dans la L1 pour les apprenants débutants afin qu’ils comprennent mieux le contenu du film, dans la L2 pour les apprenants intermédiaires et finalement aucun sous-titre pour les apprenants dont le niveau s’approche des compétences d’un locuteur de niveau avancé. En ce qui concerne l’apprentissage de nouveaux mots, Rodgers (Reference Rodgers2013) a découvert (sous forme d’exercices à choix multiples de type reconnaissance de sens) que les apprenants retenaient en moyenne six des 60 mots du visionnage de 10 épisodes télévisés (7 heures d’input), ce qui représentait un chiffre plus grand que le nombre de mots retenus par le groupe contrôle qui n’a pas vu les épisodes. D’autres chercheurs (Fievez et al., Reference Fievez, Montero Perez, Cornillie and Desmet2021; Frumuselu et al., Reference Frumuselu, De Maeyer, Donche and Colon Plana2015; Muñoz et al., Reference Muñoz, Pujadas and Pattemore2021; Peters et Webb, Reference Peters and Webb2018; Puimège et Peters, Reference Peters2019; Pujadas et Muñoz, Reference Pujadas and Muñoz2019; Rodgers, Reference Rodgers2013; Rodgers et Webb, Reference Rodgers and Webb2020; Yuksel et Tanriverdi, Reference Yuksel and Tanriverdi2009) se sont également intéressés à la question de l’apprentissage de nouveau vocabulaire par le film, et plus précisément, au nombre de mots retenus lors du visionnage d’un film en L2. Malgré la difficulté de comparer ces études, notamment à cause des différents types d’inputs et des différents facteurs, il semble, qu’en moyenne, 15–20% des mots cibles sont appris (ce qui équivaut à 1 à 12 mots par heure d’input).
Le rôle d’une activité pré-/post-visionnage
Un facteur important influençant l’apprentissage de nouveau vocabulaire par les films est la présence d’une activité explicite ciblant le lexique accompagnant le visionnage du film, en d’autres termes, d’un input+. Une activité explicite se caractérise par un processus d’apprentissage délibéré, conscient et intentionnel au contraire d’un processus d’apprentissage implicite qui se déroule de manière non consciente (Leow, Reference Leow2019). Plusieurs études avec des textes oraux et écrits (Hennebry et al., Reference Hennebry, Rogers, Macaro and Murphy2017; Hill et Laufer, Reference Hill and Laufer2003; Min, Reference Min2008; Pellicer-Sánchez et al., Reference Pellicer-Sánchez, Conklin and Vilkaitė-Lozdienė2021; Peters et al., Reference Peters, Hulstijn, Sercu and Lutjeharms2009) ont montré qu’un input combiné à une activité explicite favorisait l’apprentissage explicite. Étant donné l’unanimité concernant l’avantage d’un input+ par rapport à un input seul, il se pose la question suivante : à quel moment, avant/après le film, ces activités contribuent-elles le mieux à l’apprentissage lexical ? Comme il a été mentionné ci-dessus, l’attention joue un rôle important dans l’apprentissage de nouveaux mots. Si cette attention peut être activée pour noter (noticing) de nouveaux mots, ces derniers profitent déjà d’une probabilité augmentée d’être appris et retenus (Huang et al., Reference Huang, Eslami and Willson2012; Peters, Reference Peters2012; Schmitt, Reference Schmitt2008). Suivant cette logique, il semble donc que les activités faites avant le visionnage d’un film devraient mieux profiter à l’apprentissage de nouveaux mots grâce à cette attention portée aux phénomènes cibles (Nation, Reference Nation2001; Pellicer-Sánchez et al., Reference Pellicer-Sánchez, Conklin and Vilkaitė-Lozdienė2021). Ainsi, Pujadas et Muñoz (Reference Pujadas and Muñoz2019) ont pu démontrer dans leur étude avec 106 élèves apprenant l’anglais L2 dans une école secondaire que l’inclusion d’une activité de pré-visionnage menait à des résultats supérieurs lors du post test immédiat (de type rappel de sens) par rapport au groupe contrôle n’ayant pas fait d’activités : le groupe incluant une activité a retenu 15% des 120 mots cibles par rapport à 6% pour le groupe sans activité. L’étude de Sinyashina (Reference Sinyashina2020) quant-à-elle, a comparé deux groupes d’apprenants d’anglais de niveau B2 (selon le CECR, 2005). Tandis qu’un groupe a effectué des activités avant le visionnage des épisodes, l’autre les a faits après. Les résultats du post-test différé de deux semaines (de format reconnaissance de sens) montrent que les activités de post-visionnage étaient plus effectifs (42% des 16 mots cibles retenus par rapport à 28% dans la condition pré). D’autres études (Derin et Gökce, Reference Derin and Gökce2006; Peters et al., Reference Peters, Hulstijn, Sercu and Lutjeharms2009; Rott, Reference Rott and Chapelle2013; Yang et al., Reference Yang, Shintani, Li and Zhang2017) ont confirmé les résultats de Sinyashina (Reference Sinyashina2020) en expliquant que les activités lexicales placées après la présentation mènent à une restructuration mentale, à la consolidation et finalement à la rétention du nouveau vocabulaire grâce à des répétitions de ce dernier après sa première rencontre dans l’input. De même, l’étude de la Fuente (Reference de la Fuente2006) suggère que la focalisation sur le mot cible est plus efficace après la présentation de l’input, car à ce moment-là les apprenants ont déjà eu la chance d’inférer, voire de comprendre le sens d’un nouveau mot. Selon Schmitt (Reference Schmitt2008) ce rappel explicite présente même le moyen le plus efficace pour renforcer l’apprentissage.
Facteurs influençant l’apprentissage de nouveaux mots par les films
En plus de la présence et le moment d’une activité didactique accompagnant le film, la littérature indique de nombreux facteurs pouvant impacter l’apprentissage de nouveaux mots par les films, notamment la taille du vocabulaire de l’apprenant (Montero Perez, Reference Montero Perez2022). Cette dernière constitue un facteur critique pour inférer avec succès le sens de mots inconnus (Nation, Reference Nation2001). Mahuddin et al. (Reference Mahuddin, Siyanova-Chanturia and Boers2021), Peters et al. (Reference Peters, Heynen and Puimège2016), Peters (Reference Peters2019) et Puimège et Peters (Reference Peters2019) ont montré une corrélation entre la taille du vocabulaire préalable et la capacité d’inférer correctement le sens du nouveau vocabulaire : plus un apprenant connaît de mots, plus il sera probable qu’il apprenne du nouveau vocabulaire grâce au visionnage d’un film, et par conséquent, le nombre de mots inconnus retenus sera plus grand. Un deuxième facteur important au niveau individuel est celui de la mémoire. Une bonne capacité de mémorisation permet de mieux noter, traiter et stocker de nouveaux mots (Robinson, Reference Robinson2003). Pattemore et Muñoz (Reference Pattemore and Muñoz2020) suggèrent que pour profiter de l’input multimodal les apprenants avec une plus faible capacité de mémorisation profiteraient non seulement de sous-titres, mais aussi d’activités se focalisant sur la forme (cf. Wiley et al., Reference Yang, Shintani, Li and Zhang2014). En plus de ces facteurs individuels, la fréquence d’occurrences des mots cibles dans l’input (Schmitt, Reference Schmitt2008), la bande de fréquence, la longueur d’un mot et la classe de mots (Peters, Reference Peters2019) jouent également un rôle important. Alors que nous avons tenu compte de la plupart de ces facteurs dans notre étude, pour des raisons de place, nous renvoyons à Peters et Webb (Reference Peters2019) pour une discussion et une présentation détaillée de ceux-ci. En somme, nous pouvons retenir que la littérature suggère d’inclure une activité didactique pour renforcer l’apprentissage de nouveau mots.
QUESTIONS DE RECHERCHE
Nos questions de recherche sont les suivantes:
-
QR1: Les apprenants retiennent-ils davantage de nouveaux mots par le visionnage de trois épisodes d’une série télévisée si le visionnage est accompagné d’une activité didactique ?
-
QR2: Quel placement de l’activité didactique, avant/après l’épisode, aide-t-il le mieux les apprenants à retenir de nouveaux mots ?
-
QR3: Les résultats des deux premières questions (QR1 et QR2) varient-ils selon le niveau d’exigences scolaires des apprenants (prégymnasial vs. exigences de base) ?
-
QR4: Les résultats des deux premières questions (QR1 et QR2) varient-ils selon le moment de post-test de vocabulaire (immédiat vs. différé) ?
MÉTHODOLOGIE
Participants et contexte
Cette étude est basée sur 97 élèves âgés de 13–14 ans apprenant le français L2 dans une école obligatoire du secondaire 1 de Suisse alémanique. Dans cette région de Suisse, l’allemand est la langue de scolarisation et le français est la première langue étrangère enseignée à l’école. Les cours de français sont donc obligatoires. Au moment de la récolte de nos données, les participants à cette étude ont eu environ 411 heures d’instruction de cours de français L2 distribuées sur 5.5 ans. Le système scolaire dans la région concernée prévoit trois niveaux d’exigences scolaires pour l’école secondaire. Les élèves les plus faibles suivent le niveau d’exigences de base (dorénavant EBA), les élèves moyens le niveau général (G). Le niveau le plus exigeant est le prégymnasial (PG). Vu que les niveaux d’exigences G et PG donnent accès ultérieurement à des études supérieures, ils ont été regroupés sous le terme de GPG. Quatre classes GPG (deux classes G et deux classes PG) et deux classes EBA ont participé à l’étude. Le niveau de langue attendu se situe entre A1.2 et B1 pour les GPG et entre A1 et A2.1 pour les EBA selon le CECR (2005). Les classes ont été recrutées à l’aide de collègues enseignants. Il ne s’agit donc pas de classes dans lesquelles nous enseignons. Les apprenants et leurs parents ont été informés que le but de l’étude portait sur l’apprentissage du français avec des films, et que des exercices et des questionnaires anonymisés seraient ensuite analysés. Sur un total de 102 élèves, 97 ont eu le consentement de leurs parents pour participer à la présente étude. Le tableau 1 montre le nombre de participants par niveau de classe. On constate que le nombre d’élèves GPG est nettement plus élevé que celui de niveau EBA.
Note: niveau EBA = exigences de base, G = générale, PG = prégymnasiale
Procédure et outils de collecte des données
Pour tester l’effet de la présence/de l’absence et du moment d’une activité de pré-/post-visionnage, un design within-subject a été choisi. Ainsi, tous les apprenants ont participé à chacune des trois conditions. Ils ont regardé trois épisodes d’une série télévisée française (Plan Cœur, Netflix 2018) avec des sous-titres en français. Il s’agit de la première et la deuxième partie de l’épisode 2 (2.1 et 2.2) et la première partie de l’épisode 3 (3.1). Pour des raisons pratiques, les six classes ont été laissées intactes. Dans la première condition, l’épisode de 13–15 minutes était accompagné d’une activité avant le visionnage. Dans la deuxième condition, les apprenants ont fait une activité après le visionnage de l’épisode. Dans la troisième condition, finalement, l’épisode a été visionné seul, sans activité avant ou après. Les trois épisodes étaient tirés de la même série, mais ils étaient différents pour chaque condition. Afin de minimiser l’effet de l’épisode, nous avons choisi d’attribuer deux conditions différentes pour un seul épisode, c’est-à-dire que trois classes ont regardé l’épisode dans une condition (groupe 1) et trois classes ont regardé le même épisode dans une autre condition (groupe 2). Ainsi, chaque épisode (2.1, 2.2, 3.1) nous a permis de comparer deux conditions (avant vs. aucune ; avant vs. après, après vs. aucune ; voir tableau 2). La répartition des six classes dans les deux groupes s’est faite en incluant à chaque fois deux classes de niveau GPG et une classe de niveau EBA ainsi qu’en tenant compte des résultats de la mesure de niveau global du vocabulaire (Lextale, voir ci-dessous).
Le tableau 2 montre le déroulement de l’intervention dans les deux groupes (2x3 classes). L’intervention a eu lieu pendant cinq leçons de français langue étrangère, reparties sur cinq semaines. Lors de la première leçon, toutes les classes ont fait un test mesurant le niveau global de vocabulaire (Lextale, voir Annexe A) et ont également regardé le premier épisode afin de se familiariser avec la série. Ainsi, les apprenants ont pu faire la connaissance des personnages principaux et se faire une idée de leurs relations avant le début des trois épisodes de test, comme le proposent Rodgers et Webb (Reference Webb2011) et Kucher (Reference Kucher2020). Les trois semaines suivantes, les classes ont regardé les épisodes 2.1, 2.2 et 3.1. Après chaque épisode, les élèves ont participé à un post-test immédiat qui a eu lieu lors de la même leçon. Pour réduire l’effet de test et de mémoire (l’activité d’après ressemblant beaucoup au post-test immédiat), chaque classe a discuté du contenu de l’épisode avant de procéder au post-test immédiat (File et Adams, Reference File and Adams2010; Min, Reference Min2008; Muñoz et al, Reference Muñoz, Pujadas and Pattemore2021; Rodgers et Webb, Reference Webb2011; Schmitt, Reference Schmitt2010; voir tableau 2). Finalement, un post-test différé a eu lieu une semaine après le visionnage et les activités de l’épisode 3.1, ce qui correspond à deux et trois semaines après le visionnage et les activités des épisodes 2.2 et 2.1 respectivement (Feng et Webb, Reference Feng and Webb2020; Schmitt, Reference Schmitt2010).
Episodes
Selon l’étude réalisée par Noreillie et al. (Reference Noreillie, Kestemont, Heylen, Desmet and Peters2018), la connaissance des 1000–2000 mots (lemmes) les plus fréquents est nécessaire pour assurer la compréhension d’un texte à l’oral. Ils affirment qu’environ 90% des mots utilisés dans les épisodes doivent être connus afin d’en assurer la compréhension. Une analyse préalable des trois épisodes de la série « Plan Cœur » (Netflix, 2018) a relevé que 80–82% du vocabulaire présent dans les trois épisodes choisis appartiennent à la tranche des 1000 mots les plus fréquents en français selon l’outil Vocabprofile (https://www.lextutor.ca/vp/comp/, Cobb, s.a.). Ce chiffre est similaire dans des études comparables (Puimège et Peters, Reference Peters2019). En tenant compte du niveau de français des apprenants et le nombre d’heures de français suivies, on peut estimer la taille moyenne du vocabulaire à 1110–1600 mots en se basant sur les chiffres de Lindqvist (Reference Lindqvist2016) et Milton et Meara (Reference Milton and Meara1998). Par conséquent, nous avons supposé que les apprenants devraient être capables de comprendre les épisodes.
Choix des mots cibles
Dans le but de réduire la probabilité que les mots cibles soient connus des participants, nous avons soumis une liste de 125 mots (100 mots tirés des trois épisodes, et 25 pseudo-mots) à un groupe de 20 élèves issus de la même école et ayant eu une année supplémentaire de cours de français L2. Le test, qui se faisait sur tablette, demandait aux apprenants d’écouter et de lire le mot, puis indiquer s’ils connaissaient ce mot ou non. La sélection de 100 mots des 1764 mots (types) des trois épisodes s’est faite en tenant compte de l’estimation du savoir lexical préalable de la première auteure, de la bande de fréquence des mots (en principe les 4000 mots les plus fréquents, K1-K4) et de la fréquence (élevée) d’occurrences dans l’épisode (Pujadas et Muñoz ; Yang et al., Reference Yang, Shintani, Li and Zhang2017). En plus, une variation au niveau de la classe de mots et de la longueur des mots a été visée (Puimège et Peters, Reference Peters2019). Les cognats ont été exclus (Muñoz et al., Reference Muñoz, Pujadas and Pattemore2021). Des 100 mots testés auprès de ce groupe d’élèves, les 17 mots les moins connus de chaque épisode, c’est-à-dire les mots qui ont été connus par max. 50% des élèves (en moyenne par 25% des élèves) ont été choisis pour obtenir un total de 51 mots cibles (cf. Annexe B). Parmi ces mots cibles, on trouve pour chaque épisode 6–8 noms, 3–4 adjectifs, 8–9 verbes et 5–7 adverbes/prépositions/conjonctions. Le tableau 3 présente les 51 mots cibles choisis pour chaque épisode et l’Annexe C les phrases des films dans lesquels ils apparaissent. On voit que nous n’avons pas seulement essayé d’inclure des mots qui varient au niveau de la classe de mots, mais également au niveau du nombre d’occurrence, de syllabes et de la fréquence de corpus dans l’épisode testé.
Note: occurrence dans cet épisode, classe de mots (adjectif, adverbe, conjonction, nom, verbe à l’infinitif/au présent au participe passé), K (bande de fréquence par tranche de 1000 mots, K1 = fait partie des 1000 mots les plus fréquents selon le corpus Vocabprofile, Cobb, s.a.)
Activités
Les 51 mots cibles ont été présentés dans les activités didactiques avant ou après l’épisode. Suivant l’exemple de Pujadas et Muñoz (Reference Pujadas and Muñoz2019), l’activité d’avant/après consistait en un exercice de connaissance de sens fait individuellement sur tablette. Il durait entre cinq et dix minutes. Chaque apprenant devait associer le mot cible présenté simultanément à l’écrit et à l’oral avec la bonne traduction en allemand (voir figure 1). Pour chaque mot cible, cinq options de réponses étaient proposées (Pellicer-Sánchez et al., Reference Pellicer-Sánchez, Conklin and Vilkaitė-Lozdienė2021; Peters, Reference Peters2012). Les quatre autres mots étaient des distracteurs, des mots en allemand de la même classe de mots et d’une bande de fréquence comparable au mot cible (voir Annexe D). En plus, les distracteurs avaient une relation syntaxique ou sémantique avec le mot cible (Nation, Reference Nation2013). L’ordre d’apparition des mots cibles ainsi que l’ordre des cinq réponses était aléatoire. À noter qu’un contexte minimal, c’est-à-dire une phrase de l’épisode contenant le mot cible, a été inclus pour faciliter la possibilité d’inférer le sens du mot inconnu comme le proposent Nation (Reference Nation2013) et Schmitt (Reference Schmitt2010; voir Annexe C). Selon Schmitt (Reference Schmitt2010), l’inclusion d’un tel contexte s’avère utile pour reconnaître la signification d’un mot dans un énoncé oral, comme c’est principalement le cas pour les films. La figure 1 montre un exemple de mot cible en gras, la phrase tirée de l’épisode ainsi que la bonne réponse et les quatre distracteurs.
Tests
Mesure du niveau global du vocabulaire (Lextale)
Dans le but d’inclure une mesure du niveau global de vocabulaire des apprenants, nous avons choisi d’utiliser la version française de Lextale (Brysbaert, Reference Brysbaert2013, voir Annexe A). Il s’agit d’un test composé de 84 mots, dont un tiers de pseudo-mots. Les apprenants doivent indiquer s’ils connaissent le mot ou non. Pour que les conditions de visionnage de l’épisode (input écrit avec les sous-titres en français, input oral, image) et de ce test se rapprochent, nous avons suivi la proposition de Jelani et Boers (Reference Jelani and Boers2018) d’intégrer la prononciation des mots dans notre version du test. Le test a été présenté sous format électronique. Les réponses des apprenants ont été envoyés aux chercheurs par courriel automatique et sécurisé après achèvement du test. Les scores du Lextale se trouvent dans l’Annexe E. Ce test a également servi à repartir les six classes de sorte à former deux groupes avec un score similaire. Ainsi le groupe 1 (classes a-c-e, 48 élèves) a obtenu 200 points (4.3 en moyenne et 3.5 en médiane d’un maximum de 56 points possibles selon le Ghent score, calcul fait à partir des résultats de 46 élèves). Le groupe 2 (classes b-d-f, 49 élèves) a obtenu 266 points (5.5 en moyenne, 3 en médiane, sur un total de 48 élèves).
Post-tests immédiats
Les trois post-tests immédiats ont eu lieu à la fin de chacun des trois interventions en classe. Ils ont été effectués sur tablette et les réponses ont été envoyés aux chercheurs par courriel automatique et sécurisé. Ils avaient comme but d’évaluer si les apprenants ont acquis des savoirs par rapport aux mots cibles grâce à l’exposition à l’épisode et l’éventuelle activité explicite. Ils contenaient chacun les 17 mots cibles de l’épisode. Comme le montre la figure 2, le mot cible apparaissait en premier, suivi de la consigne et des cinq propositions de réponses (une réponse correcte et quatre distracteurs). Comme c’était le cas pour les activités (figure 1), les apprenants entendaient également la prononciation du mot cible. L’ordre des mots cibles du post-test était aléatoire. Les distracteurs du post-test étaient les mêmes que dans l’activité, mais ils apparaissaient également dans un ordre aléatoire. La figure 2 montre une capture d’écran du post-test immédiat de l’épisode 2.1. Contrairement à l’activité, la phrase de l’épisode n’apparait plus et l’apprenant n’a donc plus la possibilité d’inférer le sens du mot cible grâce à celle-ci.
Post-test différé
Le post-test différé servait à tester la totalité des mots cibles une semaine après le visionnage du dernier épisode. Il était identique aux post-tests immédiats sauf pour le nombre de mots. Alors que les post-tests immédiats contenaient 17 mots cibles de l’épisode correspondant, le post-test différé testait les 51 mots cibles dans un ordre aléatoire à travers tous les épisodes.
RÉSULTATS
Nos questions de recherche concernent la comparaison des trois conditions décrites ci-dessus, c’est à-dire le rôle que joue une activité pré-/post-visionnage dans l’apprentissage de nouveaux mots par le visionnage de trois épisodes d’une série télévisée. Pour répondre à nos questions, nous allons d’abord présenter les résultats descriptifs. En ce qui concerne la QR1, l’analyse de la probabilité d’inférer un nouveau mot correctement (voir tableau 4) montre que l’inclusion d’une activité avant ou après le visionnage de l’épisode augmente significativement la probabilité de répondre correctement aux post-tests immédiats et au post-test différé (cf. tableau 6 avec les deux effets significatifs pour l’activité de pré- et post-visionnage, cf. figure 3). En effet, pour les élèves n’ayant pas eu d’activité, la proportion moyenne de mots corrects dans le post-test immédiat était de 39% (ce qui se traduit à 6 à 7 mots retenus d’un total de 17 mots cibles) alors qu’il était de 48% pour les conditions incluant une activité (ce qui correspond à un peu plus de 8 mots). Pour le post-test différé, le nombre de mots corrects était encore une fois en moyenne de 39% (aucune activité), 42% (activité d’avant, un peu plus de 7 mots) et 41% (activité d’après, environ 7 mots).
Ces résultats signalent une absence de supériorité du placement de l’activité (avant/après le visionnage, QR2). Les chiffres présentés dans le tableau 4 répondent également à notre QR4 en indiquant que l’inclusion d’une activité mène à des résultats supérieurs lors du post-test immédiat. Le tableau 5 montre que le niveau d’exigences (track ; GPG ou EBA, QR3) influence significativement le fait de se souvenir d’un nouveau mot ou non, avec une proportion moyenne de mots corrects de 51% pour les GPG (8 à 9 mots d’un total de 17 mots cibles) et 35% pour les EBA (environ 6 mots). Au post-test différé, les écarts entre les deux tracks sont toujours visibles, avec 45% de mots corrects en moyenne pour les GPG (7 à 8 mots) et 34% de mots pour les EBA (5 à 6 mots).
Modélisation statistique
Afin de déterminer si nos données permettent véritablement d’affirmer un lien entre l’activité didactique et la mémorisation des mots, nous procédons à une modélisation statistique de nos données. Les détails de celle-ci ainsi que les scripts sont disponibles sur le site de l’OSF (https://osf.io/xyj5b/?view_only=9f0ac170f84949d1a23cb684a88598af).
Au vu de la nature de nos données, nous utilisons des modèles linéaires mixtes qui permettent de tenir compte du fait que nos participants ont répondu à de multiples items au niveau des tests de vocabulaire. Notre modèle tient également compte du fait que les participants forment un échantillon par grappes (au niveau des classes) – bien que le nombre de classes (6) soit à la limite inférieure du nombre de ‘clusters’ nécessaires (Gelman et Hill, Reference Gelman and Hill2006: 247).
Chaque réponse aux post-tests immédiats et différés est traitée comme point de données. Nous modélisons l’impact du niveau d’exigences (donnant accès au gymnase/GPG vs. exigences de base/EBA) ainsi que l’impact de la condition (aucune activité, activité pré- ou post-visionnage) et du moment du test (post-test immédiat vs. post-test différé). Nous ajoutons également une interaction entre le niveau, la condition et le moment du test, puisqu’il est possible que l’effet de la condition se montre de manière différenciée lors du premier ou du deuxième test.
Nous avons utilisé le programme lme4 (Bates et al., Reference Bates, Mächler, Bolker and Walker2015) pour la modélisation. Au niveau des effets aléatoires, nous avons suivi les recommandations de Barr et al. (Reference Barr, Levy, Scheepers and Tily2013) d’ajouter, dans un premier temps, un maximum de paramètres, donc non seulement les intersections (intercepts) aléatoires par participant, classe et item, mais également des pentes aléatoires pour l’effet fixe de la condition (partout ou seulement pour une partie des effets aléatoires). Comme c’est souvent le cas, ces modèles ne convergeaient pas ou n’amélioraient pas la qualité du ‘fit’, ce qui nous a permis de simplifier la structure des effets aléatoires. Par ailleurs, la comparaison de différentes variantes du modèle (cf. l’annexe osf.io) montre qu’une interaction entre test et condition mène à un meilleur modèle. Un modèle avec une double interaction test x track x condition semble encore légèrement meilleur, mais le programme émet un avertissement au niveau de la convergence. En tenant compte de cet avertissement, du fait qu’une interaction entre trois prédicteurs est très difficile à interpréter, ainsi que de l’amélioration très faible au niveau de la valeur AIC pour ce modèle à double interaction, nous avons sélectionné le modèle suivant:
Il s’agit d’un modèle binomial mixte qui comprend des intersections aléatoires pour chaque élève, chaque item et chaque classe. Les intersections aléatoires par élève tiennent compte de la variabilité inter-individuelle et du fait que chaque élève a été testé de multiples fois. Les intersections aléatoires par item tiennent compte de la difficulté variable des différents mots testés, et les intersections aléatoires par classe tiennent compte du fait que l’échantillon est structuré en grappes (=classes).
Les paramètres fixes estimés par ces modèles sont indiqués dans le tableau 6. Il s’agit d’un modèle linéaire logistique, donc les valeurs estimées dans le tableau 6 représentent les ratios des chances (odds ratios) d’une réponse correcte. L’intersection (intercept) représente le track GPG dans la condition sans aucune activité. Nous considérons un effet comme étant significatif à partir d’un niveau de la valeur p < 0.05. La partie des effets aléatoires (variance résiduelle totale σ2, variance expliquée par les facteurs aléatoires τ) se trouve dans le tableau 7.
Nous retenons surtout un effet considérable de la présence ou de l’absence d’une activité. Sans activité (intercept), les chances (odds ratio) qu’un item soit correctement traduit par un élève moyen du track ‘GPG’ lors du post-test immédiat sont de 0.87 (ce qui correspond à une probabilité de 47%). Le niveau à exigences de base (EBA) réduit les chances de réponse correcte, la probabilité de traduction correcte dans ce track est de 27%. Les deux niveaux d’exigences produisent donc une différence (attendue) au niveau des réponses correctes, bien visible dans les deux panels de la figure 3. Notre modèle tient compte de cette différence pour l’estimation de tous les autres effets.
L’impact des autres paramètres est mieux lisible dans la figure 4 (qui montre les probabilités conditionnelles à la place des log odds) : le test différé produit globalement moins de réponses correctes, ce qui est surtout dû aux deux conditions activité pré et activité post. Dans la condition sans activité les deux tests ne présentent pas de différence (ce qui explique l’absence d’effet jugé significatif au tableau 7). Par contre, il y a une interaction entre test et condition, encore une fois bien visible dans la figure 4: il y a plus de réponses correctes – tant qu’il y avait activité – au post-test immédiat comparé au post-test différé. Dans les deux moments de test il y a un effet positif des deux activités (cf. tableau 6 avec les deux effets significatifs pour l’activité pré- et post-visionnage, cf. figure 3). La différence entre ces deux activités est négligeable.
En résumé, la présence d’une activité didactique comme décrite ci-dessus mène en moyenne à plus de mots correctement traduits qu’un visionnage seul (QR1). La différence entre activité pré- ou post-visionnage est minimale (QR2). Le niveau d’exigences inférieur (EBA) est associé à des résultats plus faibles dans l’ensemble (QR3). Comme attendu, le nombre de réponses correctes diminue au post-test différé, mais l’effet des deux activités reste bien visible en comparaison avec la condition sans activité (QR4, QR1).
DISCUSSION
La présence et le moment d’une activité
Selon l’analyse des résultats, un input+ est supérieur à un input isolé, c’est-à-dire que l’inclusion d’une activité de pré- ou post-visionnage soutient l’apprentissage de nouveaux mots (QR1), notamment grâce à des expositions supplémentaires dans les activités et leurs effets d’attention élevée, de répétition et de consolidation (Schmitt, Reference Schmitt2008). Elle confirme donc les résultats rapportés des études d’input+ avec les films (p.ex. Gesa et Miralpeix, Reference Gesa and Miralpeix2023; Pujadas et Muñoz, Reference Pujadas and Muñoz2019). Nos observations ont montré que les apprenants ont en moyenne retenus un peu plus de 8 mots sur les 17 mots cibles testés par épisode de 13–15 minutes avec activité, comparé à 6 à 7 mots sans activité (accompagnant l’épisode), ce qui représente 48% (avec activité) respectivement 39% des mots cibles (sans activité). Ces chiffres se trouvent clairement au-dessus des chiffres rapportés par les études de film portant sur l’apprentissage implicite de nouveaux mots qui elles se situaient à 15–20% des mots cibles retenus (Fievez et al., Reference Fievez, Montero Perez, Cornillie and Desmet2021; Frumuselu et al., Reference Frumuselu, De Maeyer, Donche and Colon Plana2015; Peters et Webb, Reference Peters and Webb2018; Puimège et Peters, Reference Peters2019; Rodgers, Reference Rodgers2013; Rodgers et Webb, Reference Rodgers and Webb2020; Yuksel et Tanriverdi, Reference Yuksel and Tanriverdi2009 ). Il faut cependant rappeler que les post-tests administrés par Pujadas et Muñoz (Reference Pujadas and Muñoz2019) étaient de type rappel de sens et testaient des mots cibles qui avaient été appris pendant une période de deux mois ; le risque d’avoir oublié les mots était donc plus élevé. En ce qui concerne les gains de vocabulaire absolus, les 8 mots retenus par épisode de 13–15 minutes dans la présente étude représentent également un résultat plutôt bon, en comparaison des 1 à 12 mots retenus dans les études mentionnées. Sachant que les études antérieures portant sur l’apprentissage de nouveaux mots par des films sont construites de manière différente, les comparaisons restent difficiles. Elles varient par exemple au niveau des types d’apprenants et de leur niveau de langue, de durée de l’input audiovisuel, du nombre et des types de mots cibles, du format de test, de la similitude ou de la différence entre condition d’apprentissage et format de test, du temps mis à disposition pour effectuer les différentes activités/test etc. Il est en outre possible que le ratio entre le nombre de mots cibles et la durée des épisodes, l’inclusion de la version sonore des mots cibles dans les post-tests ainsi que le court délai entre l’intervention et le post-test différé aient contribués à de meilleurs résultats dans la présente étude. Il semble d’autant plus important que de futures études adressent la question de l’impact de l’exposition supplémentaire et plus explicite par les activités de pré- et post-visionnage.
En ce qui concerne le moment idéal pour placer l’activité (QR 2), l’analyse statistique a montré que les différences entre les résultats incluant une activité de pré-visionnage et ceux incluant une activité de post-visionnage sont minimes (cf. tableaux 4 et 6), même s’il semble que la condition d’avant est légèrement supérieure à celle d’après selon les résultats du post-test différé (cf. figure 3, tableau 4). Ce résultat confirme ceux de Pujadas et Muñoz (Reference Pujadas and Muñoz2019). Il semble que certains élèves profitent de la focalisation d’attention avant le visionnage du film, car elle permet un premier contact avec les mots cibles. Un tel contact peut déjà engendrer une première association entre forme et sens, qui peut ensuite être renforcée et élaborée au moment du visionnage du film, de l’input (Nation, Reference Nation2001; Pellicer-Sánchez et al., Reference Pellicer-Sánchez, Conklin and Vilkaitė-Lozdienė2021; Pujadas et Muñoz, Reference Pujadas and Muñoz2019). D’autres élèves profitent mieux de la focalisation explicite et de la répétition des mots cibles après les avoir rencontrés dans l’input (Schmitt, Reference Schmitt2008; Sinyashina, Reference Sinyashina2020). Cette répétition semble consolider les connaissances lexicales acquises lors du visionnage de l’épisode.
Par rapport au niveau d’exigences (QR3), notre analyse a confirmé que les apprenants GPG (de niveau scolaire supérieur) se souviennent en général de plus de mots cibles que les apprenants EBA (de niveau scolaire inférieur), quelle que soit la condition. La taille du vocabulaire pourrait contribuer à l’explication des différences puisque les apprenants avec une taille de vocabulaire plus importante ont généralement plus de facilité à inférer le sens de nouveaux mots (Montero Perez, Reference Montero Perez2022; Nation, Reference Nation2001). Le niveau de langue des apprenants pourrait, de manière générale, jouer un facteur central, comme l’a montré l’étude de Pujadas et Muñoz (Reference Pujadas and Muñoz2019). Dans leur étude, les apprenants de niveau A1 (selon le CECR, 2005) se sont souvenus de moins de mots par rapport aux apprenants de niveau A2/B2. Il se peut également qu’un certain niveau de compréhension soit nécessaire pour pouvoir bénéficier d’un enseignement basé sur un input authentique, comme le proposent Pattemore et Muñoz (Reference Pattemore and Muñoz2020).
Pour répondre à la QR4, l’analyse des résultats a montré que les apprenants se sont souvenus de plus de nouveaux mots lors des post-tests immédiats, ce qui est attendu, le facteur temporel contribuant à l’oubli de savoirs nouvellement acquis (Robinson, Reference Robinson2003). Cela étant, le fait que des mots cibles ont été appris même sans activité explicite portant sur le vocabulaire corrobore les résultats de Feng et Webb (Reference Feng and Webb2020) et d’autres chercheurs (p. ex. Peters et Webb, Reference Peters and Webb2018; Puimège et Peters, Reference Peters2019; Rodgers, Reference Rodgers2013) qui ont montré qu’un apprentissage implicite de nouveaux mots lors du visionnage de films en version originale est possible, même s’il faut rester prudent avec cette conclusion, vu l’absence de pré-test de vocabulaire.
En somme, les résultats corroborent la supériorité d’un input+ et nous pouvons par conséquent conseiller l’inclusion d’une activité pré- ou post-visionnage pour favoriser l’apprentissage de nouveaux mots. Nos résultats ne nous permettent cependant pas de définir le moment idéal pour le placement de l’activité.
Limitations et futures pistes de recherche
Certains aspects de la méthode viennent limiter la portée de l’interprétation de nos résultats. Premièrement, il est évident qu’un échantillon plus grand d’apprenants aurait contribué à une puissance statistique plus grande. Deuxièmement, le design choisi ne nous permet pas de savoir si le gain de vocabulaire est dû à l’activité ou à l’épisode, ou si certains des mots cibles étaient peut-être déjà connus avant l’intervention. Un troisième défi majeur concerne la répétition des mêmes items lors des post-tests immédiats et le post-test différé, ce qui a éventuellement résulté en un effet de test (Schmitt, Reference Schmitt2010).
Ainsi, de futures études pourraient inclure des mots cibles supplémentaires apparaissant soit dans l’épisode, soit dans l’activité, et il faudrait envisager d’espacer encore davantage le post-test immédiat et le post-test différé pour réduire l’effet de test. En plus, il serait intéressant d’analyser avec un échantillon plus grand et de manière détaillée quel rôle joue le moment pour les différents types d’apprenants. En outre, l’inclusion de différents types d’activités permettrait de savoir lequel se prête le mieux pour les différents apprenants et moments. Finalement, une comparaison de l’apprentissage de nouveaux mots par différents médias pourrait proposer des pistes intéressantes pour les enseignants en LE.
CONCLUSION ET IMPLICATIONS DIDACTIQUES
Notre étude visait à analyser l’effet d’une activité didactique pré-/post-visionnage sur l’apprentissage de nouveaux mots auprès d’apprenants adolescents ainsi que de vérifier le rôle du moment où celle-ci est placée (avant/après l’épisode). Nos résultats permettent de montrer une supériorité d’un input+. En d’autres termes, les épisodes accompagnés d’activités (input+) profitent plus à l’apprentissage de nouveaux mots par rapport aux épisodes seuls (Pujadas et Muñoz, Reference Pujadas and Muñoz2019). Les résultats concernant le moment restent à vérifier.
Cette étude souligne donc l’importance d’une activité stimulante qui favorise le développement des compétences linguistiques auprès de jeunes apprenants. Nos résultats suggèrent que les activités explicites se focalisant sur des mots cibles les aident à se souvenir de ces mots, non seulement à la fin de la leçon durant laquelle ces mots ont été présentés et durant laquelle l’activité pré- ou post-visionnage a eu lieu, mais également une voire plusieurs semaines après. Il semble donc que la répétition d’un nouveau mot dans l’épisode et l’activité renforcent cet apprentissage auprès de tous les apprenants, aussi bien de niveau scolaire inférieur que supérieur. Nos résultats ont également relevé que le moment de l’activité n’est pas décisif, ce qui signifie que la préparation d’une activité par l’enseignant durant le visionnage avec la classe pourrait être suffisant. Compte tenu de l’offre attractive de films et séries authentiques adaptés aux apprenants adolescents ainsi que la disponibilité de sous-titres et transcriptions, nous encourageons les enseignants à intégrer des films ou séries dans les cours de LE. Notre étude a montré que l’intégration d’une activité pré- ou post-visionnage est bénéfique à l’apprentissage du vocabulaire, quel que soit le moment. L’investissement des enseignants pour créer ces activités en vaut la peine.
Remerciements
Nous remercions les trois évaluateurs anonymes pour leurs commentaires constructifs sur des versions antérieures de cet article. Nous remercions également les adolescents et les enseignants pour leur participation à cette étude.
Conflits d’intérêt
Néant.
Lea Suter a obtenu un master en didactique des langues étrangères de l’Université de Fribourg (Suisse). Elle enseigne la didactique de l’anglais au centre d’enseignement et de recherche pour la formation à l’enseignement au secondaire (CERF) à Fribourg et est enseignante au secondaire 1 à Lucerne. Elle s’est intéressée, dans son étude de master, à l’effet d’une activité pré-/post-visionnage sur l’apprentissage de nouveaux mots par une série télévisée.
Raphael Berthele est linguiste de formation et travaille en tant que professeur en plurilinguisme à l’Université de Fribourg. Il a étudié et travaillé aux Universités de Fribourg, Tübingen, Berkeley et Berne. Actuellement, il dirige les programmes de MA en sciences du plurilinguisme et en didactique des langues étrangères. Ses intérêts de recherche couvrent différents domaines allant des aspects cognitifs aux aspects sociaux du plurilinguisme. Ces dernières années, il s’est concentré sur l’étude empirique du plurilinguisme réceptif, sur l’acquisition de compétences en plurilittératie, sur la référence spatiale en contexte de minorisation et de contact de langues, et sur l’aptitude à l’apprentissage des langues vivantes.
Anita Thomas est professeure en français langue étrangère au département de plurilinguisme et didactique des langues étrangères à l’université de Fribourg (Suisse). Ses recherches touchent à l’acquisition des L2 (SLA) et à la didactique du FLE. Elle s’intéresse en particulier aux caractéristiques linguistiques du français en tant qu’input en L2 et à l’utilisation de matériel authentique en classe de langue. Elle enseigne aux niveaux bachelor et master, notamment dans la formation des enseignant·e·s du secondaire 1.