Temporalités et contenus d’évaluations en CM2 : comparaison entre évaluations ordinaires et nationales

Elisabeth Menouar

Théodile-CIREL, Lille 3, France

 

Mots clés : Ecole primaire, Disciplines, Evaluation des élèves, Pratiques enseignantes, Séances de passation, Temporalités.

 

Résumé : Cette communication porte sur le moment précis de séances d’évaluations en classe de CM2. Deux types de séances sont comparés : des séances « ordinaires » et des séances d’évaluations nationales. La méthodologie prend appui sur une modélisation de structure de séances établie à partir d’observations et d’un recueil de documents. Deux axes d’analyse sont croisés : les temporalités des évaluations, leur répartition dans l’année scolaire et la structure temporelle des séances, et les contenus évalués. Les résultats montrent des variations temporelles dont certaines peuvent être liées aux contenus évalués et/ou au type d’évaluation. Ils interrogent le rapport des enseignants aux temporalités et le vécu des élèves des situations d’évaluation.

 

Introduction

Mon intervention porte sur l’évaluation des élèves en classe de CM2 (fin d’école primaire française), et en particulier sur deux types d’évaluation : les évaluations que j’appelle « ordinaires », organisées par l’enseignant pour ses élèves et les évaluations nationales prescrites par l’institution française.

Le questionnement présenté sera centré sur les temporalités des séances d’évaluation en français et en mathématiques et leurs comparaisons au regard des contenus évalués, c’est à dire[1] au regard des savoirs, savoir-faire ou compétences qui font l’objet d’une évaluation.

Je m’appuie sur des travaux de recherche menés dans le cadre d’un master (Verfaillie-Menouar, 2012) et de la phase exploratoire de ma première année de doctorat[2].

 

1. Une recherche centrée sur le temps de classe

La particularité de cette recherche est l’intérêt que je porte à ce qui se passe en classe au moment de la passation d’une évaluation, c’est-à-dire lorsque l’enseignant gère l’épreuve face aux élèves. C’est une approche de l’évaluation scolaire qui me semble jusqu’alors avoir été peu voire pas interrogée dans un contexte d’accroissement du poids et des enjeux liés aux évaluations  notamment internationales (Harlé-Giard & Josso-Perrochaud, 2013 ; Thélot, 1994 ). Cette approche s’inscrit également dans une recherche sur le « vécu disciplinaire » des élèves (recherche financée et soutenue par la Sauvegarde du Nord[3]) nous[4] amenant à analyser les effets que produisent les fonctionnements disciplinaires sur les élèves, plus particulièrement comment les élèves vivent et ressentent l’espace évaluatif des disciplines scolaires.

Je me démarque donc, sans les négliger, des travaux sur l’évaluation qui ont largement été diffusés par les différentes disciplines de recherche et portant sur ce qui se passe en amont et en aval des séances d’évaluation c’est-à-dire le temps de préparation et de conception de l’épreuve d’un côté, ce moment où l’enseignant fait des choix de contenus disciplinaires à évaluer (Cardinet, 1988 ; Chevallard, 1986/1991) Et de l’autre les moments délicats de la correction, notation et diffusion des résultats pour lesquels les auteurs, d’abord Piéron (1963)  mais aussi Cardinet (1988), Jorro (2000/2006), Merle (2007), Perrenoud (1998/1999), (pour ne citer qu’eux) ouvrent la réflexion sur le poids et les effets de la dimension de diffusion des résultats sur la correction et la notation des élèves.

Mon objet est l’évaluation écrite formelle, celle qui est planifiée, annoncée aux élèves et destinée à fournir une note, une attestation de compétences ou une appréciation en vue d’une diffusion. Il semble que ce type d’évaluation « bilan » est majoritaire dans les classes (Abernot, 1996 ; Belair, 1999 ; Dierendonck & Burton, 2009 ) et répond à une demande sociale : fournir des résultats que ce soit aux familles ou à l’institution. Cela touche spécifiquement les séances d’évaluations « ordinaires »  organisées par l’enseignant et celles des évaluations nationales construites par l’institution.

 

2. Des observations sur le terrain et des documents prescriptifs pour construire une modélisation de séance

Mon analyse porte sur 10 séances d’évaluations nationales et 13 séances d’évaluations « ordinaires » dans 12 classes[5] d’écoles différentes. J’ai observé, enregistré et transcrit l’ensemble des séances de façon à mettre en évidence la temporalité de l’activité et des discours enseignants.

J’ai aussi recueilli différents documents se rattachant à ces évaluations : livret de l’enseignant (Ministère de l’Education Nationale [M.E.N.], 2011a) et de l’élève des évaluations nationales (M.E.N., 2011b), ainsi que les documents des évaluations ordinaires que les enseignants peuvent donner aux élèves. Ces différents documents permettent une vision des contenus évalués.

De façon à avoir un cadre relativement structurant pour les analyses, je propose  une modélisation de la séance de passation des évaluations (sur laquelle je reviendrai)  construite à partir des observations mais aussi du livret de l’enseignant des évaluations nationales qui indique le protocole de passation et les consignes à lire aux élèves.

Je montrerai comment différentes dimensions temporelles des séances d’évaluations peuvent varier en fonction du type d’évaluation mais aussi des contenus disciplinaires évalués. Je développerai en particulier la répartition des séances d’évaluation sur l’année scolaire et la structure chronologique des séances. J’aborderai quelques constats sur les durées  des séances et le rapport enseignant aux temporalités avant d’ouvrir sur d’autres perspectives de recherche.

 

3. Regroupements et répartition des contenus évalués sur l’année scolaire

En terme de temporalité, la différence la plus visible entre les deux types d’évaluation est celle de la répartition annuelle : les évaluations nationales sont programmées sur quelques jours, actuellement en fin d’année scolaire (mais cette période a historiquement varié et n’est pas encore stabilisée), alors que les évaluations ordinaires sont programmées par les enseignants tout au long de l’année scolaire. Cette temporalité semble liée aux contenus évalués (et inversement) :  les évaluations nationales portent sur un ensemble de contenus prescrits en français et en mathématiques (regroupement de contenus supposés être acquis donc enseignés en fin d’école primaire,) alors que les évaluations « ordinaires » sont rythmées par les enseignements : les enseignants évaluent leurs élèves au rythme des contenus enseignés sous forme d’un « découpage en petites unités élémentaires » telles « des gammes » pour reprendre les termes d’Astolfi (2008, p77). La programmation des évaluations ordinaires est aussi contrainte par le rythme des bulletins scolaires, eux-mêmes souvent liés au calendrier scolaire et donc à la répartition des enseignements.

Une séance d’évaluations nationales concerne plusieurs contenus disciplinaires. Il est à remarquer que les contenus de la séance ne sont pas précisés aux élèves, la discipline « français » ou « mathématiques » est parfois explicitement indiquée  par l’enseignant, mais pas toujours[6]. Ce n’est d’ailleurs pas prévu par le protocole et ce n’est visible dans le cahier de l’élève que par une organisation en deux parties disciplinairement distinctes.

A l’opposé pour une séance d’évaluation « ordinaire », les enseignants indiquent très précisément aux élèves le contenu évalué : à l’écrit sur les documents d’épreuves et/ou oralement dans leur discours (quelques exemples en français : le C.O.D. et les déterminants, le présent de l’indicatif, les grands nombres en mathématiques). En français, ce contenu précisé est majoritairement[7] rattaché au sous-domaine disciplinaire (Reuter, 2004 ; Reuter, 2007/2010), par exemple : la grammaire, la conjugaison, illustration du « découpage disciplinaire des savoirs » en « matières » d’enseignement décrit par Halté (1992).  Cependant, la désignation explicite de la discipline français est inexistante, celle de mathématiques l’est plus rarement. Ainsi, en évaluations ordinaires, le découpage disciplinaire (en contenus et sous-domaines) est visiblement marqué cependant il nécessite, me semble-t-il, une reconstruction de la part de l’élève pour le rattacher à la discipline français ou mathématiques. De même l’indication d’une évaluation par l’exercice emblématique (le contrôle de dictée, l’évaluation de problèmes) n’est pas explicitement rattachée à une discipline, comme si cela allait de soi.

Au regard du cadrage disciplinaire et des temporalités, je synthétiserais de la manière suivante : l’évaluation nationale est une évaluation annuelle d’une discipline découpée en contenus non désignés explicitement aux élèves, une évaluation ordinaire est une évaluation ponctuelle d’un ou de plusieurs contenus précisément désigné(s) issu(s) d’un sous-domaine constituant d’une discipline.

 

4. Diverses structures temporelles de séances

Pour comparer les temporalités internes aux séances d’évaluation, je reviens à ma proposition de modélisation des séances. Etablie à partir du protocole (les consignes écrites) des évaluations nationales et des pratiques enseignantes observées, cette modélisation permet de poser les choses pour interroger les variables possibles. J’ai structuré (provisoirement)[8] une séance d’évaluation en trois phases. 

La première phase marque l’installation d’une séance et la gestion des consignes. La seconde phase est celle où l’enseignant gère le maintien de la situation d’évaluation. La troisième phase est la gestion de l’achèvement de la situation. Cette structure qui peut paraître triviale n’est cependant pas si simple : elle m’a permis de mettre en évidence des variables chronologiques des phases en fonction de différentes situations d’évaluation.

Pour les séances d’évaluations ordinaires observées, les phases se suivent le plus souvent de façon chronologique de la phase 1 à la phase 3 : l’enseignant gère la séance en distribuant les consignes le plus souvent à partir d’un support écrit (phase 1), puis maintient la situation d’évaluation alors que les élèves sont face à l’épreuve (phase 2). A un moment, (phase dite 3),  il gère non seulement le maintien de la situation d’évaluation mais aussi l’accroissement progressif du groupe d’élève qui a terminé l’épreuve, le plus souvent parce qu’il propose une autre activité à ces élèves-là. Cela permet d’adapter la durée de la séance au rythme des élèves les plus lents, tout en évitant l’attente inactive des élèves les plus rapides. La dernière copie ramassée marque la fin de la phase 3 et en même temps de la séance d’évaluation.

En séance d’évaluations nationales, les choses sont différentes du fait du protocole prescriptif : l’enseignant doit enchaîner les consignes orales d’un exercice (phase 1) et le contrôle du temps prescrit pour la réponse des élèves (phase 2) avant de passer à l’exercice suivant, ce qui provoque une répétition de séquences phase 1/phase 2, tel un éclatement de ces phases en autant de « morceaux » que d’exercices. Contrairement aux séances ordinaires, l’enseignant n’adapte pas la durée de la séance au rythme des élèves, il ne leur autorise pas d’autre activité qu’attendre la fin du temps imparti, la phase 3 est quasiment inexistante. Elle est limitée à la phrase de clôture du dernier exercice et donc de la séance « C’est terminé, posez les crayons ».

Si la modélisation montre que les phases chronologiques sont éclatées lors des séances d’évaluations nationales, elle est davantage mise à l’épreuve lors d’une évaluation sous la forme d’exercices dictés : dictée orthographique, dictée de nombres ou calcul mental (qu’il est possible de considérer comme une dictée de calculs). En effet, il est difficile de distinguer la phase des consignes de la phase de maintien de la situation d’évaluation : les consignes très courtes (un calcul à faire ou quelques mots dictés), plusieurs fois répétées et suivies d’un temps, lui aussi très court, laissé aux élèves pour répondre, entraînent des phases 1 et 2 pratiquement simultanées. Il n’existe plus de frontière nette entre ces phases qui viennent à se superposer.

Pour certains contenus (écrire un texte, des mots, des nombres sous la dictée ou calculer mentalement) le mode particulier[9] d’évaluation brouille l’organisation a priori décrite comme chronologique des phases de la séance.  

La structure chronologique d’une séance d’évaluation peut donc subir des variables selon le ou les contenus évalués et la forme de l’évaluation. Ces éléments interviennent-ils aussi sur les durées des séances ?

 

5. les durées des séances et des phases

Sans vouloir établir de généralité, je souhaite montrer les tendances relevées à partir des séances observées. Je reste prudente sur les résultats avancés pour plusieurs raisons. D’abord la difficulté à définir nettement le début d’une séance d’évaluation : malgré la volonté de rigueur, les consignes d’installation de la séance ne sont pas d’emblée visibles pour l’observateur[10]. Ensuite les comparaisons présentées portent sur des moyennes, ce qui occulte les différences individuelles des séances pour lesquelles les durées peuvent être très variables.

L’ensemble des séances d’évaluation en mathématiques varie de 31 à 52 minutes, pour une séance moyenne de 39 minutes qu’elle soit ordinaire ou institutionnelle.

En français les résultats sont nettement différenciés en fonction du type d’évaluations : les 3 séances d’évaluations nationales observées varient de 58 à 67 minutes, avec une moyenne à 63 minutes, alors que les séances d’évaluations ordinaires durent toujours moins longtemps de 26 à 43 minutes avec une moyenne à 34 minutes. Autrement dit, une séance d’évaluation ordinaire est plus courte en français qu’en mathématiques contrairement aux évaluations nationales. Une séance d’évaluation nationale en français mobilise toujours plus de temps qu’en évaluation ordinaire et en moyenne presque deux fois plus.

L’étude des durées des phases montre d’importantes variables d’une séance à l’autre, les différences sont assez difficiles à expliquer du fait de résultats peu stabilisés selon le type d’évaluation ou la discipline. En effet, la tendance est à une phase 1 de consignes, en moyenne plus pesante sur la séance en mathématiques institutionnelles (19 %) qu’en français institutionnelles (10  %) et inversement pour les évaluations ordinaires : une phase 1 plus pesante en français (21 % de la séance) qu’en mathématiques (13 %). Ainsi (pour ne prendre qu’un seul exemple), les séances de français institutionnelles les plus longues ont une phase de consignes très courte, alors que cette phase est plus pesante sur les séances de mathématiques plus courtes. Il est notable que la phase 3 quasiment inexistante en séances institutionnelles est très importante en séances ordinaires : au moins 20 % du temps de la séance mais qui peut prendre jusqu’à la moitié de la séance, sans constat rattachable à une dimension disciplinaire (en l’état actuel de la recherche).

Ces résultats montrent les disparités entre le fonctionnement « ordinaire » des évaluations des élèves et le fonctionnement proposé par l’institution et questionnent l’adaptabilité des élèves aux situations.

Ces résultats m’incitent à aborder (malheureusement trop rapidement) le rapport des enseignants aux durées lors des séances d’évaluations.

En évaluations ordinaires, les enseignants adaptent le temps d’évaluation aux besoins des élèves, cela est visible par la présence de la phase 3. Il n’est pas rare d’ailleurs que la durée de la séance d’évaluation ne soit pas annoncée aux élèves.

En évaluations institutionnelles, si la durée totale de l’évaluation n’est pas non plus connue des élèves, le temps de chaque exercice leur est rigoureusement annoncé. Les enseignants observés, chronomètre en main, semblaient être attachés à respecter ce temps protocolaire. J’ai cependant relevé un écart de 2 à 8 minutes pour les séances de français, parfois signalé par l’enseignant : « C’est terminé normalement (…) finis tes mots, vas-y. Allez Maxime, dépêche-toi ! ». En mathématiques la variation est négligeable, certains enseignants arrêtent même l’exercice après s’être assuré que l’ensemble des élèves a terminé. Une seule des séances de mathématiques sur six observées a dépassé de trois minutes le temps prescrit pour l’ensemble des exercices. Il semble que la rigueur est plus de mise en mathématiques qu’en français, même si les écarts sont minimes.

Le rapport au temps des enseignants est nettement plus souple en évaluations ordinaires que lors des évaluations nationales.

 

Ce que cela ouvre comme questions et perspectives

Il est pour moi impossible de conclure tant ces premiers résultats ouvrent des pistes et questionnent.

Ils questionnent d’abord la méthodologie : la modélisation proposée gagnera à être davantage mise à l’épreuve dans d’autres disciplines, au regard de l’évaluation non seulement écrite mais aussi orale, pratique[11], de divers contenus disciplinaires, en approfondissant la réflexion sur les incertitudes liées aux limites des phases des séances et à leurs imbrications. Plus largement,  il me faudra penser davantage l’installation de cette modélisation dans un ensemble de la conception de l’évaluation à la diffusion des résultats.

Ces résultats questionnent la nature même des contenus disciplinaires et les traditions évaluatives de ces contenus : les contenus disciplinaires formatent-ils les formes d’évaluation ou inversement certaines formes d’évaluation sont-elles formatées par les contenus ?

Ces résultats questionnent la manière dont les enseignants pratiquent les évaluations et comment ils les adaptent ou non aux élèves, aux habitudes de classe.

Enfin, l’ensemble de la problématique ne peut être pensée sans la prise en compte de l’élève et de la manière dont il vit ces situations évaluatives disciplinaires variables par leur forme et leurs contenus.

 

Références bibliographiques:

 

Abernot, Yvan (1988/1996). Les méthodes d’évaluation scolaire. Paris : Dunod.

Astolfi, Jean-Pierre (2008). La saveur des savoirs. Disciplines et plaisir d’apprendre. Issy-les-Moulineaux : ESF.

Belair, Louise M. (1999). L’évaluation dans l’école, nouvelles pratiques. Paris : ESF.

Cardinet, Jean (1988). Evaluation scolaire et pratique. Bruxelles : De Boeck Université.

Chervel, André (1988). L’Histoire des disciplines scolaires : Réflexions sur un domaine de recherche. Histoire de l’éducation, n°38, Pour une histoire des disciplines scolaires (p. 59-119). Paris : INRP.http://ife.ens-lyon.fr/publications/editionelectronique/histoireeducation/INRP_RH038_3.pdf]

Chevallard, Yves (1986/1991). Vers une analyse didactique des faits d’évaluation. In De Ketele, Jean-Marie (Ed.). L’évaluation : approche descriptive ou prescriptive ? (p. 31-59). Bruxelles : De Boeck.

Delcambre, Isabelle (2007/2010a). Contenus d’enseignement et d’apprentissages. In Reuter, Yves (Ed.), Dictionnaire des concepts fondamentaux des didactiques (p. 45-51). Bruxelles : De Boeck.

Dierendonck, Christophe & Burton, Réginald (2009). L’évaluation des apprentissages scolaires au Luxembourg. Mesure et évaluation en éducation, vol.32, n° 3, L’évaluation en salle de classes : des politiques aux pratiques (p. 101-123).

Halté, Jean-François (1992). La didactique du français. Paris : PUF.

Harlé-Giard & Josso-Perrochaud (2013). Les évaluations nationales en CE1 et CM2 en France : entre enjeux institutionnels et tensions professionnelles. Spirale n° 51 p. 45-58.

Jorro, Anne (2000/2006). L’enseignant et l’évaluation. Des gestes évaluatifs en question. Bruxelles : De Boeck.

Ministère de l’éducation nationale de la jeunesse et de la vie associative, DGESCO (2011a). Evaluation nationale des acquis des élèves en CM2, cahier de l’élève.

[http://media.education.gouv.fr/file/evaluations/02/3/cahier-d-evaluation-2011-pour-les-eleves-de-CM2_167023.pdf, dernière consultation juillet 2012]

Ministère de l’éducation nationale de la jeunesse et de la vie associative, DGESCO (2011b). Evaluation nationale des acquis des élèves en CM2, livret de l’enseignant. [http://media.eduscol.education.fr/file/evaluation/93/3/Livret_enseignant_CM2_2011_dif_166933.pdf, dernière consultation juillet 2012]

Merle Pierre (2007). Les notes. Secrets de fabrication. Paris : P.U.F.

Perrenoud, Pierre (1998/1999). L’évaluation des élèves. De la fabrication de l’excellence à la régulation des apprentissages. Entre deux logiques. Paris : De Boeck.

Piéron, Henri (1963). Examens et docimologie. Paris : P.U.F.

Reuter, Yves (2004). Analyser la discipline : quelques problèmes pour la recherche en didactique. Actes du 9ème colloque de l’AIRDF : Québec.

Reuter, Yves (ed) (2007/2010). Dictionnaire des concepts fondamentaux des didactiques. Bruxelles : De Boeck.

Thélot, Claude (1994). L’évaluation du système éducatif français. Revue Française de Pédagogie, n° 107 (p. 5-28). Paris : INRP.

Verfaillie-Menouar, Elisabeth (2012). Pratiques enseignantes lors de séances d’évaluations écrites en CM2. Etude comparative en français et mathématiques. Mémoire de master 2, sous la direction de Daniel Bart et Yves Reuter, Sciences de l’Education, Université Lille 3.

 

 

 

 

 


[1] Au regard de la définition de la notion de contenus d’enseignement et d’apprentissages du dictionnaire des concepts fondamentaux des didactiques, donnée par Delcambre (2007/2010)

[2] Thèse en cours intitulée (provisoirement) : L’évaluation à la fin de l’école primaire : modélisation, pratiques de passation et vécu des acteurs, encadrée par Daniel Bart et Yves Reuter que je remercie  pour leur contribution à cette intervention.

[3] La sauvegarde du Nord est un des plus importants organismes de travail social de la Région Nord-Pas-de-Calais (France).

[4] Equipe de recherche au laboratoire Théodile-CIREL, constituée de Daniel Bart, Liliane Boulanger, Isabelle Delcambre, Cédric Fluckiger, Dominique Lahanier-Reuter, Yves Reuter (dir) et de trois doctorantes : Elisabeth Menouar, Oriana Ordonez et Jing-jing Yu.

[5] Je précise que mon propos est limité aux séances observées, qu’il faut l’entendre comme des résultats exploratoires, je ne voudrais pas donner l’illusion d’une généralisation  affirmée.

[6] Trois fois sur quatre en français, une fois sur deux en mathématiques.

[7] 6 séances sur 7, la 7ème séance portant sur la dictée

[8] Cette modélisation pourra évoluer au fil des recherches

[9] Mode d’évaluation d’ailleurs emblématique d’une discipline, telle la dictée pour l’orthographe (Chervel, 1988)

[10] En l’occurrence, moi.

[11] Je pense par exemple aux TICE, à l’E.P.S