Grilles d'évaluation critériées

Elaborer une grille d'évaluation critériée, permettant une évaluation équitable, valide, fiable, encadrant la subjectivité de l'évaluateur, n'est pas chose aisée.

Dans ce billet, je vais reprendre quelques éléments à considérer dans l'élaboration d'une grille d'évaluation et dénoncer quelques pièges, en particulier la question de l'attribution de points, élément quantitatif, dans une évaluation critériée, éminemment qualitative.

Commençons par le commencement, à savoir les pratiques usuelles en la matière...


La plupart des grilles d'évaluation que j'ai utilisées, élaborées, supervisées dans ma pratique pédagogique n'étaient pas des grilles critériées, ou du moins n'étaient-elles pas abouties. Elles se présentaient, le plus souvent, de la manière suivante :

  • Quelques critères d'évaluation comme "pertinence des interventions de soins"
  • Quelques indicateurs (entre deux et cinq par critère) comme "les interventions de soins proposées tiennent compte de l'analyse de la situation", "les interventions de soins proposées s'appuient sur les bonnes pratiques en la matière"...
  • Un nombre de points à attribuer : semblables ou différents selon les critères, permettant ainsi une pondération de ces derniers. Parfois un très grand nombre de points (10 par exemple) pour un seul critère.
  • Une colonne vierge pour les commentaires de l'évaluateur
  • Une échelle d'attribution des notes, par exemple : de 57 à 60 points = A (ou 6 selon l'échelle de notation adoptée), 51 - 56 = B (ou 5.5), 45 - 50 = C (ou 5), etc. L'échelle utilisée ici est le barème fédéral que l'on trouve sur le site

    https://ibaremes.ch/


Pour pouvoir parler de grilles critériées, il manque à ces dernières les niveaux de performance (ou de réalisation). 


Qu'est-ce qu'une grille d'évaluation critériée ?


Une grille critériée (ou rubric en anglais) "est une structure sous forme de tableau permettant d'identifier, pour chaque critère d'évaluation, divers niveaux de performance attendus chez les étudiants" (Stevens et Levi, 2005, cité par Berthiaume et Rege Colet, 2013, p.273). Les niveaux de performance seront au nombre de 3 le plus souvent, mais ils peuvent aussi être au nombre de 2 ou 4.


Prenons quelques exemples de niveaux de performance : 

  • Excellent, acceptable, inacceptable : pour chaque critère, on définira chaque niveau de performance - qu'est-ce qui est attendu de l'étudiant au niveau excellent ? au niveau acceptable ? au niveau inacceptable ? autrement dit, comment devrait se manifester chaque niveau de performance dans chaque critère d'évaluation ? - on parle alors de descripteur du comportement ou de la production, à chaque niveau.


On peut faire le même exercice avec d'autres niveaux de performance, comme : 


  • Maîtrise maximale, minimale, inexistante
  • Excellent, bien, suffisant, insuffisant
  • Dépasse les attentes, répond aux attentes, répond partiellement aux attentes, ne répond pas aux attentes
  • Réussite, échec


Pour évaluer, il suffit alors de situer la prestation de l'étudiant, pour chaque critère, dans le niveau de performance atteint, en fonction des descripteurs. Ceci démontre l'importance du libellé des descripteurs. Ils doivent être suffisamment précis, sans entrer dans trop de détails, univoques et mutuellement exclusifs. Plus les niveaux de performance sont nombreux, plus la difficulté de rédiger les descripteurs est grande et plus la validité et la fidélité peuvent être mises à mal, mais plus l'appréciation de la performance de l'étudiant est fine et donne à ce dernier des indications sur ses forces et faiblesses. Dans l'enseignement supérieur, la plupart des grilles critériées présentent entre deux et quatre niveaux de performance. 

Selon Berthiaume & Rege Colet (2013, pp.274 et 275), il est possible d'utiliser une variante à un seul niveau de performance, par exemple acceptable (comme les grilles fréquemment utilisées dont j'ai parlé plus haut). Ce sont les commentaires des évaluateurs qui permettront de décrire en quoi l'étudiant atteint voire dépasse le niveau acceptable ou ne l'atteint pas. Le défaut principal d'une grille à un seul niveau, c'est  une diminution de la validité et/ou la fidélité de l'évaluation.


Quelles sont les étapes pour rédiger une grille d'évaluation critériée ?


Vous l'aurez deviné, l'élaboration d'une grille critériée demande une grande rigueur et suit un certain nombre d'étapes décrites ci-après.


  1. Identification des critères d'évaluation : les critères d'évaluation découlent des compétences - ou des apprentissages critiques - visées  par l'enseignement. La définition des critères d'évaluation est fondamentale car elle "établit la cohérence entre ce qui est enseigné, ce qui est appris et ce qui est évalué" (Berthiaume & Rege Colet, 2013, p. 276). Les critères doivent être pertinents, indépendants, pondérés (pas obligatoirement) et peu nombreux. Quelques exemples, souvent utilisés dans l'enseignement supérieur : pertinence, cohérence, complétude, précision, originalité, correction (utilisation correcte de...).
  2. Etablir les niveaux de performance : définir le nombre de niveaux et leur libellé. Dans le cadre d'un programme et pour faciliter l'appropriation, par les étudiants et par les enseignants, des niveaux de performance, on choisira de garder les mêmes dans les différentes évaluations de la formation. 
  3. Rédiger les descripteurs : pour chaque critère et chaque niveau de performance, il s'agit de décrire la manifestation du niveau. S'inspirer des productions des étudiants des années précédentes est aidant pour l'élaboration des descripteurs. Cela complète la vision de l'enseignant.
  4. Tester la grille : avant d'utiliser la grille en situation réelle, il est important de la tester en la confrontant à des productions d'étudiants, par exemple celles des années précédentes, si le même travail leur a été demandé. Si l'on a pas la possibilité de tester la grille sur des copies anciennes, par exemple en cas de modalité d'évaluation nouvelle, il est possible de la tester sur des copies que l'on réévaluera après amélioration de la grille, cas échéant. Dans le cas d'un examen oral ou pratique, il n'est pas possible de réévaluer les étudiants; on choisira alors d'évaluer quelques étudiants en prenant un maximum de notes en cours d'examen pour préciser pourquoi on attribue tel niveau de performance à tel critère et on fera une pause  permettant de réajuster la grille si nécessaire après quelques passages. 


Faut-il attribuer des points à une grille critériée ? 


La question de l'attribution  de points à une évaluation critériée  n'est pas anodine. Cette pratique peut sembler inapropriée, puisqu'elle marie deux approches, qualitative et quantitative. Tout dépend toutefois de la manière d'attribuer des points. Tout d'abord, quelle est la raison qui pousse les enseignants à attribuer des points dans une évaluation critériée ? La raison est simple, c'est qu'il faut donner une note (ou une appréciation) globale à la production de l'étudiant. Difficile dès lors de faire la moyenne d'une production qui atteint trois critères au niveau excellent, un critère au niveau acceptable et un critère au niveau inacceptable. Le plus simple, pour obtenir une moyenne, est d'attribuer des points à chaque niveau de performance et d'en faire la moyenne. Dans le cas d'une grille à trois niveaux de performance, on attribuera, par exemple, un point au niveau exellent, 0.5 point au niveau acceptable et 0 point au niveau inacceptable. Si un critère est plus important que les autres, il est possible de doubler les points pour ce critère spécifique (2 points pour excellent, 1 point pour acceptable et 0 point pour inacceptable).  Ce qui est essentiel dans une évaluation critériée, c'est que l'aspect qualitatif prime. On évalue un critère et on attribue un niveau de performance à une production d'étudiants, en fonction des descripteurs. L'attribution des points n'est qu'une traduction quantitative de la décision de l'évaluateur, traduction pré-établie dans la grille. Une telle attribution de points permet de respecter la validité et la fidélité de l'évaluation, en encadrant la subjectivité de l'évaluateur. 


Cette manière de faire est très différente de l'attribution de points dans les grilles, dont j'ai parlé plus haut, dans lesquelles on attribue, par exemple, entre 0 et 10 points à un critère. Dans ces cas, c'est l'évaluateur qui définit, en fonction de la production de l'étudiant si un critère donné est atteint à 10 points ou à 9 ou à 7, ou  encore à 3 seulement. Même si la grille comporte quelques indicateurs, il est impossible pour un évaluateur, de garantir la validité et la fidélité d'une évaluation telle que celle-ci, a fortiori pour une équipe d'évaluateurs.

Pour s'en sortir, les concepteurs de ce genre de grilles attribuent un point par indicateur (un critère, cinq indicateurs, cinq points), ce qui comporte deux graves défauts :

  • Le premier est que l'on évalue les indicateurs et plus les critères que l'on perd de vue, ce qui est une erreur.
  • Le second, c'est que l'on ne tient pas compte de ce que Gérard Bief (2008) appelle les "indicateurs inédits", c'est-à-dire les indicateurs apparaissant dans une production d'étudiant auxquels l'enseignant n'a pas pensé, indices supplémentaires que le critère est maîtrisé. L'évaluation des indicateurs, définis par l'enseignant, ne laisse aucune place à l'originalité des étudiants, dans la manière de traiter un sujet, une question.


L'attribution des points nécessite donc une grille d'évaluation à plusieurs niveaux de performance dans laquelle cette attribution est préétablie.


Rappelons qu'attribuer des points dans une grille critériée n'est pas une obligation. Il est aussi possible de traduire le résultat d'un étudiant en une appréciation globale sans passer par les points.

Prenons l'exemple d'une grille critériée qui définit quatre niveaux de performance. Il est possible de définir l'appréciation globale de la manière suivante, par exemple : 


  • Tous les critères dépassent les attentes = A
  • Tous les critères répondent aux attentes de deux critères dépassent les attentes = B
  • Tous les critères répondent aux attentes et un critère dépasse les attentes = C
  • Tous les critères répondent aux attentes : D
  • Un seul critère répond partiellement aux attentes, tous les autres répondent ou dépassent les attentes = E
  • Plusieurs critères répondent partiellement aux attentes ou un seul critère ne répond pas aux attentes = F


Dans ce cas, le test de la grille est essentiel pour s'assurer que tous les cas de figure ont été prévus.


Ceci n’est qu’un exemple ; il est possible  de décider d’être plus ou moins exigeants ou de déterminer que certains critères doivent "répondre aux attentes" pour la réussite de l'épreuve (pondération).


Vous êtes prêts à élaborer une grille critériée ? Pas tout à fait ? Vous aimeriez voir quelques exemples ? Qu'à cela ne tienne, de nombreux exemples de grilles critériées sont présentés dans les ouvrages ci-dessous, en particulier chez Poumay, Tardif & Georges (2017), Berthiaume & Rege Colet (2013), Gérard Bief (2008) et Scallon (2004).


Voir également :

https://www.eduxim.com/comment-construire-une-grille-d-evaluation-criteriee/

https://sepia2.unil.ch/eet/notes-moodle/utiliser-une-grille-devaluation-criteriee-dans-moodleunil/

https://ics.utc.fr/tuto/grille_criteriee.pdf



Références


Berthiaume, D. & Rege Colet, N. (2013). La pédagogie de l’enseignement supérieur : repères théoriques et applications pratiques, tome 1. Berne : Lang. Chapitres 16 à 20.

Gérard Bief, F.M. (2008). Évaluer des compétences, guide pratique. Bruxelles : De Boeck.

Pelacia, T. (Dir.) (2016). Comment (mieux) former et évaluer les étudiants en médecine et en sciences de la santé ? Bruxelles : De Boeck Supérieur. Chapitres 18-20.

Pellegrino, J.W., Chudowsky, N. & Glaser, R. (2001). Knowing what students know: the science and design of educational assessment. Washington DC: National Academy Press.

Poumay, M. Tardif, J. & Georges, F. (2017). Organiser la formation à partir des compétences, un pari gagnant pour l’apprentissage dans le supérieur. Bruxelles : De Boeck Supérieur. Chapitre 9

Scallon, G. (2004). L’évaluation des apprentissages dans une approche par compétences. Montréal : ERPI.