Derrière tout ce que nous avons vu concernant l’évaluation des performances se cache une idée simple : il y a un lien direct entre performance et apprentissage. Si l’apprenant réussit ce qui est demandé, c’est qu’il a les connaissances pratiques et théoriques. S’il ne réussit pas, c’est qu’il ne les a pas. Cette idée de base est malheureusement fausse. Certaines fois, on ne comprend pas l’énoncé ou on est fatigué. On saurait faire, mais on ne réussit pas ce jour-là.
Inversement, on peut réussir un peu par hasard. Si votre apprenti menuisier a réussi à faire un salon de jardin, on peut penser qu’il maîtrise les compétences de menuiserie associées. Ou alors il sait construire un salon de jardin, mais ne sera jamais capable de construire quelque chose d’autre.
Voyons quels sont les biais qui rendent difficile le lien direct entre apprentissage et performance.
Biais sur une performance unique
Le contexte
Tout d’abord, qui dit évaluation de performance dit situation d’examen. L’enjeu augmente, et donc le stress du candidat aussi. Or, le stress est une réponse biologique à un danger perçu. Le cerveau reptilien, la partie ancestrale de notre cerveau, prend alors la main pour assurer la survie. Le seul problème est que ce processus empêche le néocortex, siège de la pensée raisonnée et construite, de fonctionner de façon optimale.
Plus généralement, la performance va énormément dépendre du contexte dans lequel se trouve le candidat, comme son état de fatigue, par exemple.
On est d’accord pour dire que, si votre maison brûle la veille de l’examen, votre performance sera impactée négativement. Et pourtant, l’incendie de votre maison n’a pas influé sur vos compétences, juste sur votre capacité à passer un examen. De façon un peu caricaturale, on peut dire que la seule compétence mesurée lors d’un concours, c’est la compétence “Savoir performer à un concours”.
La tâche demandée
La performance dépend de ce que l'on demande aux apprenants, mais aussi du contexte de la tâche. Illustrons cela par une expérience menée en 1991 par Huguet et Monteil.
Le groupe est constitué à moitié d’élèves ayant le statut de “bon élève”, l’autre moitié ayant le statut de “mauvais élève”. Là où cela devient intéressant, c’est lorsque l’on présente le test comme étant soit un test de géométrie (donc de mathématiques), soit de dessin.
Les résultats sont étonnants : pour le test de dessin, les deux groupes d’élèves ont la même note de performance (autour de 18/44). En revanche, pour le test de géométrie, les “mauvais élèves” performent moins bien (autour de 16/44), tandis que les “bons élèves” performent mieux (autour de 21/44).
Biais sur de multiples performances
Multiplier les tâches d’évaluation, et donc les performances, permet de neutraliser quelque peu les effets de contexte et de stress. En revanche, cela apporte d’autres problèmes.
Imaginons donc que, pour une compétence donnée, par exemple “construire un meuble”, on réalise plusieurs tâches d’évaluation de type performance. On va demander au candidat de construire une étagère, puis un salon de jardin, puis une armoire. On dira à la fin que les candidats ayant réussi les trois performances maîtrisent la compétence “construire un meuble”.
Premier problème, l’apprenant sera-t-il capable de faire une chaise, techniquement plus difficile ?
De plus, que faire des apprenants ayant réussi 2 épreuves sur les 3 ? Maîtrisent-ils ou pas la compétence ? Et les candidats non validés ? Les techniques de rattrapage font réapparaître les biais sur une performance unique, et ne sont pas forcément satisfaisantes...
Ne pourrait-on pas faire des moyennes avec les scores, alors ?
Cette pratique pose de nombreuses questions. Si je réussis toutes mes performances “à moitié”, suis-je suffisamment compétent pour être validé ? Personnellement, j’aurais du mal à faire confiance à un dentiste réussissant “la moitié de ses interventions”.
Enfin, les pratiques de moyennes induisent des pratiques de compensation nuisibles. Imaginons une moyenne pour le permis de conduire. Je sais tourner, changer de vitesse, accélérer, prendre un rond-point et faire un créneau. Bon, je ne m'arrête pas systématiquement au stop et je ne contrôle jamais mes angles morts. Cela fait que je peux avoir la moyenne. Et pourtant, tout le monde est d’accord pour dire que je ne sais pas conduire, et qu’il ne serait pas normal de m’accorder le permis de conduire.
Et pourtant, dans des logiques de moyennes, on peut trouver normal de délivrer un diplôme à un candidat de médecine ayant 14/20 en physiologie et 6/20 en pathologie.
Des solutions
Mais alors, que faire ?
La première solution consiste à connaître tous les biais et à construire une évaluation des performances la plus proche possible des situations réelles d’exercice. Nous savons maintenant qu’il y a beaucoup de biais, contre-intuitifs pour la plupart. Ce travail ne peut donc être fait par un formateur seul. Il s’agit d’un travail à mener à l’échelle d’une école, d’une entreprise, d’une université, avec l’aide notamment de personnes extérieures au système, et donc moins biaisées.
Il est donc très difficile, voire impossible, de concevoir seul une évaluation des compétences en s’appuyant uniquement sur les performances relatives à des tâches d’évaluation. Je vous propose donc, dans la troisième partie de ce cours, une stratégie d’évaluation qui limite les biais que nous venons de voir.
Alors, malgré tous ces problèmes, pourquoi l’inférence des acquis des candidats à partir de performances est-elle aussi répandue ?
Tout simplement parce que, souvent, on donne de la valeur à ce qu’on mesure au lieu de mesurer ce à quoi on donne de la valeur.
Noter une performance, en faire des moyennes, c’est facile et cela donne une impression d’objectivité. De ce fait, on se focalise sur ces notes, ces chiffres, pour prendre des décisions, en oubliant qu'ils sont biaisés et ne mesurent pas les acquis et les compétences des apprenants.
Je vous propose dans la suite de ce cours une autre approche. On va voir les choses dans l'autre sens. On va partir de ce qui a de la valeur à vos yeux de formateur, puis on réfléchira à comment l'évaluer. En faisant ainsi, les objectifs de l'évaluation et de la formation seront alignés. Et cette synergie permettra à votre formation d'être encore plus efficace !