L’évaluation : tremplin ou boulet? Proposition de principes évaluationnels
Le 16 décembre 2023, je publiais sur ce même blogue un billet titré Anxiété évaluative et excellence : jeter le bébé avec l'eau du bain (drôle : avant de m'en rendre compte, j'avais choisi pour le présent billet la même image que pour l'autre; j'en ai finalement choisi une avec une apprenante plus jeune, pour des raisons qu'on comprendra bientôt). La thèse que j'y présentais : derrière trop de critiques de l'anxiété causée par l'évaluation, il semble y avoir une critique de l'idée d'excellence, pourtant nécessaire à toute pédagogie. Je finissais sur ces phrases : «Ne donnons pas l'exemple d'une école qui se débarrasse de tout critère d'excellence, mais enseignons aux apprenants à développer leurs propres critères d'excellence, en parallèle. [...] Ça me semble le meilleur moyen de garder à l'école sa capacité à créer une tension vers le haut. Si nous enlevons à l'école cet ultime pouvoir, que restera-t-il d'elle, sinon un lieu où on se rassemble pour jouer?» Ce deuxième billet sur l'évaluation peut être vu comme la suite du premier. La thèse de celui-ci : cette tension vers l'excellence est un beau risque, mais un risque quand même. Or, on n'enseigne pas la manière de diminuer le risque et d'en rentabiliser la beauté. Et on peut le faire. Faisons-le donc.
Mais d'abord, une petite introduction autobiographique comme je les aime tant. Une version passée de moi, en 4e ou 5e année du primaire, a plutôt mal pris le fait de m'être mal classé dans un petit jeu de français. Pas même une évaluation sanctionnelle dont la note se retrouverait au bulletin, non. Mais les deux éléments centraux de l'évaluation – (1) l'exposition au jugement d'autrui et (2) la comparaison interpersonnelle – restaient présents. Et dans ce cas-là, le jugement et la comparaison n'étaient clairement pas à mon avantage. Je me rappelle avoir pleuré (pas de grosses et chaudes larmes, là, mais juste assez pour tenir à les cacher derrière le couvercle levé de mon pupitre... sans grand succès, de mémoire). C'est dire à quel point, pour reprendre mes mots du billet de blogue précédent, je n'avais pas développé mes propres critères d'autoestime, et à quel point je laissais l'école me définir d'un bout à l'autre. Et, pour présenter les mots que j'utiliserai dans la suite de ce billet-ci, je me servais clairement de l'évaluation comme d'un boulet, voire d'un fouet contre moi-même, plutôt que comme du tremplin qu'elle peut être.
L'erreur qu'on commet avec l'évaluation, c'est de s'imaginer que parce qu'elle est réalisée dans un contexte scolaire, elle est nécessairement réalisée de manière pédagogiquement optimale. Rien n'est moins vrai. Beaucoup de choses se passent à l'école de façon très pédagogiquement sous-optimale. La question de la gestion de l'évaluation en est une de compétences socioaffectives. Or, l'enseignement socioaffectif n'est souvent pas la discipline dans laquelle les enseignants s'illustrent le plus. (On ne peut leur en vouloir qu'à moitié. Ils n'ont souvent qu'une formation psychologique minimale pour s'y livrer. Heureusement, les jeunes esprits avec lesquels ils travaillent n'ont pas la complexité qu'auront des esprits adultes... mais ils sont quand même plus complexes et diversifiés que ce que permet d'appréhender l'actuelle formation initiale à l'enseignement. Vivement plus de formation continue par des psychologues, donc.)
Déjà, c'est exceptionnel que les enseignants comprennent bien l'évaluation et en voient la pertinence en termes de guidage de l'enseignement (évaluation formative) et de reconnaissance des acquis (évaluation sommative). L'évaluation est un phénomène complexe qui se mérite même une science en soi (la docimologie), donc ne la maitrise pas qui veut... et encore, très peu le veulent. Or, enseigner aux apprenants à utiliser l'évaluation pour diriger non seulement leur apprentissage, mais leur formation identitaire en général, c'est une prochaine étape qui demanderait encore plus de compétences. Aussi bien dire qu'aucun enseignant (à ma connaissance du moins) ne se rend aussi loin dans son travail.
Ce qui mène à ce que l'évaluation soit mal utilisée, c'est-à-dire comme boulet et comme fouet plutôt que comme tremplin. Qu'on s'étonne, après, de la forte augmentation de l'anxiété évaluative. S'étonnerait-on de la même manière du nombre de blessures que s'infligeraient un groupe de jeunes qu'on laisserait jouer avec des couteaux – même si on leur répétait avec insistance de faire bien attention? L'espoir de la prudence est de l'idéalisme creux si on ne met pas en place des mesures préventives appropriées.
Ce que je considère la faiblesse fatale de notre actuelle gestion de l'anxiété évaluative vient du fait que nous documentons le nombre de blessures en les attribuant à l'évaluation en soi. Logiquement, à partir de là, la seule recommandation qu'on peut faire, c'est d'éviter de trop évaluer. Ce faisant, on se prive de la panoplie d'avantages potentiels d'une évaluation bien faite. Ça me semble être une erreur fondamentale d'attribution : pour filer l'illustration, c'est comme dire que les blessures viennent des couteaux plutôt que du maniement que nous en faisons. Il semblera évident à n'importe qui que le moyen de moins se blesser en maniant des couteaux n'est pas d'arrêter d'en utiliser, mais d'apprendre à mieux les manier.
La différence avec l'évaluation, c'est probablement que les bénéfices de son usage sont plus abstraits. On conçoit aisément les difficultés qu'on aurait à cuisiner et à manger si on devait arrêter d'utiliser des couteaux. Or, notre vie ne nous semblerait pas amputée dans la même mesure si on s'imaginait être moins évalué. Le premier des principes évaluationnels que je proposerai dans ce billet de blogue doit donc faire la démonstration de l'utilité de l'évaluation. Bien attendu, je ne m'attends pas à ce que la liste de ces principes soit exhaustive. Je tiens surtout à ce qu'ils suscitent chez le lectorat le début d'une réflexion à propos de l'évaluation et de ce que nous pouvons faire, collectivement, pour mieux nous en servir.
1. Évaluer est inévitable; on ne peut que le faire plus ou moins bien.
Si on faisait disparaitre les couteaux de la surface de la Terre pour réduire le nombre de blessures, il faudrait quand même couper des aliments pour cuisiner et manger. On le ferait avec des fourchettes, des cuillères, nos dents, etc. Autrement dit, on le ferait, mais pas très efficacement. L'existence du couteau est sans doute contingente (non nécessaire), mais elle répond à un besoin. On ne ferait pas disparaitre le besoin en faisant disparaitre le moyen le plus efficace d'y répondre. Pour qu'on n'ait plus besoin de couteaux, il faudrait que nos mains soient coupantes, ou que nos dents le soient plus (et qu'on ne se soucie pas de l'esthétique moindre de découper son steak avec ses dents dans un restaurant chic...).
L'évaluation, telle qu'on la conçoit scolairement parlant (appelons-la «le test») est l'équivalent pour le besoin d'évaluer – au sens propre : de déterminer la valeur de quelque chose. Dans notre système scolaire divisé par niveaux, le test permet d'établir la proportion des savoirs enseignés à un certain niveau qui ont été retenus par les apprenants, pour établir leur aptitude à en acquérir de nouveaux qui en dépendent. Le test permet aussi d'établir la proportion des savoirs enseignés dans un certain programme d'étude pour donner à d'éventuels employeurs le signal de la capacité suffisante d'un travailleur à réaliser un certain nombre de tâches mobilisant de tels savoirs. On pourrait déterminer et établir tout ça sans test, c'est-à-dire sans ensemble de questions données liées à des disciplines données auxquelles on a répondu à des moments donnés... mais ce serait bien moins efficace. Pourquoi s'en priver, donc?
De même pour le besoin d'évaluation d'autrui pour mieux s'évaluer soi-même. On ne détermine sa propre compétence qu'en la comparant avec celle d'autrui. Comment savoir si j'apprends trop lentement ou assez vite sans me comparer à la norme? On pourrait aussi souhaiter que chacun puisse apprendre à son propre rythme. C'est bien, j'en serais; mais notre système éducatif ne fonctionne pas selon ce principe, n'ayant pas les moyens de personnaliser la pédagogie pour l'adapter à la vitesse de chaque apprenant. Si nous avions un tel système éducatif, la comparaison serait-elle superflue? Non, parce que l'identité personnelle s'établirait tout de même dans la comparaison. C'est en trouvant ce qui me différencie des autres que je trouve ce qui me rend individuel – ce que j'ai à apporter de spécifique à l'humanité. Pour déterminer que j'aurais avantage à développer tel ensemble de compétences, je dois établir dans la comparaison avec autrui que je me démarque par la manière unique dont j'intègre, voire je synergise ces compétences.
De même, pour déterminer l'ensemble de mes faiblesses sur lesquelles je pourrai travailler pour m'améliorer, je dois déterminer ce qui constitue une faiblesse par rapport à la compétence générale des représentants de l'espèce Homo sapiens dans la réalisation de telle ou telle tâche. Sans comparaison avec les autres, impossible pour moi de déterminer quelle masse moyenne un humain soulève par défaut et pour pouvoir vouloir, par conséquence, me muscler pour en soulever plus. De même pour la vitesse de course ou la hauteur de saut à la perche, pour ne prendre que quelques exemples sportifs. Or, plus l'évaluation est faite de manière critériée et quantitative, plus son résultat me sera directement utile. L'évaluation, au fond, ce n'est que le raffinement de la tendance humaine à abstraire son expérience sensible en normes. Si même nous étions seul sur Terre, cette tendance se ferait sans doute par la comparaison intrapersonnelle – entre différents moment de sa propre vie, ou entre différentes sphères d'activités de sa propre vie. Si je n'avais pas accès aux résultats des tests de ma classe en français, je parlerais aux gens et j'abstrairais de ces discussions une moyenne et un écart-type de qualité langagière pour pouvoir me comparer. Le tout, cependant, me prendrait beaucoup plus de temps et d'effort que si j'avais accès aux résultats de leurs tests évaluant cette même qualité langagière, ainsi qu'à la moyenne et à l'écart-type de ces résultats. De même pour ma propre compétence langagière quand je suis énergique et quand je suis fatigué, ou pour comparer ma compétence mathématique et ma compétence langagière – pour savoir où orienter mon étude.
2. Évaluer permet de s'établir des objectifs d'amélioration et de faire le suivi de sa progression.
On valorise généralement le fait, pour un être humain, de chercher à s'améliorer, qu'on appelle cette tendance «formation», «mise en forme», «autodépassement», «actualisation», etc. Les volontés d'amélioration les plus visibles, à notre époque, s'accomplissement dans la sphère physique. Il peut s'agir de la perte de poids, du gain de muscles, de la diminution de son temps de course, etc. Peu de gens considèrent comme intrinsèquement condamnable la volonté sportive d'aller plus vite, plus haut, plus fort. Ceux qui le font sont obligés d'ancrer leur condamnation dans l'idée que vouloir perdre du poids, par exemple, ne serait que la conséquence d'une honte corporelle induite par des critères esthétiques nécessairement déterminés par la société plutôt qu'autodéterminés. De la même manière, on semble pathologiser plus rapidement une volonté d'amélioration continue de la qualité de soi-même sur les plans cognitifs, affectifs ou sociaux. Dans ces domaines, il faudrait apparemment s'accepter tel qu'on est.
Or, pourquoi l'athlétisme physique serait louable, et l'athlétisme cognitif, affectif ou social le serait moins? Tous ces types d'athlétisme sont absolument superflus et non nécessaires à la survie humaine; pour ceux qui tiennent à cette distinction, il s'agit donc plutôt de «désirs» que de «besoins». Ils sont tous également susceptibles d'être déterminés par la société ou par soi-même, indépendamment de leur nature. Ils peuvent tous nuire au bonheur dans une certaine mesure, puisqu'ils impliquent une certaine dévalorisation de sa vie actuelle au regard d'une vie potentielle jugée meilleure. Or, c'est dans cet espace de projection de soi-même que peut se trouver le sens d'une vie – autrement dit : sa raison d'être. Et celle-ci est une pierre bien plus solide que la recherche du bonheur sur laquelle construire une existence humaine. Elle ne doit pas se faire au détriment du bonheur au point de rendre la vie malheureuse. Mais, de même, le bonheur ne doit pas non plus se faire au détriment de la signification... au risque de crises existentielles évitables. Le sens de la vie, c'est d'aller vers le haut, l'avant ou le côté, peu importe : mais c'est de se mobiliser. On peut être heureux dans la parfaite immobilité, mais pas durablement. Notre système nerveux est conçu pour nous mettre en mouvement. Autrement, comme le concombre de mer, nous nous en débarrasserions aussitôt que nous aurions trouvé la roche optimale à laquelle nous greffer. L'humain fonctionne en se projetant, en se fixant des objectifs et en progressant vers ses buts. Et l'évaluation lui permet de mieux procéder.
3. L'évaluation accroit inévitablement le risque de s'autodévaloriser.
L'évaluation est la concrétisation du jugement – qu'il soit jugement de soi ou d'autrui, peu importe. Quand l'appréciation reste informelle, on peut toujours la nier et faire comme si elle n'existait pas. Mais quand on procède à une évaluation formelle, à plus forte raison quantifiée, son résultat devient indéniable. De là le fait que certaines personnes en viennent à déléguer à l'évaluation la fixation de leur autoestime. Or, l'évaluation ne sera jamais qu'un jugement comparatif porté sur une compétence présente. Elle ne s'étendra jamais jusqu'à l'estimation de toutes les ressources d'un humain et n'établira jamais l'ensemble de ce que celui-ci peut ou encore ne peut pas devenir. Ce n'est pas son rôle et, de toute manière, elle n'en a pas la capacité. Si une évaluation avait la prétention d'avoir établi pour de bon ce qu'un humain peut devenir dans sa vie, il serait sans doute très aisé à cet humain d'agir pour donner tort à ladite évaluation. Mon autoestime est le résultat d'une autoévaluation large de ce que je suis capable de faire présentement et de ce que je m'estime capable d'atteindre dans l'avenir en fonction des ressources que je peux mobiliser. On le comprend, une telle autoévaluation ne donnera jamais comme résultat «60%» (la note de passage habituelle pour un examen ou un cours) ou «50e percentile» (la moyenne pour une compétence précise). Mais une personne qui ne comprend pas la complexité du calcul d'autoestime peut facilement déléguer ce calcul complexe à une simple évaluation externe réalisée en contexte scolaire (par exemple).
C'est de toute évidence ce que je faisais quand je pleurais à cause de mon résultat à un jeu langagier. C'est ce que font beaucoup de personnes qui s'autoflagellent à cause de résultats quantitatifs bas aux évaluations. C'est sans doute ce qui pousse des personnes à détester l'école : à force de se faire refléter leur propre incompétence par des résultats d'évaluation qui donnent l'impression d'établir leur valeur comme être humain, plusieurs personnes en viennent à avoir envie d'aller chercher ailleurs des preuves de leurs compétences. Peut-on leur en vouloir? De la même manière, des gens langagièrement compétents, et donc qui arrivent à avoir des bons résultats scolaires peu importe la matière (vu l'ancrage excessif de notre système éducatif dans les capacités langagières), ont tendance à rester à l'école bien au-delà de la simple acquisition de compétences pertinentes à l'exercice d'un métier. Elles restent à l'école parce qu'elles s'y sentent bonnes. Robert Nozick, dans un article célèbre, attribuait à cette caractéristique la propension anticapitaliste des intellectuels : puisqu'ils ont du succès à l'école, mais pas autant au dehors, ils se disent que ce doit être parce que le système économique est vicié par rapport au système scolaire. (En fait, ce sont les critères d'évaluation scolaires, prétendant se calquer sur le vrai monde, qui sont mensongers.)
En résumé, plus l'évaluation est critériée et quantifiée, plus elle offre d'occasions qu'on lui délègue la large autoévaluation sur laquelle, optimalement, se baserait l'autoestime. Ce faisant, elle offre donc plus de moyens de s'autodévaloriser. Et tout le monde finit par être affecté. Car les critères ne sont pas uniformes. Malgré un ancrage excessif de l'école dans les capacités langagières, il y a une variabilité inévitable dans ce que les enseignants jugeront valables, et donc même une personne aux capacités très élevées sur le plan langagier finira, de manière plus ou moins justifiée et accidentelle, par être mal évaluée. Il en résultera donc nécessairement pour tout le monde, à un certain moment, une certaine autodévalorisation.
Celle-ci vient d'une réduction du nombre de sources d'évaluation contribuant à l'autoestime. Cette réduction vient du fait que toutes les sources d'évaluation ne sont pas autant critériées et quantifiées, et qu'il est souvent plus facile de reposer sur des sources qui semblent plus «objectives». Or, quand on parle d'évaluation, le terme d'«objectivité» ne signifie rien. Une roche est un objet, mais une roche n'évalue pas, puisqu'elle ne valorise pas. La meilleure évaluation est une évaluation intersubjectivement juste, c'est-à-dire qui intègre le plus de sources de valorisation différentes. Ceci vaut pour la diversification des évaluateurs d'une de mes compétences autant que pour la diversification des sources d'évaluation quand je m'attribue une note globale à moi-même (l'accord interjuges devient ici celui entre les différents critères selon lesquels je peux [et devrais] me juger moi-même pour me considérer exhaustivement).
La meilleure évaluation serait celle qui me comparerait à l'ensemble de l'humanité. Comme chaque jugement humain peut être biaisé, la meilleure méthode d'évaluation serait celle qui formerait tous les humains à l'exercice d'un jugement juste et qui ferait se confronter délibérativement tous ces jugements. Bien entendu, une telle évaluation demanderait beaucoup trop de temps et de ressources pour qu'il soit possible d'y procéder pour toutes les compétences actuelles et potentielles. La seule alternative que nous ayons est d'établir les critères d'évaluation les plus concrets, clairs et observables – donc aussi quantifiables. Et d'enseigner aux apprenants à contrôler leur réflexe de s'autodévaloriser avec un seul mauvais résultat... surtout pour des compétences non cognitives. En effet, se considérer stupide est une chose; se considérer méchant en est une autre. Des tests de jugement situationnel tels que le Casper (anciennement CASPer, pour «computer-based assessment for sampling personal characteristics») et les MEM (mini-entrevues multiples) pour l'admission aux programmes de santé évaluent les compétences socioaffectives. Mal s'y classer, c'est courir le risque de se considérer défectueux sur ces plans. Or, ces évaluations comparatives sélectionnent un petit nombre de candidats parmi un vaste bassin. La comparaison est donc biaisée : on pourrait être dans le quatrième quartile par rapport à l'humanité, et tout de même se retrouver dans le premier quartile par rapport à ceux qui passent ces tests. De là les réactions fortes que j'observe souvent à l'échec à ces tests, moi qui mentore des étudiants qui s'y essaient.
4. Mieux utiliser l'évaluation s'apprend, s'enseigne et se recherche
J'ai reçu des notes en dessous de mes attentes dans mes actuelles études au doctorat en éducation. Est-ce que je me suis mis à pleurer en me considérant comme un sous-humain? Non. Pourquoi? Parce que, depuis cet évènement au primaire, j'ai extensivement réfléchi à la question évaluationnelle, comme le montrent les réflexions du présent billet de blogue. Je considère donc avoir appris à mieux utiliser l'évaluation. Comme beaucoup d'apprentissages dans ma vie, j'ai procédé à celui-ci en autodidacte. Mais ce qui s'apprend autodidactement peut aussi s'enseigner. Et ce qui s'enseigne est normalement appris plus vite que quand on l'apprend par autodidaxie. C'est ce que j'essaie de faire en condensant dans le présent billet de blogue mes réflexions au sujet de l'évaluation. J'espère cependant que ça ne s'arrêtera pas ici.
Encore faut-il commencer par valider empiriquement ce qui ne sont, pour l'instant, que des impressions anecdotiques issues d'une étude de cas autoethnographique de N = 1. Ensuite, il restera à développer des interventions visant à faire comprendre l'utilité de l'évaluation ainsi que ses risques. Le plus important, ceci dit, ce seront encore les interventions pour diminuer ces risques, et ce, dès le plus jeune âge – avant même qu'on ait commencé à évaluer de façon sanctionnelle. Pourquoi? Parce que la prévention gagne à être implantée avant qu'on soit exposé au risque, pas quand on y est exposé. Ainsi, on préviendra mieux les coupures avec des couteaux coupants en enseignant à manier des couteaux en plastique.
C'est tout un programme de recherche, ainsi que tout un programme d'enseignement-apprentissage, que j'ai ébauché ici. J'espère cependant que mon lectorat intéressé par les questions éducationnelles sera d'accord avec moi pour dire que ces programmes ont du potentiel. Après tout, nous entrons dans l'ère de l'automesure et des mégadonnées où l'évaluation et l'autoévaluation croissent exponentiellement. À partir de là, il me semble que nous n'avons que trois options : (1) celle de l'autruche, qui consisterait à nier le problème et à ne rien faire contre lui; (2) celle du luddisme, qui consisterait à jeter le bébé avec l'eau du bain et, ce faisant, nous priverait des potentialités de l'évaluation au regard des risques qu'elle implique; (3) celle de l'utilisation pragmatique des potentialités de l'évaluation et de l'affrontement réaliste des inévitables risques qu'elle implique, en les connaissant mieux pour s'y adapter. Faites votre choix.
Commentaires
Publier un commentaire