Want to create interactive content? It’s easy in Genially!

Get started free

Evaluer à l'ère de l'IA - 30012026

julienmorice

Created on January 30, 2026

Start designing with a free template

Discover more than 1500 professional designs like these:

Terrazzo Presentation

Visual Presentation

Relaxing Presentation

Modern Presentation

Colorful Presentation

Modular Structure Presentation

Chromatic Presentation

Transcript

Evaluer à l'ère de l'IA

Julien MORICE - Responsable du service PracTice - IMT-BS

go!

Un constat - Une problématique

Notre problématique

Imaginez un étudiant qui génère un rapport entier à partir d’une simple phrase… ou un enseignant, de l’autre côté, qui corrige un devoir en un clic grâce à l’IA.Le vrai problème ici, c’est que personne n’apprend ni n’évalue vraiment.

La capacité de l’IA à générer des dissertations, de résoudre des problèmes complexes, voire d’imiter l’écriture créative, remet en cause les évaluations en tant qu’indicateurs de l’effort ou de la compréhension de l’élève

UNESCO. (2023, décembre). Vers une nouvelle évaluation : l’IA change la donne. UNESCO.

Les évaluations 100% en asynchrone sont-elle encore pertinentes ?

Impact positif de l'IA sur l'évaluation diagnostique et formative

Comment évaluer et s'auto-évaluer grâce à l'IA en dehors du contexte sommatif ?

L'IA comme allié pour l'apprentissage et l'évaluation

Focus sur l'apprentissage

Est-ce que les étudiants apprennent en utilisant l'IA ?

Apprends t-on lorsqu'on fait usage d'une IA générative ?

Une étude du MIT, publiée en 2025 et intitulée « Your Brain on ChatGPT » (« Votre cerveau sous ChatGPT »), a comparé trois groupes : l’un utilisant ChatGPT, l’autre un moteur de recherche, et le dernier travaillant sans aide, juste avec son cerveau. L'idée est de savoir lequel parmi ces groupes pouvait mémoriser au mieux les informations.

Limite de l'étude du MIT : Your Brain on ChatGPT

Les résultats doivent être mis en balance avec plusieurs limites : un échantillon réduit et peu représentatif (60 participants), une durée courte (45 minutes, sans mesure à long terme), une tâche très spécifique (rédaction sous IRM), un usage artificiel de l’IA dans un cadre contraint, et une interprétation neuro incertaine, la baisse d’activité pouvant traduire une économie cognitive plutôt qu’une perte.

Comparaison avec l'usage d'un GPS

Focus sur la notion de plagiat et de "triche" avec l'IA

Peut-on assimiler l’IA à de la triche ou du plagiat ?

Peut-on identifier et sanctionner l'usage de l'IA générative ?

L’usage de l’IA générative diffère du plagiat : elle crée un contenu nouveau à partir de données existantes, sans forcément copier une source précise.

Pourquoi utiliser un détecteur d'IA (exemple de TurnitIn) ?

Génération brute (From Scratch) : Turnitin identifie les textes provenant directement de LLM (GPT-4, Claude, etc.) avec une très haute fiabilité. Dans le rapport, cela apparaît souvent surligné en bleu/cyan. Reformulation par IA (Paraphrasing) : L'outil possède désormais une catégorie spécifique pour le texte "Généré par IA puis reformulé par IA".

Sources : - Stanford University Study (2023-2024) : Étude mettant en évidence le biais contre les écrivains non-natifs (taux de faux positifs élevé) et la vulnérabilité face à la paraphrase. - Weber-Wulff et al. (2023/2024) : « Testing of Detection Tools for AI-Generated Text » – Recherche indépendante évaluant plusieurs détecteurs, situant souvent la précision réelle de Turnitin entre 76% et 80% (inférieure aux 98% annoncés).

Pourquoi est-il déconseillé de se baser sur le résultat des détecteurs ?

Un texte copié-collé depuis ChatGPT est immédiatement détecté à 100 % comme de l'IA mais : - Après avoir passé le texte généré par ChatGPT dans Stealth Writer le score de détection est descendu à 33 %. - Dans Walter Writes AI le score de détection est descendu à 0 % (indétectable).....

Source : My Research Support. (2025, 18 octobre). Turnitin October 2025 Update 🔍 | AI Writing Fully Detectable?! Try This Instead! [Vidéo]. YouTube. https://www.youtube.com/watch?v=yn2067OXjS

Peut-on considérer que l'usage de l'IA générative s'apparente à de la triche ?

Axe de solution : Clarifier les règles du jeu

Comment permettre aux étudiants et aux enseignants de clairifier les règles du jeu ?

Combo gagnant : Charte + Contrat pédagogique

Une charte au niveau d’un établissement permet de définir les bonnes pratiques et les règles communes, tandis qu’un contrat pédagogique précise les droits et devoirs des étudiants concernant l’usage de l’IA dans un cours donné (plus opérationnel).

Exemple issu de l’Université de Sherbrooke pour la rédaction du contrat pédagogique

L’Université de Sherbrooke distingue plusieurs niveaux d’usage de l’IA, allant de l’interdiction totale à une utilisation libre et déclarée. Ce cadre progressif aide enseignants et étudiants à définir clairement ce qui est autorisé, encouragé ou proscrit selon les objectifs d’apprentissage.

Ces règles insistent sur l'importance de l'esprit critique et la responsabilisation de l'apprenant quant à sa production (vérification des sources, etc...).

Effet d'aubaine de l'approche par compétence avec l'IA

...

Le couple IA / APC

Définition d'une compétence : savoir-agir complexe, fondé sur la mobilisation et la combinaison efficaces d’une variété de ressources internes et externes à l’intérieur d’une famille de situations. — Jacques Tardif, 2006, L’évaluation des compétences : Documenter le parcours de développement, Chenelière Éducation.

L'Approche Par Compétences (APC) n'est pas seulement une solution défensive, elle est structurellement adaptée pour intégrer l'IA.

Quelques méthodes d'évaluations IA résistantes

Quelques méthodes d'évaluation IA résistantes.

Exemple d'évaluation IA résistantes "traditionnelles"

- Devoirs sur table : permettent d’évaluer les étudiants sans recours à des outils numériques, dans un contexte déconnecté. - Oraux : Les évaluations orales permettent de mettre à l’épreuve les connaissances réelles des étudiants, d’observer leur capacité à s’adapter à l’incertitude et à démontrer leur maîtrise du sujet.

Mais....ne permet d'évaluer toutes les compétences.

Exemple d'évaluations IA résistantes utilisant des outils digitaux

- QCM sur table auto-corrigé : Exemple de l'activité test hors ligne de Moodle- Usage d'outils de proctoring :

  • Exemple d'utilisation de Safe Exam Browser (SEB) pour bloquer les apprenants sur un onglet.
  • Exemple d'utilisation de la solution SMOWL pour enregistrer l'activité de l'apprenant sur son ordinateur.

Faire varier les modalités d'évaluation

Quelques méthodes d'évaluation IA résistantes.

Système d'évaluation par les pairs

- Evaluation croisée de travaux : Chaque étudiant corrige trois productions de pairs et reçoit en retour trois évaluations, favorisant la prise de recul et l’esprit critique.- Evalution de groupe : Les étudiants évaluent collectivement les soft skills de leurs coéquipiers et formulent un retour constructif sur la collaboration au sein du groupe.

L'évaluation authentique : La solution ultime ?

Comment évaluer pleinement les compétences de l'étudiant en situtation ?

L'évaluation authentique (Wiggins, 1998, réactualisé pour l'IA en 2025) confronte l'étudiant à des problèmes du monde réel, mal structurés, qui nécessitent l'application de connaissances dans un contexte nouveau.

L'évaluation authentique

- Contextualisation Forte : L'IA (même connectée au web) manque de contexte implicite, local, ou hyper-récent (ce qui s'est passé dans la classe).- Multimodalité : La combinaison de l'écrit, de l'oral, travail en groupe et passage à l'action. - Métacognition : L'IA peut produire un résultat, mais elle simule mal le doute, l'hésitation et le parcours réflexif d'un étudiant (portfolio, rapport d'étonnement).

Avant :

🔴 Evaluation vulnérable (Focalisée sur le produit) Consigne : "Individuellement ou en binôme, vous devez rédiger le cahier des charges complet (20 pages) d'une application mobile innovante permettant de résoudre un problème de société de votre choix." Pourquoi l'IA réussit ici : Un LLM peut inventer un problème, trouver une solution, rédiger les spécifications techniques, créer les user stories et structurer le document en quelques secondes. Résultat :L'enseignant corrige un document final sans savoir qui l'a écrit.

Après :

Evaluation authentique (Focalisée sur le processus et le terrain) Consigne : En équipe, identifiez un point de friction réel vécu par les usagers de [Lieu spécifique : ex. le campus, la bibliothèque, le restaurant universitaire]. Concevez une solution numérique, prototypez-la et prouvez sa pertinence par le test terrain. Pourquoi l'IA réussit ici : On ne demande plus seulement de "rédiger". On demande d'observer (social), de prototyper (technique/créatif), de tester (analytique) et de défendre (rhétorique). Cette complexité rend la délégation totale à l'IA impossible. Résultat :L'enseignant déplace son regard du produit fini vers l'évaluation de compétences réelles et situées.

S'aider de l'IA dans tout le processus d'évaluation : LLM et Agents

Comment évaluer et s'auto-évaluer grâce à l'IA en dehors du contexte sommatif ?

S'aider le l'IA pour la correction et la rédaction de feed-back : LLM ou agents.

Conclusion

« All life is problem-solving. »

Popper, K. R. (1994).

Toute forme de vie, de la cellule à l’être humain se définit par sa capacité à résoudre des problèmes.

Quelques questions ouvertes pour aller plus loin ?

- Faut-il en demander plus aux étudiants augmentés ? - Faut-il augmenter la difficulté ? - Faut-il évaluer davantage le processus que le résultat ? - Faut-il davantage évaluer l'acquisition de compétence en matière de d'esprit critique et de créativité en évaluant différemment ?

Ressource PRAX-IA

Accèder

Merci

Julien MORICE - Responsable du service PracTice - IMT-BS

Accès à la présentation

https://shorturl.at/R1UaV