Want to create interactive content? It’s easy in Genially!

Get started free

2025 - À la découverte de ChatGPT et l'IA générative

BU Lyon 2

Created on October 10, 2024

Start designing with a free template

Discover more than 1500 professional designs like these:

Smart Presentation

Practical Presentation

Essential Presentation

Akihabara Presentation

Pastel Color Presentation

Visual Presentation

Vintage Photo Album

Transcript

Florent Pomeyrol, SCD Lyon 2

À la découverte de ChatGPT et de l'IA gÉnÉrative

START

Sommaire
  • Qu'est-ce que l'IA ?
  • Où la trouve-t-on ?
  • Quels enjeux ?
  • Maîtriser l'art du prompt !
  • Let's practice ! Quelques exercices

Qu'est-ce que l'IA ?

L'intelligence artificielle (IA) est la “capacité d'une machine à faire preuve de capacitéssemblables à celles de l'homme, telles que le raisonnement, l'apprentissage, laplanification et la créativité” (Holmes, W., & Tuomi, I. 2022).

+info

Source : UQAM - Service des bibliothèques - ChatGPT et intelligence artificielle générative

Mais où trouve-ton déjà de l'IA ?

L'histoire de l'IA remonte aux années 1950, lorsque lespremiers chercheurs ont tenté de créer des machines capables de simuler l'intelligencehumaine. Ces développements sont intimement liés à ceux de l’informatique.

+info

Les enjeux sociaux, humains et environnementaux : Partie 1
L'exploitation
La désinformation
Les biais de l'IA

Les enjeux sociaux et humains et environnementaux : Partie 2

Les données personnelles
L'environnement
Le droit d'auteur

Exercice n°1 : Présentation et paramétrage de ChatGPT :

Objectif : paramétrer ChatGPT afin de protéger au mieux ses données personnelles

Maîtriser l'ART du prompt

Mais c'est quoi un "prompt" ?

Signifier un rôle à ChatGPT

Spécifier un contexte

Décrire la tâche à exécuter

Mentionner les contraintes souhaités

CE QUI NOUS DONNE :

Je suis une élève de lycée en classe de terminale. Dans le cadre de mon cours d'histoire, je dois répondre à la question suivante : "Quels ont été les impacts économiques et sociaux de la crise de 1929 en Europe ?" Donnez-moi un plan détaillé en 3 parties répondant à la question. Le plan détaillé doit comprendre une introduction et conclusion rédigées de 300 signes maximum. Chacune des 3 parties se composent de 3 sous-parties. Le style doit être concis.

POUR RÉSUMER :

Signifier un rôle à ChatGPT : Spécifier/définir le profil/posture/statut souhaité Spécifier un contexte : public-cible, niveau attendu, objectifs pédagogiques, type de compétence etc... Décrire la tâche à exécuter: un plan, une synthèse, une bibliographie, une traduction = une action Mentionner les contraintes souhaités : Préciser le format de sortie/présentation souhaité, mentionner les contraintes souhaités (format, tonalité, etc.)

Exercice n°2 :Construire un prompt

Objectif : Identifier les 4 points essentiels à la construction d’un prompt efficace
Associer et mettre dans le bon ordre les 4 parties des 3 prompts distribués en respectant :
  1. Signifier un rôle à ChatGPT ;
  2. Spécifier un contexte ;
  3. Décrire la tâche à exécuter ;
  4. Mentionner les contraintes souhaités.
Correction : Chaque groupe propose une correction de prompt !

20:00

CE QUI NOUS DONNE :

Je suis une étudiante à l’université en licence 3 de droit constitutionnel. Je travaille sur le sujet de la dissolution de l’assemblée nationale en France depuis la naissance de la 5ème République. Donne-moi un plan détaillé en 3 parties d’une synthèse courte et précise sur le sujet comprenant une introduction et une conclusion rédigées. La conclusion de la synthèse doit être rédigée sous la forme d’un texte à trou comprenant 4 trous avec 2 choix possibles de réponse pour chaque trou. Donne-moi également les 4 bonnes réponses de ce texte à trou.

CE QUI NOUS DONNE :

Je suis un enseignant-chercheur à l’université en histoire contemporaine spécialiste de la 5ème République française. Mon sujet de recherche porte sur l’histoire de la gauche française depuis 1981. Donne-moi une liste de 10 références bibliographiques d’articles de niveau recherche sur le sujet, issues de revues académiques reconnues et vérifiées. Ces références doivent mentionner le titre de la revue, son numéro, l’auteur de l’article et la date de parution.

CE QUI NOUS DONNE :

Agis en tant que bibliothécaire-formateur à l'université spécialisé en science de l'information. A ce titre, tu interviens dans le cadre d’une formation professionnelle à la découverte de l'intelligence artificielle générative destinée à des collègues bibliothécaire de niveau débutant. Définis le scénario de la formation qui doit comprendre une partie introductive avec une définition du sujet, une partie de mise en pratique via des exercices et une partie réservée à un QCM de fin de formation. La formation doit durer 1h et les parties minutées. Le QCM de 10 questions avec 3 réponses chacune doit être de niveau débutant et simple. Donne-moi les bonnes réponses aux questions. Le ton doit être professionnel.

CE QUI NOUS DONNE :

Je suis une jeune élève de 12 ans en classe de 6ème au collège. Je dois préparer une présentation orale en sciences naturelles portant sur les changements climatiques. Donne-moi une liste de 15 mots-clés traitant du sujet et me permettant de lancer mes recherches documentaires. Je souhaite que cette liste soit rédigée sous la forme d’un tableau regroupant en colonnes les 3 thématiques principales.

CE QUI NOUS DONNE :

Je suis une cuisinière expérimentée travaillant dans un grand restaurant parisien étoilé . J’interviens dans des cours de cuisine destinés à un public d’amateurs sans aucune expérience en cuisine. Donne-moi une liste de 5 recettes de cuisine française classique pour 6 personnes à base de bœuf mentionnant les ingrédients, la quantité de ceux-ci et les différents temps de cuisson. Cette liste doit être détaillée sous la forme d'un tableau à 4 colonnes.

CE QUI NOUS DONNE :

Nous sommes dans le futur en 2224, je suis la commandante et la pilote d’un vaisseau spatial explorant les frontières de la galaxie. Je dois définir et élaborer un plan de vol de plusieurs années pour une expédition lointaine à la recherche de nouvelles formes de vie sur d’autres planètes. Ce plan de vol doit être rédigé sous la forme d’un poème en vers imitant le style d'écriture de science-fiction du space-opéra. Sa longueur ne doit pas excéder 1000 mots et le niveau de langue doit être soutenu.

Exercice n°3 : l'effet "WAOW" ou le super secrétaire

Objectif : Tester différentes fonctionnalités d’analyse, de traitement de texte et de rédaction offertes par ChatGPT
Exercice en 3 parties :
  • Saisir le prompt “correction” assemblé dans l’exercice n°1
  • Analyser et comparer les résulats obtenus
  • Saisir le prompt "création d'une image" tiré au sort
  • Analyser et comparer les résulats obtenus
  • Déposer l'article en PJ dans la barre de prompt
  • Suivre les 9 consignes 1 par une 1
  • Analyser et comparer les résulats obtenus entre les consignes

20:00

exercices n°4 : la recherche documentaire

Histoire

L'intelligence artificielle générative n'est pas (encore ?) un moteur de recherche académique ! Vérifions-le par l'exemple !

Santé sociale

Résultats ? Conclusions ?

Géographie

Objectif : maîtriser et comprendre les enjeux et les limites de la recherche documentaire via une IA générative

exercices n°4 :analyse des résultats

20:00

Faire les vérifications avec Exploradoc, Google Scholar, Cairn, Open Edition et Google Quelques questions se poser :
  • Les revues existent-elles ? Analyse de l'année, du volume, le numéro et de la pagination
  • Les livres existent-ils ? Si oui, où avez-vous trouvé l'information ?
  • Les auteurs existent-ils ? Si oui, travaillent-ils sur un sujet identiques ou différent ?
  • Noter les résultats de vérification obtenus pour chaque références

QUELQUES EXEMPLES D'IA GENERATIVES

IA générative et outils de recherche de littérature académique

Des sources d'inspiration importantes

  • La rubrique "Intelligence artificielle - Pixels" du Monde.fr
  • La rubrique "Intelligence artificielle" de Developpez.com
  • L'excellent LibGuide des bibliothèques de l'UQAM
  • Les ressources pédagogiques de l'Université de Bordeaux
  • Le Glossaire de l'IA par Cnetfrance.fr
  • Aline BOUCHARD - Conservatrice des bibliothèques - URFIST de Paris

Merci de votre attention

Des questions?

Et l'environnement dans tout ça ?

On en a peut-être moins conscience parce que c'est intangible, mais chaque utilisation de ChatGPT a un impact négatif sur l'environnement. Il y a fort à parier que l'utilisation des technologies de l'IA ira de façon croissante, cela va donc devenir rapidement très préoccupant pour l'avenir. Bien qu'il soit difficile de calculer l'empreinte carbone avec précision, notamment en raison de l'opacité de la part des compagnies, certains groupes de recherche offrent des pistes pour nous aider à l'estimer. Pour obtenir un portrait complet, il faut tenir compte du coût énergétique de la fabrication l'équipement informatique (ex. métaux lourds), du stockage d'information, de la création du modèle ainsi que de l'utilisation en production. Les centres de traitement des données nécessitent de grandes quantités d'électricité (de l'énergie pas toujours propre) et d'eau pour refroidir les serveurs. Une recherche a estimé que la création de GPT-3 aurait nécessité une consommation de 1287 mégawattheures (MWh) d'électricité et généré plus de 550 tonnes d'équivalent dioxyde de carbone; une autre étude récente évalue entre 3,5 et 5 millions de litres d'eau pour l'entrainement du modèle. Cette même étude estime qu'un court échange avec ChatGPT-3 (entre 20 et 50 invites de commande et leurs réponses) consomme 500 ml d'eau. Or, l'on sait que GPT-4 est entraîné sur environ 570 fois plus de paramètres que le GPT-3, ce qui laisse entendre une empreinte carbone qui ira fort probablement en s'intensifiant. Enfin, selon la firme d'analyse stratégique Gartner, si les pratiques actuelles en matière d'IA restent inchangées, cette industrie consommera d'ici 2025 plus d'énergie que toute la main-d'œuvre humaine et pourrait représenter jusqu'à 3,5 % de la consommation mondiale d'électricité d'ici à 2030...

L'IA générative pour faire simple :

ChatGPT est une IA générative, un robot conversationnel (chatbot) avancé capable de fournir non seulement une expérience de conversation, mais aussi une assistance dans une grande variété de tâches complexes comme la rédaction d'un poème, l'explication d'un concept ou le développement d'un code de programmation. Pour interagir avec ChatGPT, on élabore une requête (ou invite; en anglais prompt) en langue naturelle qui force l'outil à effectuer une tâche. Chaque fois que l'on a recours à ChatGPT, celui-ci génère une réponse la plus probable (et non la plus vraie) sur la base de calculs statistiques, en prenant en compte les informations contextuelles fournies. On parle d'un moteur de réponse et non plus de moteur de recherche. Vous pouvez affiner vos demandes pour obtenir des réponses plus adaptées, mais ChatGPT est loin d'être infaillible et peut même fournir des réponses incorrectes, voire absurdes (les fameuses hallucinations). Bien que ChatGPT s'avère un outil utile pour certains usages, les réponses générées doivent souvent être affinées, complétées et surtout contre-vérifiées.

Préciser le format de sortie/présentation souhaité, mentionner les contraintes souhaités (format, tonalité, etc.)

Le plan détaillé doit comprendre une introduction et conclusion rédigées de 300 signes maximum. Chacune des 3 parties se composent de 3 sous-parties. Le style doit être concis.

Sujet de recherche en santé sociale : Je suis étudiant à l'université en master de santé sociale. Mon sujet traite de la santé environnementale et des liens étroits entre santé et nature, santé et biodiversité en France. Donnez-moi 5 références bibliographiques issues de revues académiques et universitaires françaises faisant autorités sur le sujet. Je souhaite que les références soient exclusivement en langue française, faisant apparaître également l'auteur, la date de publication et le numéro de la revue de chacune des 5 références proposées. Je n'attends pas de style bibliographique de citation en particulier.

Spécifier un contexte : public-cible, niveau attendu, objectifs pédagogiques, type de compétence etc...

Dans le cadre de mon cours d'histoire, je dois répondre à la question suivante : "Quels ont été les impacts économiques et sociaux de la crise de 1929 en Europe ?"

L'IA comme producteur de désinformation

On peut définir la désinformation comme étant l'utilisation délibérée d'informations avec l'objectif de manipuler ou de tromper. Si la désinformation existait bien avant l'arrivée des IA génératives, ces dernières permettent aux personnes mal intentionnées un important gain de temps et d'efficacité. Elles peuvent produire du contenu qui apparait d'une grande crédibilité et adapté à une audience ciblée, facilitant ainsi la diffusion d'idées, de fausses nouvelles voire de théories conspirationnistes. L'essor de l'intelligence artificielle en 2023 a transformé le paysage de la mésinformation, en fournissant aux acteurs malveillants de nouveaux outils pour créer :

  • des articles ;
  • des images ;
  • des sons ;
  • des vidéos ;
  • des sites web entiers à l’apparence authentique.
Objectif principal : promouvoir des récits faux ou polarisants destinés à semer la confusion et la méfiance.

Des données issues de l'exploitation humaine

Nous savons que le corpus d'entrainement de GPT provient du Web et comprend donc aussi violence, sexisme, racisme et homophobie pour ne nommer que quelques exemples. Comme tentent de le faire les plateformes numériques, OpenAI (la compagnie propriétaire de ChatGPT) cherche à retirer ces contenus à l'aide de l'intelligence artificielle. Pour qu'une IA reconnaisse du contenu toxique, il lui faut une banque à laquelle se référer. Ce travail d'étiquetage (les tags) qui implique de lire sans cesse la description d'horreurs, ce sont des travailleurs du Kenya qui l'ont entrepris dès 2021 pour un salaire horaire se situant entre 1,32$ et 2$ après impôt. Le tout dans des conditions précaires et générant des traumatismes chez ces travailleurs. Des contenus extraits du Web, indispensables à la réalisation de ChatGPT, OpenAI n'en a pas rémunéré les producteurs, c'est-à-dire les particuliers, les propriétaires de sites Web et les entreprises. Rappelons qu'OpenAI a récemment été évaluée à 29 milliards de dollars américains, soit plus du double de sa valeur en 2021. Il y a une contribution humaine capitale, volontairement maintenue dans l'ombre, derrière ces outils extrêmement lucratifs pour des intérêts privés.

Spécifier/définir le profil/posture/statut souhaité :

Je suis une élève de lycée en classe de terminale...

Sujet de recherche en géographie : Je suis un jeune professeur de géographie au collège. Je m'adresse à une classe de 4ème. Je prépare un cours traitant de l'alimentation, des circuits courts et de la production locale. Donnez-moi 5 références bibliographiques précises en langue française issues de revues académiques et universitaires faisant autorités sur le sujet. Je souhaite des références exclusivement en français datant de moins de 5 ans. Je souhaite avoir le ou les auteurs, l'année de publication et le numéro de la revue de chacune des 5 références proposées sous la forme du style bibliographique de citation Chicago.

Sujet de recherche en histoire contemporaine : Je suis étudiante en master d'histoire à l'université. Le sujet d'étude de mon mémoire porte sur la pratique de la torture par l'armée française pendant la guerre d'Algérie. Donnez-moi 5 références bibliographiques en langue françaises exclusivement, issues de revues académiques faisant autorités sur le sujet et datant de moins de 10 ans. Je souhaite avoir le ou les auteurs, la date de publication et le numéro de la revue de chacune des 10 références proposées sous la forme du style bibliographique de citation APA.

L'IA est bien présente, et pas seulement depuis fin 2022 !

C’est en 2010 que l’IA connaît un nouvel essor grâce aux algorithmes d'apprentissage automatique et notamment à l’accès à des volumes massifs de données et à l’accélération des calculs des algorithmes d’apprentissage. Bon nombre de technologies, produits ou services que nous utilisons déjà fonctionnent avec de l’IA : →Les algorithmes de recommandations : les plateformes de streaming telles que Netflix et les sites de e-commerce tels qu'Amazon, Youtube utilisent l'IA pour recommander des films, des séries, des produits, en fonction du comportement passé de l'utilisateur. →Assistants vocaux : des assistants vocaux comme Siri d'Apple, Alexa d'Amazon et Google Assistant utilisent l'IA pour comprendre et répondre aux commandes vocales des utilisateurs. →Chatbots : les entreprises intègrent des chatbots alimentés par l'IA sur leurs sites web pour répondre aux questions des clients et fournir un support client 24/7. →Traduction automatique : les outils de traduction automatique, tels que Google Translate ou Deepl, utilisent des réseaux de neurones pour traduire instantanément des textes et des conversations entre différentes langues. →Sécurité : les systèmes de sécurité, tels que les caméras de surveillance ou encore la VSA (vidéosurveillance algorithmique), utilisent l'IA pour détecter les comportements suspects et les intrusions (exemple des JO de Paris).

Décrire la tâche à exécuter

Donnez-moi un plan détaillé en 3 parties répondant à la question...

Les fameux biais de la machine !

La présence de biais repose sur plusieurs facteurs. Il y a d'abord le corpus choisi pour entrainer le modèle qui comporte des biais au départ. Les algorithmes employés pour traiter les données, les humains (ex. personnes modératrices et utilisatrices) et enfin les décisions des propriétaires, tant politiques que dans la conception, peuvent introduire différents types de biais. Aussi et en fonction des contenus, surviendront inévitablement des biais linguistiques (ex. avec la prédominance de l'anglais). Puis, lorsque certains groupes démographiques sont surreprésentés et d'autres sous-représentés, il risque fort de survenir : →Des biais démographiques : prédominance d'une vision masculine, blanche et hétérosexuelle amenant sexisme, racisme, homophobie, etc. →Des biais culturels : perpétuation de stéréotypes ou de préjugés culturels favorisant l'Occident →Des biais idéologiques : favorisant une posture politique ou sociale Enfin et suivant leur comportement dans le temps, les personnes utilisatrices pourraient elles-mêmes renforcer certains de leurs propres biais. On retrouvera alors le biais de confirmation (confirmant des opinions, des points de vue ou des croyances préexistantes).

C'est quoi un prompt ?

"L'Art du Prompt" est une compétence essentielle dans le domaine de l'intelligence artificielle (IA) qui consiste à formuler des “requêtes” d'une manière claire et efficace pour obtenir des réponses pertinentes. “Prompter” est une compétence à maîtriser pour exploiter pleinement le potentiel de l’IA, quelle que soit la technologie utilisée. Le “prompt” est un mot tiré du domaine informatique qui désigne l’invite de commande envoyée à un système. La formulation de ce prompt, aussi appelé “requête” en français, conditionne la réponse fournie par ChatGPT. Plus les instructions données dans le prompt sont précises et complètes, plus les suggestions et idées fournies seront pertinentes. Dans le cas où ChatGPT ne trouve pas la “réponse” dans sa mémoire, on dit qu’il “hallucine", c’est-à-dire qu’il invente le contenu à partir des éléments assimilés. Une seule invite ne permet pas toujours d'avoir une réponse satisfaisante. Il est important d'insister en précisant votre besoin. L'outil apprend par essai-erreur. Plus on le sollicite, plus il va "apprendre" et rectifier ses réponses.Voici quelques règles afin d'optimiser l'outil pour avoir une réponse la plus en lien avec vos besoins :

  • La façon de s'exprimer va influencer la réponse. L'outil reproduit le style de l'invite. Donner des exemples est une bonne manière pour orienter la réponse générée par ChatGPT;
  • Si la réponse ne convient pas, on peut rediriger le système en corrigeant ses réponses;
  • Se rappeler que ChatGPT garde en mémoire toutes les invites d'une même conversation;
  • S'en tenir à une conversation par sujet.

ChatGPT et le droit d'auteur

Le corpus d'entrainement de GPT provient de contenus du Web rédigés par nous tous, œuvres pour lesquels le consentement pour les utiliser n'a jamais été demandé lorsque protégées par le droit d'auteur. Des regroupements de personnes écrivaines et artistes mais aussi programmeuses décrient l'absence d'attribution et de compensation pour l'utilisation de leurs créations originales et déplorent que les productions d'IA génératives pourraient concurrencer voire supplanter leurs œuvres. Les conséquences sont potentiellement très lourdes en matière de revenu pour les personnes créatrices ainsi que certaines entreprises comme les médias. Plusieurs recours en justice sont d'ailleurs intentés, notamment au Canada et aux États-Unis (exemple du New York Times ou de regroupement d'auteurs américains actuellement en procès avec OpenAI). Rappelons que l'industrie des IA génératives se compte en milliards de dollars et qu'elle repose avant tout sur le travail des personnes créatrices. Enfin, il faut donc rester prudent avec de verser dans ChatGPT un contenu protégé par le droit d'auteur tel qu'un article ou un plan de cours.

ChatGPT et les données personnelles

Le corpus d'entrainement de GPT provient de contenus librement accessibles sur le Web. Et ces contenus peuvent comprendre des informations personnelles susceptibles d'apparaître dans les réponses de ChatGPT, factuelles ou fausses, et elles peuvent engendrer des impacts négatifs sur les personnes concernées. L'utilisation de ChatGPT requiert au préalable la création d'un compte chez OpenAI ou auprès d'un partenaire (Microsoft, Google ou Apple). Dans tous les cas, OpenAI recueille votre nom, votre adresse courriel et votre numéro de téléphone. Lorsque vous interagissez avec ChatGPT, d'autres informations personnelles sont recueillies à partir de votre appareil : le nom de votre appareil et le système d'exploitation, votre adresse IP, votre localisation géographique, le type de navigateur que vous employez, la date et l'heure ainsi que la durée de votre session, des témoins de navigation permettent de suivre votre activité sur son site. Ces divers éléments ont d'ailleurs placé l'entreprise en contrevenant au regard de la législation des pays de l'Union européenne (Digital Service Act, IA Act, RGPD...). Par défaut, OpenAI enregistre aussi sur ses serveurs les transcriptions de toutes les informations que vous inscrivez dans la boîte de conversation. Il est donc fortement recommandé de ne verser ni inscrire aucune information personnelle ou confidentielle, tant sur vous-même que sur quelqu'un d'autre. D'ailleurs, l'entreprise affirme que vos conversations serviront à entrainer les divers produits, présents et futurs, d'OpenAI. Enfin, la lecture de leurs politiques indique qu'OpenAI partagera ces informations sur vous notamment avec des partenaires commerciaux, c'est-à-dire des entreprises privées, mais on ignore lesquelles.