Want to create interactive content? It’s easy in Genially!
Talleres IA IMAGEN
davidmval
Created on September 21, 2024
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Artificial Intelligence in Corporate Environments
View
Internal Guidelines for Artificial Intelligence Use
View
Interactive Onboarding Guide
View
Word Search
View
Sorting Cards
View
Word Search: Corporate Culture
View
Corporate Escape Room: Operation Christmas
Transcript
Talleres de Inteligencia Artificial en educación
Intro
David Martínez Valeriano
Imagen
Audio
Texto
Edu IA
Vídeo
Imagen
Inicio
INTELIGENCIA ARTIFICIAL, TALLER 3: INTRODUCCIÓN A LAS IA DE IMAGEN
Introducción
¿Cómo funciona?
Categorización
Entrenamiento
Relación Usuario - IA
Prompts / Parámetros
A vista de pájaro
Riesgos y peligros
¿Sabías que...?
Manos a la obra
10
Imagen
Inicio
10
INTRODUCCIÓN
Imaginación artificial al poder. En este taller vamos a centrarnos en el uso de herramientas para imagen. Si en el taller de texto hablábamos de "Tú preguntas, la IA responde", en este deberíamos hablar de "Tú sugieres, la IA imagina". En este taller vamos a centrarnos en conocer diferentes herramientas de IA para imágenes y dejaremos que sea la IA la que llene de formas y colores nuestros pensamientos. Vamos a trabajar tanto en la creación como en la supervisión, rectificado y discriminación de imágenes reales e imágenes generadas por IA.
Imagen
Inicio
10
¿CÓMO FUNCIONA?
Parece magia pero el funcionamiento de una IA que trabaja con imágenes es muy similar a una de textos. Es verdad que luego haremos distinciones según el tipo de IA pero básicamente el tratamiento de datos y el entrenamiento es casi idéntico a una herramienta de IA como por ejemplo ChatGPT. Como un comentario general, estas herramientas de IA lo que hacen es entrenarse captando millones de imágenes y reconociendo patrones de cada uno de los elementos de esas imágenes. Al generar una imagen en base a esos patrones las IA luego cotejan, dependiendo de las palabras que el usuario solicita, todas las claves de patrón que tiene adquiridas y discrimina los resultados por imágenes que cumplen e imágenes no convincentes. Si el resultado es no convincente regenera la imagen e introduce los cambios detectados en los patrones identificados. A la hora de generar imágenes lo que hace la IA es combinar todo lo que en el prompt se pide, identificando objetos, características y acciones solicitadas. Aquí es donde más fallos pueden producirse. Estos fallos deberán ser corregidos por el usuario rectificando una y otra vez el prompt tal y como aprendimos en el taller de IA para texto.
Imagen
Inicio
10
CATEGORIZACIÓN
De uso en redes neuronales, grandes empresas tecnológicas y rara vez por el usuario final
Detección de objetos
Segmentación de imágenes
Reconocimiento de imágenes
Clasificación de imágenes
Generación de imágenes
Retoque de imágenes
Detección de imágenes IA
Uso frecuente por el usuario final
Imagen
Inicio
10
ENTRENAMIENTO
De igual forma que las herramientas de IA para texto, estas herramientas, las centradas en imágenes, tienen un proceso de entrenamiento continuo basado principalmente en la categorización de millones de imágenes, búsqueda de patrones e intercambio de datos en redes neuronales. Las imágenes recopiladas son tratadas y fragmentadas para aprender lo máximo de cada elemento de la imágen original. Con todos estos datos se generan las imágenes y se aplican técnicas para optimizar los resultados. Los resultados son comparados con la información que ya conocen los modelos entrenados y se distinguen entre creaciones que sí corresponden a los patrones e imágenes que no lo hacen, volviendo a incoporar estos datos al modelo hasta construir una imagen que pase los filtros establecidos por el modelo. Nosotros no podemos interferir en este entrenamiento directamente pero sí lo hacemos de forma indirecta cuando subimos alguna foto nueva a internet o creamos alguna con alguna IA o incluso cuando seleccionamos las imágenes de un Captcha. Sí que existen modelos que se pueden parametrizar por parte del usuario final pero a esto no deberíamos llamarle entrenamiento aunque de alguna forma influya en él.
Imagen
Inicio
10
RELACIÓN USUARIO - IA
Generación simple
- Petición genérica inicial.
- Peticiones extendidas a cada nueva respuesta de la IA.
Reformulación del prompt
- Formulación incial del prompt.
- Adecuación del prompt dependiendo del resultado obtenido.
Repetición de prompt en diferentes herramientas de IA
- Formulación del mismo prompt en varias herramientas para elegir el mejor resultado.
Subida de imagen propia para retocar por IA
- Utilización de imágenes subidas desde nuestro equipo para recibir un tratamiento por IA o crear a partir de ella
Generación de personajes persistentes
- Uso de un personaje creado por IA en situaciones diferentes
Imagen
Inicio
10
PROMPTS / PARÁMETROS
CONTEXTUALIZAR LA ACCIÓN
PUNTO DE VISTA
ESPECÍFICOS Y DETALLISTAS
ESTILO
ADJETIVOS
CLARIDAD
PROMPT NEGATIVO
Imagen
Inicio
10
A VISTA DE PÁJARO
Info de ChatGPT de uso de IA generativas de imágenes en los últimos 3 meses y convertida en una web para mostrar el resultado
Imagen
Inicio
10
¿SABÍAS QUE...
...hay muchas herramientas de IA para imagen capaces de convertir doodles en imágenes reales?
...Canva, además de tener su propia herramienta text2image ha llegado a un acuerdo con multitud de desarrolladoras de IA para integrar sus servicios en su plataforma? (puedes encontrarlas dentro de Apps de Canva)?
...con la herramienta Monica puedes animar una imagen estática?
...con ArtGuru.ai podemos crear un avatar nuestro utilizando unas cuantas fotos en las que salgamos nosotros ?
Imagen
Inicio
10
RIESGOS Y PELIGROS
Enredo con copyrights
Erosión de la confianza pública
Deepfakes
Propaganda y difamación mediática
Creación de fake news
Fraude e ingeniería social
Sabotaje empresarial
Violación de la privacidad
Manipulación de imágenes en marketing
Contenido pornográfico
Imagen
Inicio
10
MANOS A LA OBRA
1.- Imagine
8.- Hazte un selfia
2.- Canva
9.- Combinados locos
3.- Comparando
10.- Sherlock Holmes
4.- Fondos fuera
11.- Échate a correr
5.- Dando vida
12.- Una de vaqueros
6.- Prompteando
13.- Imagina un taller de IA en el Centro de Profesores
7.- Doodleando
Aunque Monica.ai es un enorme editor IA dedicado a diferentes funciones, en esta actividad vamos a probar su "animador" de imágenes estáticas, faceta en la que destaca por encima de las otras funciones que posee. 1.-Elegiremos y descargaremos de Google una imagen. La subiremos a Monica y le pediremos que nos la anime (en el link de abajo tenéis el link directo a esta función de Monica)
Mueve las caderas siempre que tengas ocasión
Como en el tipo anterior, estas IA utilizan un algoritmo para dotar de potencialidad recursos concretos. En este caso lo que hace este algoritmo es etiquetar cada uno de los pixels de una imagen para estudiarlos después por separado. Está siendo usado en medicina para identificar anomalías en los tejidos, un buen ejemplo sería U-Net. Además también pueden servir para identificaciónn de escenas urbanas como DeepLab de Google o Mask R-CNN utilizada para aplicaciones de conducción autónoma
U-Net
Mask R-CNN
DeepLab
Nos enfrentamos a la primera generación de imagen de este taller. Para este primer acercamiento he elegido Firefly por su rapidez, su facilidad de uso y su calidad. Una vez dentro tendréis que imaginar qué queréis que la IA cree para vosotros y escribirle el prompt. Tampoco tenemos porqué rebuscar mucho a la hora de crear el prompt, dentro de un par de actividades profundizaremos en el retoque del prompt creado. Anotad el prompt que hayáis usado para retocarlo en esa actividad posterior.
Fácil, ¿verdad?
Identifican objetos, personas, características e incluso texto. Un buen ejemplo de este tipo de IA puede ser Google Vision AI que, por ejemplo, implementó esta tecnología en sus Google Glasses. Similares a Google VIsion tenemos Amazon Rekognition, Microsoft Azure Computer Vision, Clarifai, DeepAI Image Recognition API (este para integrar en webs de terceros) o Vize.ai que nos permite entrenar modelos de reconocimiento de imágenes específicos para empresas. Muchas de las aplicaciones de Realidad Aumentada están incorporando a sus productos este tipo de IA.
Google Cloud Vision AI
Microsoft Azure Computer Vision
Amazon Rekognition
Clarifai
Vize.ai
DeepAI Image Recognition API
Todo avance tecnológico tiene sus pros y sus contras, en este taller centrado en las herramientas IA para imágenes nos encontramos con un problema grave que puede llegar a ser muy grave según el uso que se hagan de ella. Hablamos de deepfakes. Para minimizar su impacto vamos a ver (y trabajaremos después) con diferentes métodos para detectar imágenes generadas por IA. Las Fuerzas y Cuerpos de Seguridad del Estado tienen sus propias herramientas forenses en colaboración con organismos como el Instituto Nacional de Ciberseguridad (INCIBE) y el Centro Criptológico Nacional (CCN-CERT). Además a nivel global se colabora con Interpol, Europol y empresas de ciberseguridad para la detección de deepfakes en proyectos como Sirius o iCOP y tecnologías de terceros como Sensity AI, Amber Authenticate o Truepic, peeeeeeero... ¿y el resto de las personas?¿cómo podemos distinguir una imagen generada por IA y que no nos la cuelen?
1.- Regla del "¿pero qué me estás contando?" Lo primero es que nuestro sentido común puede disparar alertas que debemos aprender a reconocer al ver una imagen digital
2.-Observación, errores en los difuminados, dedos o dientes anormales, errores en los contornos y aberraciones creativas
3.- Búsqueda inversa con aplicaciones como: Google Images, Bing, Tineye o Yandex
4.- Análisis de metados con herramientas como: Metadata2Go o Image Verification Assistant
5.- Análisis con herramientas forenses para IA como: HuggingFace Detector, Sensity, DeepFake o Meter, Detect Defender, Truepic, Hive Moderation o plugins de navegador como InVid, Hive AI Detector o Was It AI
Se están produciendo además avances en aplicaciones de identificación de imágenes generadas por IA desde la cámara del móvil. Google Lens y Rodea para buscar de Google que pronto tendremos disponible.
InVid
Was It AI
Google Images
Metadata2Go
Tineye
Yandex
Image Verification Assitant
Bing
HuggingFace Detector
Truepic
DeepFakeOmeter
Detect Defender
Hive Moderation
Sensity
Hive AI Detector
¿Tienes el móvil a mano? Sácalo y hazte un selfie. Después enviátelo a la cuenta de correo que estés usando en el taller. Vamos a trabajarlo con una herramienta de IA llamada Fotor.
1.- Subimos la foto a Fotor (si hubiera usado la palabra imagen no habrías terminado de leer la frase como si fueses Chiquito de la Calzada) 2.- Localizamos el apartado "Filtros de IA" en el menú izquierdo y probamos varios de ellos. Como veis hay un montón más de opciones, Fotor es un portal de IA muy completo.
Di patata
Retomamos el prompt que usamos en la primera actividad y volvemos a trabajar con Firefly, en esta ocasión redefiniendo el prompt teniendo en cuenta lo que hemos visto en el apartado de "Prompts/Parámetros":
- Siendo más específicos y detallistas, explicando en el prompt cómo queremos alguna cosa más concreta de la imagen.
- Añadiendo un estilo (por ejemplo: que parezca de los años 60 o que tenga un estilo futurista)
- Si en la imagen hay una acción expliquemos cómo queremos que se comporte el movimiento
- Probando diferentes puntos de vista (Plano frontal, vista aérea,...)
- Usemos adjetivos para cosas concretas que queramos de una determinada manera
- Tratemos de ser lo más claros posibles en la redacción de todo lo anterior (podemos incluso decirle a ChatGPT que con la información dada nos haga un buen prompt para generar una imagen.
- Si procede, digamos que no queremos que haya (prompt negativo)
Yo prompteo, tú prompteas
Hemos visto que a la hora de detectar imágenes generadas por IA lo primero que tenemos que hacer valer es nuestra lógica, luego la observación y si nos siguen quedando dudas ya podemos recurrir a diferentes herramientas de análisis de metadatos, búsqueda inversa y a herramientas forenses. En esta actividad nos vamos a centrar en estos tres últimos apartados. Para ello vamos a utilizar imágenes de las que hemos ido creando en las actividades anteriores y un par que descarguemos de internet de alguna noticia (que deberían no ser generadas por IA, claro)
1.- Búsqueda inversa en Google Images, subiremos alguna de las imágenes y comprobaremos las fuentes que nos ofrece Google
3.-Análisis forense. Nuestro primer análisis forense lo realizaremos con Was It AI. Un análisis rápido y con bastante índice de acierto
2.-Análisis forense profundo, incluyendo metadatos con la herramienta Image Verification Assistant
5.-DeepFake O meter. Completísima con muchos modelos diferentes para analizar pero muuuy lenta si queremos un análsis exhaustivo.
Elemental, querido Watson
Google Images
Was it AI
Image VA
DeepFake o Meter
Encargada de revisar todos los elementos de una imagen y encuadrar los objetos que ha sido capaz de reconocer. Es similar al primer tipo que hemos visto aunque está utilizada casi en exclusividad para potenciar las redes neuronales. El algoritmo que usa esta IA es conocido por YOLO (You Only Look Once: Mira sólo una vez o incluso "sólo se vive una vez") está usado en miles de soluciones de identificación en tiempo real (carreteras, reconocimiento facial, seguridad,...), a raíz de este algoritmo tenemos librerías de código abierto como Detectron2 que podemos usar en nuestras aplicaciones. Luego, volvemos a encontrarnos con Google Cloud Vision AI, Amazon Rekognition o Microsoft Azure Computer Vision que han añadido esta funcionalidad a su plataforma de tratamiento de imágenes.
YOLO
Detectron2
Google Cloud Vision AI
Microsoft Azure Computer Vision
Amazon Rekognition
¿Hasta qué punto sois capaces de recrear este momento exacto del taller a través de una herramienta generativa de imagen? Deberéis convertir en un prompt todo lo que tenéis a vuestro alrededor, buscar descripciones para esta sala, la distribuición de las mesas, pantallas, asistentes,... y con él generaremos un prompt y veremos qué creación de las resultantes de todos los participantes se aproxima más a la realidad. Podéis elegir la herramienta de IA que os apetezca de todas las que hemos visto.
Espejito, espejito, ¿cuál es la simulación más bella del reino?
La más extendida y de la que más uso hacemos de ella. Aquí tenemos millones de aplicaciones (y los millones que vendrán). La mayoría de plataformas de diseño están integrándola en sus productos, un buen ejemplo de ello es Canva. En este apartado vamos a destacar Firefly de Adobe, DALL-E y Stable Difussion aunque podríamos no terminar de proponer soluciones de creación de imágenes por IA. También tenemos soluciones a través de otras plataformas, en parte para hacerlo un poco más exclusivo y en parte para no saturar los servidores, aquí, sin duda, el rey es MidJourney que trabaja vía Discord y para el que hay que esperar un tiempo para poder crear un registro en la actualidad. MidJourney ha comenzado a servirse también de una conexión a través de Google para permitir crear imágenes a través de la web sin vernos obligados a recurrir a Discord pero de momento esto va por invitación (y hay muuuy pocas) DALL-E al ser una IA de OpenAI está ahora mismo ya integrada en ChatGPT
Canva
MidJourney
DALL-E
Stable Difussion
Firefly
Toca ahora una actividad de descubrimiento y experimentación dentro de una herramienta de IA que está convirtiéndose en un macrocentro de generación de contenido visual, Runway. Eso sí, en este taller nos vamos a centrar solamente en sus apartados de imagen.
1.- Primero vamos a probar su Text2Image que lo encontraréis en el menú izquierdo, cread un prompt sencillo sobre lo que queráis y se lo enviamos. 2.- Después volveremos al Dashboard y pincharemos esta vez en "All Tools", aquí se nos abrirá el mundo Runway, como veréis hay muchísimas opciones tanto de imagen, como de vídeo o audio, sólo experimentaremos con aquellas de imagen que nos llamen la atención.
Más herramientas que el Inspector Gadget
Aquí englobo varios tipos porque todos están centrado en la conversión, mejora y modificación de imágenes ya hechas. Tenemos IA para eliminar fondos como remove.bg, IA para superescalar imágenes como GigapixelAI o IA para darle un estilo diferente a las imágenes como OpenArt, DeepAI o DeepArt.IO (esta última está ahora mismo de cambio de servidores pero volverá a funcionar en breve). El mar de aplicaciones que tenemos en este, y en el siguiente apartado es inabordable, cada día se multiplican en número y en funcionalidades
Remove.bg
DeepAI
GigapixelAI
OpenArt
DeepArt.IO
Es una IA encargada de captar imágenes y categorizarlas siendo esta la principal fuente de los entrenamientos de todas las herramientas IA que trabajan con imágenes. La IA por excelencia en este apartado es ResNet, una potente red neuronal de imágenes a la que no tenemos acceso para interactuar con ella. Luego tenemos alguna solución IA de clasificación sobre las que sí podemos intervenir como usuarios como Google Cloud AutoML Vision, Amazon Rekognition Custom Labels o Microsoft Azure Custom Vision (como vemos muchas son extensiones del tipo anterior, incluso alguna herramienta de detección de las citadas anteriormente podrían llegar a clasificarse también como IA para categorizar porque son dos procesos que van casi de la mano.
ResNet
Amazon Rekognition Custom Labels
Google Cloud AutoML Vision
Microsoft Azure Custom Vision