Want to create interactive content? It’s easy in Genially!

Get started free

Unidad 2 - Asincrónica

Eidos Global

Created on April 5, 2024

Start designing with a free template

Discover more than 1500 professional designs like these:

Correct Concepts

Microcourse: Artificial Intelligence in Education

Puzzle Game

Scratch and Win

Microlearning: How to Study Better

Branching Scenarios Challenge Mobile

Branching Scenario Mission: Innovating for the Future

Transcript

UNIDAD 2 CLASES 3 Y 4

ÍNDICE

Clase 4

Clase 3

CLASE 3

3.1 Calentando motores

3.6 Modelos fundacionales

3.2 ¿Qué es la IA generativa?

3.7 Técnicas utilizadas dentro de los modelos generativos

3.3 ¿Qué es un prompt?

3.8 Prompt engineering

3.4 Tipos de aplicaciones de la IA generativa

3.9 Mito

3.5 El mercado detrás de la IA generativa

3.10 Manos a la obra

3.1

Calentando motores

ÍNDICE

Calentando motores

Para comenzar el recorrido asincrónico de la Clase 3, te proponemos realizar un breve "Verdadero o Falso" sobre los temas vistos en la Clase 3 sincrónica. ¡Es solo a modo de ir entrando en calor y haciendo trabajar nuestras neuronas! 🥰 No importa si te equivocas, recuerda que el error es siempre parte necesaria del aprendizaje. 🙌 ¿Comenzamos?

* Esta imagen fue creada mediante el uso de Inteligencia Artificial Generativa (Microsoft Copilot)

ÍNDICE

ÍNDICE

* Esta pregunta fue generada con la ayuda de ChatGPT y la supervisión posterior del equipo encargado de desarrollar los contenidos del curso.

3.2

¿Qué es la IA generativa?

¿Qué es la IA generativa?

La inteligencia artificial generativa (IA generativa) es un tipo específico de inteligencia artificial que tiene como objetivo generar contenidos en diferentes formatos como texto, imágenes, videos, modelos 3D, etc. Este tipo de IA, para poder generar contenidos, se apoya principalmente de la tecnología llamada “Deep Learning” (aprendizaje profundo) y a la vez, en contenidos dados durante su etapa de entrenamiento. Por ejemplo, si una IA generativa es diseñada específicamente para redactar historias de terror, la misma debería ser entrenada con muchas historias de terror, para que luego, a partir de dichas historias ejemplares, sea capaz de generar historias similares a partir de las transmitidas en su etapa de entrenamiento.

Aprendizaje semisupervisado

ÍNDICE

ÍNDICE

3.3

¿Qué es un prompt?

¿Qué es un prompt?

Un prompt es una instrucción o un conjunto de instrucciones (entrada) que se le da a la IA para generar una respuesta o realizar una acción específica (salida). Funciona como una instrucción o pregunta que guía al modelo en la tarea que se espera que realice, que puede variar desde responder preguntas, completar textos, generar ideas creativas, crear imágenes, hasta traducir idiomas o escribir código. Los prompts pueden ser simples, como una pregunta directa , o más complejos, incluyendo instrucciones detalladas que guíen al modelo hacia una tarea

específica, como generar un poema en un estilo particular o resolver un problema de programación. La capacidad de un modelo de IA generativa para interpretar y responder a un prompt depende de su entrenamiento previo, el tamaño del modelo, y su capacidad general para comprender y generar lenguaje de manera coherente.

ÍNDICE

ÍNDICE

ÍNDICE

3.4

Tipos de aplicaciones de la IA generativa

Tipos de aplicaciones de la IA generativa

Cómo hemos visto, la IA generativa se destaca por su finalidad de generar contenidos. Al mismo tiempo, este tipo de tecnología cuenta con la posibilidad de generar contenidos en múltiples formatos, como por ejemplo textos, códigos de programación en diversos lenguajes, imágenes, audios (música, voces, etc.), videos, modelos 3D, etc. Los principales modelos de IA generativa que vamos a explorar en esta formación son los aquellos que generar textos e imágenes.

ÍNDICE

ÍNDICE

ÍNDICE

Modelos generativos de lenguaje

Los modelos generativos de lenguaje tienen la capacidad de aprender a reconocer patrones dentro de los lenguajes y así poder predecir, con mayor o menos precisión, qué palabra continua en una serie de palabras. Como hemos visto, gracias a la tecnología llamada “Deep Learning”, los modelos de IA generativa pueden entrenarse con una cantidad enorme de datos no estructurados. Por ejemplo, el modelo conocido como GPT, es un modelo generativo de lenguaje que se entrenó con enormes cantidades de textos tomados de internet. Gracias a este entrenamiento, el modelo generativo de lenguaje puede contar con millones de ejemplos para las diversas situaciones que se puede enfrentar el modelo a la hora de generar texto.

Ejemplo

ÍNDICE

ÍNDICE

ÍNDICE

Modelos generativos de imagen

Los modelos generativos de imágenes están diseñados para poder generar nuevas imágenes a partir de una instrucción escrita o una imagen. Por ejemplo, si a un modelo generativo de imagen se le envía una instrucción escrita que dice “Necesito que diseñes un logo para mi emprendimiento. El mismo se llama Natural Food y es una tienda online de venta de productos saludables y orgánicos. Asimismo, el logo debe tener como imagen principal una vaca sonriente y el estilo debe ser moderno”. A partir de dicho prompt, la IA generativa podría producir algo similar a esto:

Ejemplo de instrucción con imagen

Ejemplo de instrucción escrita

ÍNDICE

ÍNDICE

ÍNDICE

Modelos: Entradas y salidas

Cada modelo puede tener distintos entradas y salidas que van a definir la forma en la que funcionan y para qué sirven.

Entrada (input)

Salida (output)

Modelo

De imagen a otros formatos

De texto a otros formatos

ÍNDICE

ÍNDICE

3.5

El mercado detrás de la IA generativa

Actores del mundo de la IA generativa

En el mercado de la IA existen diferentes actores que cumplen diversos roles para poder crear las mejores herramientas existentes.

1. Investigación y desarrollo en IA

2. Desarrollo de los componentes específicos de la IA

3. Financiamiento de la IA

4. Comercialización y distribución de la IA

ÍNDICE

ÍNDICE

ÍNDICE

Cómo funcionan los modelos: Analogía de la torta

La IA generativa es creada por expertos en programación, informáticos, especialistas en aprendizaje automático y matematicos. La manera en la que utilicemos esta tecnología depende al 100% de los conocimientos técnicos que se tengan. Para entender mejor esto, vamos a imaginar que nos encargaron un pastel o torta de cumpleaños. Tenemos 3 escenarios posibles:

Escenario 1

Escenario 2

Escenario 3

ÍNDICE

ÍNDICE

ÍNDICE

Cómo funcionan los modelos: Analogía de la torta

El lugar donde nos coloquemos dependerá de si quieres tener más o menos control sobre los resultados que obtendrás de los modelos de IA generativa. Independientemente del escenario, tendremos una gran torta de cumpleaños. Y lo mismo sucede en el mundo de la IA, independientemente del nivel de conocimientos técnicos, el panorama de los modelos de IA generativa está avanzando a pasos agigantados.

ÍNDICE

ÍNDICE

ÍNDICE

¿En qué consiste el código abierto?

Se denomina código abierto a un modelo de producción descentralizada que permite que cualquier persona modifique y comparta tecnología ya que su diseño es accesible de manera pública. El término se originó en el contexto del desarrollo de software para indicar que este cumple con ciertos criterios de distribución gratuita. Hoy en día, el término “forma de código abierto” designa un conjunto de valores más amplio que se basa en los principios del libre intercambio de información, la creación rápida de prototipos y el desarrollo colaborativo. Cualquiera puede aportar nuevas ideas y mejorar aún más la tecnología para que evolucione de forma orgánica.

ÍNDICE

ÍNDICE

ÍNDICE

¿En qué consiste el código abierto?

La elección entre código abierto y cerrado depende de múltiples factores, incluidos los objetivos comerciales, las preocupaciones éticas, y la estrategia de mercado de cada empresa. Mientras que el código abierto fomenta la colaboración, la democratización y la innovación en la comunidad de IA, el modelo de código cerrado permite a las empresas proteger su propiedad intelectual y asegurar que su tecnología se utilice de manera responsable y segura.

ÍNDICE

ÍNDICE

ÍNDICE

3.6

Modelos fundacionales

Modelos fundacionales

La IA generativa parte de modelos básicos o fundacionales, es decir, grandes modelos de IA que pueden trabajar en varias tareas y llevar a cabo tareas preconfiguradas, como resúmenes, preguntas y respuestas, clasificación, etc. Además, al requerir una preparación mínima, los modelos fundacionales se pueden adaptar (fine-tuning) a casos prácticos por medio de entrenamiento. Los modelos fundacionales trabajan con múltiples tipos de datos. Son multimodales, es decir, funcionan en otros modos además del lenguaje. Por ejemplo, BERT, uno de los primeros modelos fundacionales bidireccionales, se lanzó en 2018. Se entrenó con 340 millones de parámetros y un conjunto de datos de entrenamiento de 16 GB. En 2023, solo cinco años después, OpenAI entrenó el GPT-4 mediante la utilización de 170 billones de parámetros y un conjunto de datos de entrenamiento de 45 GB.

ÍNDICE

ÍNDICE

Modelos fundacionales

Los modelos fundacionales actuales, como los modelos de lenguaje de gran tamaño (LLM), GPT, Claude y Llama, y el modelo de conversión de texto a imagen (Stable Diffusion de Stability AI), pueden realizar una serie de tareas que abarcan múltiples dominios, como escribir publicaciones de blog, generar imágenes, resolver problemas matemáticos, entablar diálogos y responder preguntas basadas en un documento. Estos modelos fundacionales están hoy en día disponibles para poder ser utilizados y entrenados para tareas específicas. Es así que estamos vivenciando un gran auge de muchas aplicaciones de IA generativa, que parten del alquiler de uno de estos modelos fundacionles para luego aplicar sobre ellos una serie de entrenamientos.

Fine-tuning

ÍNDICE

ÍNDICE

¿Qué es un LLM?

Los large language models (LLM, modelos de lenguaje de gran tamaño) son una clase de modelo fundacional que existe antes de los nuevos surgimientos de los desarrollos de la IA generativa. En pocas palabras, los LLM están diseñados para comprender y generar texto como un humano, además de otras formas de contenido, basándose en la enorme cantidad de datos utilizados para entrenarlos. Tienen la capacidad de inferir del contexto, generar respuestas coherentes y pertinentes para el contexto, traducir a distintos idiomas, resumir texto, responder preguntas (conversación general y preguntas frecuentes) e incluso ayudar en tareas de escritura creativa o de generación de código.

Los modelos fundacionales de tipo LLM pueden adaptarse muy rápidamente (en cuestión de minutos) a una gran diversidad de tareas como chat, redacción, traducciones, resúmenes, lluvias de ideas, generación de código, correcciones, poemas, redacción de emails, etc.

ÍNDICE

ÍNDICE

¿Qué es un LLM?

Por ejemplo, los modelos de generative pre-trained transformer (GPT, transformadores generativos preentrenados) de OpenAI son modelos fundacionales del tipo LLM. Otros LLM usados son Gemini (desarrollado por Google) o Llama 2 (desarrollado por Meta). Lo que hace que los LLM sean especiales es su capacidad para realizar múltiples tareas. Pueden hacerlo porque contienen muchos parámetros que los hacen capaces de aprender conceptos avanzados. Un LLM como el GPT-3 puede considerar miles de millones de parámetros y tiene la capacidad de generar contenido a partir de muy pocas entradas. A través de su exposición previa al entrenamiento con datos a una gran escala como es Internet (en todas sus diversas formas y una inmensidad de patrones), los LLM aprenden a aplicar sus conocimientos en una amplia gama de contextos.

ÍNDICE

ÍNDICE

3.7

Técnicas utilizadas por los modelos generativos

Técnicas utilizadas por los modelos generativos

Cada modelo cuenta generalmente con alguna técnica en especial para generar contenidos. Hoy en día existen varias técnicas, que son básicamente modelos matemáticos que buscan optimizar y eficientizar los resultados producidos por la IA generativa. Los principales son los siguientes:

VAE
Difusión
GAN

ÍNDICE

ÍNDICE

3.8

Prompt engineering

¿Qué es el prompt engineering?

El Prompt Engineering es una práctica esencial en el uso eficiente de modelos generativos de lenguaje, enfocada en crear y optimizar instrucciones claras y específicas para guiar al modelo en la realización de tareas particulares. Implica diseñar prompts que se ajusten a la naturaleza de la tarea deseada, con el fin de mejorar la capacidad del modelo para interpretar y responder con precisión a las solicitudes de los usuarios.

Haz clic en el ícono del audio para escuchar la definición completa de Prompt Engineering.

Haz clic aquí para ver la transcripción del audio

ÍNDICE

ÍNDICE

ÍNDICE

La IA puede alucinar

Las alucinaciones son un fenómeno que pueden experimentar varios seres vivos y no solo los seres humanos. Las alucinaciones son percepciones que ocurren en ausencia de un estímulo externo que lo desencadene, teniendo quien la padece la sensación de que ésta es real y que ocurre sin que el individuo pueda controlarla. Ahora bien, cuando se habla de alucinaciones en el mundo de la IA generativa se toma este mismo concepto para referirse a que, a la hora de generar contenidos, muchas veces la IA generativa produce resultados muy alejados de lo esperado.

Por ejemplo, si la generación es text-to-text, pueden aparecer oraciones sin sentido, palabras inventadas o con errores gramaticales. Lo mismo puede suceder con la generación de imágenes, donde quizás el resultado es muy alejado de lo que se desea obtener.

ÍNDICE

ÍNDICE

La IA puede alucinar

Factores que pueden generar alucinaciones
¿Por qué son un problema las alucinaciones?
¿Cómo prevenir las alucinaciones?

ÍNDICE

ÍNDICE

3.9

Mito

"Todos construimos la IA"

¡ANALICEMOS ESTE MITO!

ÍNDICE

¡FALSO!

"Todos contruimos la IA"

Hace unos momentos trabajamos sobre el concepto del código abierto, entendiendo que hay casos en los que el desarrollo de software se “democratiza” y co-construye, promoviendo la colaboración y la transparencia. Pero, ¿eso significa que todos construimos la IA? El código abierto posibilita el acceso a la fuente, logrando una comprensión profunda sobre el funcionamiento de la tecnología y permite que la misma pueda ser modificada para adaptarse a otros entornos o distribuida por cualquier persona. La comunidad del código abierto promueve la democratización del conocimiento al facilitar el uso de la tecnología a un público más amplio. El mito sugiere una participación universal en el desarrollo de la IA. Sin embargo, la realidad es más matizada. Es cierto que los proyectos de código abierto permiten a una amplia comunidad de desarrolladores, investigadores y entusiastas contribuir al avance de la IA. Esta colaboración democratiza el acceso a la tecnología y fomenta la innovación al permitir que individuos de diversas partes del mundo y con distintos niveles de experiencia aporten su conocimiento y habilidades. Sin embargo, afirmar que todos construimos la IA puede ser engañoso.

ÍNDICE

ÍNDICE

¡FALSO!

¿Por qué puede ser engañoso afirmar que todos construimos la IA? La participación en el desarrollo de IA, especialmente en niveles avanzados, requiere un conjunto específico de habilidades técnicas, acceso a recursos computacionales significativos y, a menudo, una comprensión profunda de conceptos matemáticos y algorítmicos complejos. Estas condiciones no están distribuidas equitativamente a nivel global, lo que resulta en una participación desigual en la construcción de estas tecnologías. Además, la contribución efectiva al desarrollo de la IA a menudo está influenciada por la disponibilidad de datos, que puede estar limitada o sesgada según el contexto. Por lo tanto, aunque la colaboración abierta expande el alcance de quién puede contribuir al desarrollo de la IA, sigue habiendo barreras significativas que limitan la participación universal efectiva.

ÍNDICE

ÍNDICE

3.10

¡Manos a la obra!

Manos a la obra

Te invitamos a ver el siguiente video (hasta el minuto 9:27) donde se resume que es la IA generativa y donde se presentan algunos casos de usos posibles.

1.

ÍNDICE

Manos a la obra

Ahora que has visto el video, te invitamos a que en el espacio de foro, puedas compartir: a. ¿Qué preguntas te surgieron al ver la presentación? b. ¿Qué casos de uso te parecen que pueden ser útiles o interesantes? ¿Se te ocurren otros casos de usos posibles? ¿En qué situaciones?

2.

ÍNDICE

CLASE 4

4.5 Introducción a ChatGPT

4.1 Calentando motores

4.6 Tips y Recomendaciones

4.2 Pensamiento Computacional

4.7 Mito

4.3 Elementos de un prompt

4.4 Reconociendo elementos de un Prompt

4.8 Manos a la obra (opcional)

4.1

Calentando motores

ÍNDICE

Para comenzar el recorrido asincrónico de la Clase 4, te proponemos realizar un breve "Verdadero o Falso" sobre los temas vistos en la Clase 4 sincrónica. ¡Es solo a modo de ir entrando en calor y haciendo trabajar nuestras neuronas! 🥰 No importa si te equivocas, recuerda que el error es siempre parte necesaria del aprendizaje. 🙌 ¿Comenzamos?

Calentando motores

* Esta imagen fue creada mediante el uso de Inteligencia Artificial Generativa (Microsoft Copilot)

ÍNDICE

4.2

Pensamiento computacional

ÍNDICE

Pensamiento Computacional

Jeannette Wing (2006), una de las primeras referentes en lo que respecta al Pensamiento Computacional, lo define como una forma de resolver problemas y diseñar sistemas basándose en los conceptos fundamentales de las Ciencias de la Computación. Esto Implica que ante un problema se lo aborda mediante la utilización del razonamiento lógico. El Pensamiento Computacional se basa en cuatro pilares fundamentales:

PATRONES

DESCOMPOSICIÓN

ALGORITMOS

ABSTRACCIONES

ÍNDICE

Pensamiento Computacional

ÍNDICE

¿Cómo puede el Pensamiento Computacional ayudarnos a crear mejores prompts?

El Pensamiento Computacional es una poderosa estrategia para resolver problemas de manera efectiva y eficiente, y su aplicación puede ser de gran utilidad al generar prompts más sólidos para interactuar con distintas IA generativas. Al utilizar el Pensamiento Computacional para mejorar nuestros prompts nos enfocamos en el objetivo principal: comunicarnos de manera clara y precisa con un sistema de inteligencia artificial. Este objetivo puede parecer sencillo a primera vista, pero a medida que aumenta la complejidad de nuestras consultas y requerimientos se vuelve crucial aplicar un enfoque estructurado y basado en procesos. Es aquí donde los cuatro pilares del Pensamiento Computacional entran en juego, ofreciéndonos una metodología sólida para descomponer el problema, reconocer patrones exitosos, generar abstracciones útiles y desarrollar algoritmos efectivos para la creación de prompts.

ÍNDICE

¿Cómo puede el Pensamiento Computacional ayudarnos a crear mejores prompts?

Mediante la Descomposición en subproblemas podemos abordar aspectos específicos como la definición del objetivo, la recopilación de información relevante, la estructura lógica de la consulta y la anticipación de posibles ambigüedades. Al dividir el problema en partes más manejables es más fácil enfocarse en los detalles importantes y encontrar soluciones efectivas para cada componente. El Reconocimiento de patrones nos permite identificar y aprovechar las mejores prácticas en la formulación de prompts, aprendiendo de ejemplos exitosos y adaptando estrategias probadas a nuestras propias consultas. Esto nos ayuda a evitar errores comunes y a aprovechar el conocimiento previo en lugar de reinventar la rueda. La Generación de abstracciones nos permite extraer los elementos esenciales de un buen prompt, como la claridad, la concisión, la relevancia y la especificidad. Al centrarnos en estas abstracciones, podemos diseñar prompts más generales y escalables, que puedan aplicarse a una amplia gama de situaciones y consultas.

ÍNDICE

¿Cómo puede el Pensamiento Computacional ayudarnos a crear mejores prompts?

El desarrollo de Algoritmos o procesos sistemáticos nos brinda un enfoque riguroso y replicable para crear prompts de alta calidad. Un algoritmo es una secuencia lógica y ordenada de pasos que nos guía desde una situación inicial hasta un resultado deseado. Un ejemplo sencillo sería una receta de cocina, donde se enumeran los pasos a seguir de manera secuencial para elaborar un plato específico. En el contexto de generar prompts efectivos, estos algoritmos pueden incluir pasos como definir el objetivo preciso, recopilar la información relevante, organizar los datos de manera lógica, formular preguntas claras y específicas, y revisar la consulta para detectar ambigüedades o posibles malentendidos.

ÍNDICE

¿Cómo puede el Pensamiento Computacional ayudarnos a crear mejores prompts?

Es importante destacar que existen múltiples caminos posibles para llegar de un punto A a un punto B, y algunos serán más eficientes que otros. En el campo del aprendizaje automático (Machine Learning), se utilizan algoritmos de optimización para encontrar los valores óptimos de los parámetros del modelo, lo que permite identificar la ruta más eficiente hacia el resultado deseado. El desarrollo de algoritmos sistemáticos nos brinda un enfoque estructurado y repetible para crear prompts de alta calidad, asegurando que nuestras consultas sean claras, concisas y efectivas. Además, el Pensamiento Computacional nos enseña a buscar constantemente la optimización y la mejora continua en nuestros procesos, lo que nos permitirá perfeccionar nuestras habilidades y obtener resultados cada vez más satisfactorios.

ÍNDICE

4.3

Elementos de un prompt

ÍNDICE

Elementos de un prompt

Un prompt bien estructurado es fundamental para obtener resultados precisos y relevantes de un chatbot con IA. Para comenzar, hay que considerar los distintos elementos que idealmente componen a un prompt:

DATOS DE ENTRADA

CONTEXTO

RESTRICCIONES

INSTRUCCIÓN Y FORMATO

Se recomienda explorar el siguiente enlace, donde hay mayor información sobre los elementos de un prompt y ejemplos: https://gamma.app/public/Prompt-k6w8qciew2o2uhd?mode=doc

ÍNDICE

4.4

Reconociendo elementos de un prompt

ÍNDICE

4.5

Introducción a Chat GPT

ÍNDICE

Introducción a ChatGPT

ChatGPT es una herramienta desarrollada por OpenAI. Es un modelo avanzado de procesamiento de lenguaje natural basado en la arquitectura GPT (Generative Pre-trained Transformer) que utiliza Deep learning para generar respuestas coherentes y naturales a los textos que ingresan las personas que utilizan la plataforma. Este modelo de lenguaje fue entrenado para comprender y generar texto de una manera conversacional y abierta.

ÍNDICE

Introducción a ChatGPT

ChatGPT fue lanzada en noviembre de 2022 y se convirtió en una de las herramientas más populares de IA generativa. Esto se debió en parte a su estructura de conversación simple, conocida como chatbot, en la cual el sistema entiende y produce un diálogo conversacional. Con respecto a su entrenamiento es importante aclarar que ChatGPT se entrenó con datos hasta finales del 2021. Este entrenamiento contó con 2 fases. La fase 1 fue aprendizaje supervisado, extrayendo los datos de distintos sitios de internet; y la fase 2 fue a través de aprendizaje por refuerzo, es decir, mediante la interacción con humanos.

ÍNDICE

Introducción a ChatGPT

ÍNDICE

4.6

Tips y recomendaciones

ÍNDICE

Tips y Recomendaciones

La principal recomendación para elaborar buenos prompts es utilizar un lenguaje consiso y claro, con instrucciones o preguntas específicas y dar la mayor cantidad de información posible para que el modelo de IA generativa pueda ajustar su respuesta a tus expectativas. A continuación les compartimos algunas recomendaciones más detalladas para lograr mayor claridad en un prompt.

ÍNDICE

Tips y Recomendaciones

DAR CONTEXTO

  • Especificar el “rol” para obtener respuestas desde la perspectiva correcta.
    • Ej: “Eres un senador y necesitas...”, “Eres especialista en la temática...”
  • Especificar cuál será la audiencia, es decir, a quién va dirigida la respuesta para que se adapte a los niveles de comprensión y estilo de la audiencia
    • Ej: “Explicale a un niño de 5 años...”

ÍNDICE

Tips y Recomendaciones

ELABORAR INSTRUCCIONES Y ESPECIFICACIONES

  • Cadena de pensamiento: Incluir una cadena de pensamiento que refleje cómo debería ser alcanzada la respuesta correcta a una pregunta. Seria explicitarle al modelo cómo queremos que vaya pensando la resolución del problema.
  • Para evitar alucinaciones:
    • Decir “No inventes nada al contestar” o pidiéndole al modelo que utilice fuentes confiables y las cite.
    • Dar la posibilidad a la IA de pensar antes de responder, darle tiempo.
    • Chequear la comprensión del modelo (“¿Entendiste mis instrucciones?”)

ÍNDICE

Tips y Recomendaciones

ESPECIFICAR EL RESULTADO DESEADO

  • Especificar el largo (extensión) que queremos que tenga la respuesta.
    • “En no más de 100 palabras”, “En un párrafo...”
  • Especificar en qué tono se quiere la respuesta
    • “Responder con un tono amigable y comprensivo”; “Responder de manera clara y concisa, sin utilizar un lenguaje técnico”.
  • Especificar en qué estilo o formato se quiere la respuesta
    • Ej: “Realiza un punteo que sintetice...”; “En formato de twitter...”

ÍNDICE

Tips y Recomendaciones

ESPECIFICAR EL RESULTADO DESEADO

  • Few-shot learning (ofrecer algunos ejemplos de salida): Cuando se incluyen ejemplos de posibles salidas/respuestas que permiten que el modelo de IA generativa interprete mejor la instrucción que se está especificando en el prompt.

ÍNDICE

Tips y Recomendaciones

ITERAR

  • Intentar diversos prompts para ver cuál funciona mejor.
  • Intentar incluir instrucciones más y más directas.
  • Reformular una instrucción directa para que sea más o menos concisa.
  • Intentar diversos “roles” para ver cómo cambia el estilo de la respuesta.
  • Utilizar más y menos ejemplos.

ÍNDICE

4.7

Mito

ÍNDICE

"La IA es perjudicial para el medio ambiente"

¡ANALICEMOS ESTE MITO!

ÍNDICE

¡DEPENDE!

¿Es la IA es perjudicial para el medio ambiente?

Como hemos visto en la Clase 2, donde vivenciamos el ciclo de vida de la IA mientras desarrollábamos un modelo para distinguir manzanas, notamos que el proceso de entrenamiento requiere de mucho trabajo. Este proceso exige un número enorme de computadoras de alta potencia o GPU (graphics processing unit, por sus siglas en inglés) que procesan enormes cantidades de datos días y noches durante semanas o hasta meses. Es en esta etapa, la de entrenamiento, donde se consume la mayor parte de los recursos.

ÍNDICE

¡DEPENDE!

La IA consume electricidad principalmente a través de los centros de datos que albergan los servidores y las infraestructuras necesarias para ejecutar algoritmos de IA. Estos centros de datos requieren una gran cantidad de electricidad no solo para alimentar los servidores, sino también para enfriar las instalaciones, ya que los servidores generan mucho calor durante su funcionamiento. La creciente complejidad de las aplicaciones que se usan diariamente exigen más y más potencia de cálculo. Todo eso se traduce en legiones de computadoras funcionando a máxima potencia día y noche, cuyo consumo energético ya representa como mínimo el 2% del total mundial. Para que las máquinas no se sobrecalienten hace falta refrigerarlas. Se puede hacer con sistemas de ventilación, pero es más barato enfriar los procesadores con agua.

ÍNDICE

¡DEPENDE!

Los centros de datos tienen el aspecto de naves industriales que constan de varias salas. En cada una de ellas hay hileras de racks (torres de computadoras de la altura de un armario). Estas hileras están dispuestas en pasillos, de modo que los operarios puedan manipular los circuitos de cada máquina. Los servidores emiten calor cuando funcionan. La concentración de tantas computadoras en un mismo lugar hace que ese efecto sea más intenso. Muchos centros de datos recurren a torres de refrigeración para evitar el sobrecalentamiento, el mismo sistema empleado en otras industrias. Se basa en exponer un caudal de agua a una corriente de aire en un intercambiador de calor, de manera que la evaporación enfríe el circuito.

ÍNDICE

¡DEPENDE!

Es difícil establecer cuál es el consumo medio de agua en un centro de datos. Los que están en climas más fríos necesitan menos refrigeración que el resto. De la misma manera, la exigencia de agua es distinta en las épocas más calurosas del año que en las más gélidas. Necesitan, eso sí, usar agua limpia y tratada para evitar atascos o el crecimiento de bacterias en las tuberías. Cuando se emplea agua del mar o recuperada, hay que depurarla antes de meterla en los sistemas de refrigeración. Lamentablemente, mucha de esta agua usada, es agua potable para el consumo humano.

ÍNDICE

¡DEPENDE!

Los centros de datos solían estar en las ciudades, pero las crecientes necesidades energéticas de estas infraestructuras las han expulsado del entorno urbano, incapaz de abastecerlas. Necesitan también una ubicación segura, que cuente con un suministro estable de electricidad y que no tenga riesgo de catástrofe climática. Por todo eso, en las últimas dos décadas se han ido a la periferia. Incluso, Microsoft ha desarrollado servidores sumergibles que se encuentran en el fondo de algunos océanos.

ÍNDICE

¡DEPENDE!

La Inteligencia Artificial (IA) y la tecnología en general requieren una variedad de minerales para su funcionamiento. Estos minerales se utilizan en la fabricación de componentes electrónicos y hardware que son esenciales para los dispositivos y sistemas de IA. La fabricación de hardware especializado para la IA, como unidades de procesamiento gráfico (GPU) y circuitos integrados específicos de la aplicación (ASIC), puede generar residuos y contaminación durante su proceso de producción. Además, la extracción de los materiales necesarios para fabricar estos componentes puede tener impactos ambientales negativos, como la degradación del suelo y la contaminación del agua.

ÍNDICE

¡DEPENDE!

Ahora bien, hemos repasado y comprendido el impacto que tiene el desarrollo y uso de la IA en el medio ambiente. Pero si bien es un gran impacto, ¿qué nuevas posibilidades trae para el cuidado del medio ambiente? ¿Son acaso estas nuevas posibilidades justificables ante tal impacto?

ÍNDICE

4.8

Manos a la obra

ÍNDICE

Manos a la obra

Te invitamos a compartir en el espacio de foro cómo crearias un prompt para resolver alguna situación de tu vida cotidiana o laboral.

1.

Te invitamos a leer los prompts generados por el resto de participantes en el foro y que puedas comentar identificando qué elementos utilizaron (contexto, datos de entrada, instrucción, formato de salida y restricciones.)

2.

ÍNDICE

PARASEGUIR EXPLORANDO 🚀

ÍNDICE

Para seguir explorando

¿Qué es la IA generativa?

Introducción a la IA Generativa

Modelos de difusión

Modelos fundacionales

Qué son los modelos LLM

Qué es Prompt Engineering - Microsoft

ÍNDICE

UNIDAD 2 ASINCRÓNICO

Actores del mundo de la IA Generativa

Financiamiento de la IA

También debemos considerar la financiación de la IA, que proviene de diversas fuentes desde capitales de riesgo o financiación corporativa hasta gobiernos y fondos públicos.

¿Qué es prompt engineering?

Es muy importante entender que hay un actor fundamental a la hora de utilizar modelos de IA: el usuario final. Como vimos anteriormente, quienes hagan uso de un modelo de IA deberá elaborar un prompt (una instrucción) para indicarle al modelo qué se precisa. Esta instrucción o conjunto de instrucciones que le damos al modelo pueden alterar el resultado que obtengamos. En otras palabras, la naturaleza y estructura del prompt pueden influir significativamente en la calidad y relevancia de la respuesta del modelo. La calidad del prompt (entrada), determina la calidad de la respuesta (salida). Por eso, la elaboración de prompts efectivos es considerada una habilidad importante al trabajar con LLMs. Esto nos lleva al concepto de Prompt Engineering, que es la práctica de crear y optimizar prompts para usar de forma más eficiente un LLM y guiarlo para que realice una tarea específica. Esta práctica implica un proceso cuidadoso de diseño de instrucciones que sean claras, concisas y adaptadas a la naturaleza particular de la tarea deseada. Esto es fundamental para mejorar la capacidad de los modelos de lenguaje para interpretar y responder de manera precisa a las solicitudes de los usuarios o a las especificaciones de la tarea.

MODELOS: Entradas y salidas

De imagen a otros formatos

Hasta el momento, existen diversos modelos que a partir de una imagen, pueden generar resultados en diversos formatos: Salida/Resultado: texto

  • Descripción de imágenes
  • Respuestas visuales a las preguntas
  • Búsqueda de imágenes
Salida/Resultado: imagen
  • Gran resolución
  • Completar imágenes
Salida/Resultado: video
  • Animación

la ia puede alucinar

Las alucinaciones son un problema por varias razones:

Precisión de la información: Puede producir información que es incorrecta o engañosa, lo que contribuye a la propagación de desinformación. Expectativas de los usuarios: Los usuarios de modelos de IA a menudo esperan respuestas precisas y coherentes, por lo que puede dañar su confianza en la tecnología. Usos críticos: Cuando se utilizan en contextos críticos, como la medicina, el derecho o la seguridad, pueden tener consecuencias graves y potencialmente peligrosas. Calidad del diálogo: Pueden llevar a respuestas que son irrelevantes o que no siguen la línea de la conversación, lo que afecta la calidad del diálogo y puede resultar en una mala experiencia de usuario.

Cómo funcionan los modelos
Escenario 2

En el segundo escenario, imaginemos que eres una persona que puede cocinar pero no al nivel de chef. Podrías comprar la torta en polvo que viene en caja y que se vende en el supermercado, harías toda la receta y luego la decorarías maravillosamente al final. Volviendo a la analogía, en este caso estamos hablando de una persona con conocimientos razonables de tecnología. Utilizaría modelos ya preparados de repositorios de código abierto como GitHub y perfeccionaría este modelo para llegar al objetivo final.

TÉCNICAS UTILIZADAS POR LOS MODELOS GENERATIVOS

Técnica de difusión

Los modelos que utilizan la técnica de difusión crean nuevos datos realizando, de forma iterativa, cambios aleatorios controlados en una muestra de datos inicial. Empiezan con los datos originales y añaden cambios sutiles (ruido), haciendo que pierdan la similitud con el original progresivamente. Este ruido se controla cuidadosamente para garantizar que los datos generados sigan siendo coherentes y realistas. Tras añadir ruido en varias iteraciones, el modelo de difusión invierte el proceso. La eliminación de ruido inversa elimina gradualmente el ruido para producir una nueva muestra de datos que se parezca a la original.

Cómo funcionan los modelos
Escenario 3

En el tercer escenario, imaginemos que no posees ninguna habilidad gastronómica y entonces decides comprar una torta ya hecha y decorada en la pastelería. Volviendo a la analogía, se trataría de alguien sin conocimientos técnicos, pero que quiere aprovechar las ventajas de la IA generativa. Esta persona podría simplemente subscribirse a una herramienta como ChatGPT o utilizar Copilot en los distintos productos de Microsoft.

modelos generativos dE IMAGEN

Ejemplo de instrucción escrita

Si a un modelo generativo de imagen se le envía una instrucción escrita que dice “Necesito que diseñes un logo para mi emprendimiento. El mismo se llama Natural Food y es una tienda online de venta de productos saludables y orgánicos. Asimismo, el logo debe tener como imagen principal una vaca sonriente y el estilo debe ser moderno” La IA generativa podría producir algo similar a las siguientes imagenes:

ELEMENTOS QUE COMPONEN A UN PROMPT

Instrucción y formato de salida

Aquí es donde se le indica a la IA lo que se espera obtener como respuesta. Es importante especificar también el formato, sin embargo si no se necesita un formato en particular se puede omitir. Algunos formatos pueden ser: listas, bullets/viñetas, etc. Por ejemplo: "Elabora una lista de cinco riesgos comunes que pueden afectar el proyecto y propón medidas para mitigarlos." En este ejemplo sí se especifica el formato (lista). Otro formato que podría servir en este ejemplo es tabla.

PILARES DEL PENSAMIENTO COMPUTACIONAL

Generación de abstracciones

Es la capacidad de identificar y extraer características esenciales de un problema, ignorando los detalles irrelevantes. Las abstracciones nos permiten simplificar los problemas complejos y representarlos de manera más general y comprensible. Esta habilidad es fundamental para el diseño de soluciones escalables y reutilizables.

https://rea.ceibal.edu.uy/elp/pensamiento-computacional-microbit/abstraccin.html

MODELOS FUNDACIONALES

Fine-tuning (ajuste)

Los modelos fundacionales, como los desarrollados por OpenAI, proporcionan una base sólida y versátil para la creación de herramientas específicas mediante el proceso de fine-tuning (ajuste). Este método consiste en ajustar un modelo preexistente a través de un entrenamiento adicional con un conjunto de datos más especializado, permitiendo que el modelo adquiera habilidades o conocimientos particulares. Un ejemplo destacado de esta aplicación es Microsoft Copilot, que se construye sobre el modelo de OpenAI y fue ajustado para integrarse y mejorar la productividad con el buscador Bing y herramientas de Office como Word, Excel, PowerPoint, etc. Este proceso no solo optimiza el rendimiento del modelo en tareas específicas, sino que también lo hace más relevante para aplicaciones concretas. Así, el fine-tuning transforma un modelo fundacional en una solución adaptada a necesidades específicas, ampliando su utilidad y eficacia en contextos particulares.

PILARES DEL PENSAMIENTO COMPUTACIONAL

Descomposición en subproblemas

Es la capacidad de dividir un problema complejo en partes más pequeñas y manejables. Al descomponer un problema en subproblemas más simples es más fácil de abordarlos y resolverlos por separado. Esta habilidad es fundamental para abordar problemas complejos de manera sistemática y organizada.

https://rea.ceibal.edu.uy/elp/pensamiento-computacional-microbit/descomposicin.html

MODELOS: ENTRADAS Y SALIDAS

Comercialización y distribución de la IA

Por último, una vez desarrolladas las tecnologías de IA, son comercializadas y distribuidas por una amplia gama de empresas. Desde gigantes tecnológicos hasta startups innovadoras, pasando por proveedores de plataformas en la nube como Amazon Web Services (AWS), Microsoft Azure, Google Cloud y otras. Hoy en día también existen muchas empresas de software y tecnología proveen aplicaciones y herramientas que incorporan IA destinadas a sectores específicos como la salud, finanzas, comercio electrónico, y más.

MODELOS: ENTRADAS Y SALIDAS

De texto a otros formatos

Modelos text-to-text ("texto-a-texto") Los modelos text-to-text son aquellos que como insumo reciben texto (entrada/input) y como resultado de salida (output) generan texto. Algunos usos útiles de este tipo de modelos son para generer resúmenes de textos, traducciones, adaptaciones de estilos, extracción de datos relevantes, reescritura, clasificación, etc. Modelos text-to-image (“texto-a-imagen") Los modelos de text-to-image son entrenadas con una gran cantidad de imágenes, algunas acompañadas con una breve descripción. Estos modelos son útiles para generar o editar imágenes, por ejemplo eliminar fondos y hacer recortes de personas u objetos. También para generar bocetos de logos o manuales de identidad de una marca. Incluso se pueden utilizar para generar fondos de pantalla, personajes, etc.

Otros ejemplos:

  • Texto-a-audio
  • Texto-a-decisión (Ej: Videojuego)

TÉCNICAS UTILIZADAS POR LOS MODELOS GENERATIVOS

Técnica VAE

Las siglas corresponden a Variational Autoencoder (en español, Autocodificadores Variacionales). Estos modelos se pueden usar para detectar anomalías enseñando a un modelo un conjunto de datos normales y luego usándolo para identificar instancias que se desvíen de los datos normales. Sirven para detectar anomalías en una amplia variedad de situaciones, como detectar fraude en transacciones financieras, fallos en la fabricación o brechas de seguridad en una red.

modelos generativos de IMAGEN

Ejemplo de instrucción con imagen

Los modelos generativos de imágenes también pueden recibir una imagen como insumo y con ello trabajar para generar una imagen nueva y similar. Generalmente, esto depende del modelo que se esté utilizando. A veces, algunos modelos aceptan recibir al mismo tiempo, tanto un prompt como una imagen. Aquí podemos ver un ejemplo de una instrucción junto a una imagen en la herramienta Copilot de Microsoft:

ELEMENTOS QUE COMPONEN A UN PROMPT

Contexto

Es la parte inicial del prompt. Aquí le indicas a la IA cómo debe de actuar y cuál es la situación que se está abordando en este momento. Se debe ser tan específico como sea posible y sin caer en redundancias. Por ejemplo: "Actúa como un gestor de proyectos experimentado. La empresa te ha asignado la tarea de supervisar un proyecto de desarrollo de software para un nuevo producto."

modelos generativos de lenguaje

Ejemplo

Un modelo de generación de lenguaje puede reconocer que siempre que se inicia una conversación, las personas dicen “Hola, ¿cómo estás?” y que la respuesta esperada suele ser “Bien, ¿y tú?”. Los modelos generativos de lenguaje no comprenden lo que generan, ya que funcionan constantemente analizando y prediciendo luego de cada palabra cuál es la que tiene mayores posibilidades de continuar. Podemos ver algo muy similar de esto cuando utilizamos un buscador como Bing, que a la hora de realizar una búsqueda intenta predecir lo que vamos a solicitar.

De forma muy similar, los modelos generativos de lenguaje constantemente, a la hora de recibir o generar texto, están analizado las probabilidades y tomando decisiones sobre cuál sería la palabra o carácter (comas, puntos, signos de interrogacción o exclamación) con mayor probabilidad que continue en una oración. Es de esta forma que modelos como GPT logran generar textos redactados de una forma que se vuelve difícil poder diferenciar si fue un humano quien lo redactó o si fue un modelo generativo de lenguaje.

TÉCNICAS UTILIZADAS POR LOS MODELOS GENERATIVOS

Técnica GAN

Las generative adversarial networks (GAN, red generativa adversativa) funcionan entrenando dos redes neuronales de manera competitiva. La primera red, conocida como generador, crea muestras de datos falsas añadiendo ruido aleatorio. La segunda red, denominada discriminador, trata de distinguir entre los datos reales y los datos falsos producidos por el generador. Durante el entrenamiento, el generador mejora continuamente su capacidad de crear datos realistas, mientras que el discriminador mejora su capacidad de diferenciar entre lo real y lo falso. Este proceso adversativo continúa hasta que el generador produce datos tan convincentes que el discriminador no puede diferenciarlos de los datos reales. Las GAN se utilizan ampliamente para generar imágenes realistas, transferir estilos y realizar tareas de aumento de datos.

Actores del mundo de la IA Generativa

Desarrollo de los componentes específicos de la IA

Luego está el desarrollo de componentes específicos como modelos de aprendizaje automático, algoritmos y plataformas de IA. Esto suele ser llevado a cabo por empresas especializadas en IA como NVIDIA y OpenAI, que además de investigar se dedican al desarrollo de modelos avanzados. También existen startups de IA que se enfocan en nichos específicos de IA como la visión informática, procesamiento de lenguaje natural, robótica, etc.

la ia puede alucinar

Algunos de los factores que pueden estar produciendo que el modelo genere alucinaciones son:

El modelo no fue entrenado con suficientes datos. El modelo fue entrenado con datos de baja calidad. El modelo no ha recibido suficiente contexto a la hora de recibir nuestra solicitud por medio de un prompt. El modelo no ha recibido suficientes restricciones a la hora de recibir el prompt.

PILARES DEL PENSAMIENTO COMPUTACIONAL

Reconocimiento de patrones

Implica la capacidad de identificar similitudes, regularidades y patrones en los datos o en los problemas. Reconocer patrones nos permite aprovechas soluciones existentes, generalizar y aplicar estrategias similares a problemas relacionados. Esta habilidad es esencial para optimizar soluciones y aprovechar el conocimiento previo.

https://rea.ceibal.edu.uy/elp/pensamiento-computacional-microbit/reconocimiento_de_patrones.html

PILARES DEL PENSAMIENTO COMPUTACIONAL

Generación de algoritmos

Un algoritmo es una secuencia de pasos lógicos y ordenados que se siguen para resolver un problema. Los algoritmos son esenciales en el Pensamiento Computacional ya que nos permiten expresar soluciones de manera precisa y ejecutable. La capacidad de diseñar, analizar y optimizar algoritmos es fundamental para resolver problemas de manera eficiente y efectiva.

https://rea.ceibal.edu.uy/elp/pensamiento-computacional-microbit/algoritmo.html

Actores del mundo de la IA Generativa

Investigación y desarrollo de la IA

Por un lado tenemos un sector que se dedica a la investigación y desarrollo en IA. Suelen ser empresas tecnológicas como Google a través de Google AI y DeepMind, OpenAI con ChatGPT o IBM, quien ha sido pionera en el desarrollo de IA con proyectos como Watson; universidades como el MIT (Instituto Tecnológico de Massachusetts), Stanford, y la Universidad de Cambridge son reconocidas por sus contribuciones a la investigación en IA; y laboratorios de investigación independientes y startups en constante exploración de nuevos horizontes de IA.

ELEMENTOS QUE COMPONEN A UN PROMPT

Restricciones

Es tan importante pedir qué debe hacer como aquellas cosas qué no debe hacer. Muchas veces obtenemos información que no nos sirve para nada. Este es un tipo de alucinación, y para evitarla, las restricciones pueden ser importantes para mejorar la respuesta. Por ejemplo: "No repitas mi pregunta, no te disculpes, no expliques lo que estás haciendo ni por qué. No hagas referencia a ti mismo. Límitate a contestar única y exclusivamente lo que te pregunté."

Cómo funcionan los modelos
Escenario 1

En el primer escenario, imaginemos que eres un chef. Como tienes todos los conocimientos técnicos sobre cómo hacer una torta, creas tu propia receta. Haciendo un paralelismo con un líder empresario que tiene un reto similar al de la torta, se necesita de una solución tecnológica. Como tiene un equipo de desarrolladores con experiencia, utiliza tecnologías de código abierto (explicaremos más adelante de qué se trata esto) y crea su propio modelo de IA generativa. Algunas de las empresas más conocidas que desarrollan modelos de IA generativa son OpenAI, META, NVIDIA, Google, etc. Estos modelos son desarrollados basados en años de investigación en aprendizaje automático.

la ia puede alucinar

La mejor forma de prevenir las alucinaciones es evitar que sucedan.

Acá les mostramos algunos pasos para que el modelo funcione de la manera mas óptima:

Utilizar datos de alta calidad Definir para qué vamos a utilizar el modelo de IA Limitar las respuestas Probar y refinar el sistema continuamente Confiar en el ojo humano

ELEMENTOS QUE COMPONEN A UN PROMPT

Datos de entrada

Son los datos relevantes con los que se cuenta en un inicio, su finalidad es que la IA conozca el entorno del problema a resolver. Hasta cierto punto, podrían formar parte del contexto sin embargo se han separado para clarificar más la fórmula. Por ejemplo: "Se espera que el proyecto dure seis meses y cuente con un equipo multidisciplinario."

¿Qué es la IA generativa?

Aprendizaje semi-supervisado

La IA generativa debe su existencia a la aparición de un nuevo tipo de aprendizaje que es el “Deep Learning” (Aprendizaje profundo). Es por esto que la IA generativa puede ser ubicada como un subconjunto del Deep Learning. Esto significa que la IA generativa, para poder generar contenidos, necesita utilizar la tecnología de redes neuronales artificiales. Gracias a este revolucionario invento de las redes neuronales artificiales, la IA puede analizar patrones muy complejos y cuenta con la posibilidad de ser entrenada de una forma muy innovadora y potente, utilizando datos estructurados y no estructurados. A este tipo de aprendizaje, que utiliza redes neuronales y datos estructurados y no estructurados, se lo conoce como aprendizaje semisupervisado. En este tipo de aprendizaje, al modelo de IA se lo entrena con una pequeña cantidad de datos etiquetados y una gran cantidad de datos no etiquetados. Los datos etiquetados, ayudan a la red neuronal a aprender los patrones básicos, mientras que los datos sin etiquetas ayudan a la red neuronal a construir generalizaciones y nuevos ejemplos. Es importante recordar que siempre es el ser humano quien decide con que datos estructurados y no estructurados va a entrenar su modelo de IA.