Want to create interactive content? It’s easy in Genially!

Over 30 million people create interactive content in Genially.

Check out what others have designed:

Transcript

SEMANA 10

Entornos y ambientes colaborativos + MLOps

MLOps (Machine Learning Operations) se refiere a la práctica de integrar y aplicar principios de desarrollo de software a proyectos de Machine Learning.

  • Su objetivo es crear un ciclo de vida efectivo y repetible para modelos de Machine Learning, abarcando desde la creación hasta la implementación y el monitoreo.
  • MLOps ayuda a resolver problemas como la falta de comunicación entre equipos de desarrollo y operaciones, permitiendo una colaboración más fluida.
Importancia:
  • Al implementar MLOps, se busca reducir el tiempo de desarrollo y mejorar la calidad de los modelos al estandarizar procesos, mejorar la trazabilidad y facilitar la colaboración.

Introducción a MLOps

El ciclo de vida de MLOps incluye varias etapas críticas:

  • Desarrollo: Crear y entrenar el modelo con un enfoque en el preprocesamiento de datos, la selección de características y el ajuste del modelo.
  • Pruebas: Validar el modelo con datos no vistos para garantizar su rendimiento y robustez.
  • Despliegue: Implementar el modelo en un entorno de producción, utilizando contenedores o servicios de nube.
  • Monitoreo: Realizar un seguimiento continuo del rendimiento del modelo y de la calidad de los datos.
  • Mantenimiento: Actualizar y reentrenar el modelo según sea necesario, adaptándose a cambios en el entorno.

Ciclo de vida

  • Tener control del gobierno y el ciclo de vida de los proyectos
  • Integración ágil entre ingeniería de datos y ciencia de datos
  • Versatilidad en ambientes y lenguajes de programación
  • Capacidades de trabajo colaborativo
  • Desarrollo de código
  • Manejo de experimentos y versiones
  • Facilidad de puesta en producción
  • Monitoreo para mejora continua
  • Documentación

Ventajas de aplicación

  • Los ambientes colaborativos permiten a los equipos trabajar de manera conjunta y efectiva en proyectos de Machine Learning y Ciencia de Datos.
  • Estas plataformas son fundamentales para la gestión de proyectos, la comunicación entre miembros del equipo y el uso compartido de recursos, lo cual es crucial en entornos de trabajo remotos o híbridos.
  • Las herramientas colaborativas incluyen desde plataformas de codificación hasta sistemas de gestión de proyectos.
Toolkit
  • Uso de GitHub para almacenar el código y realizar revisiones por pares.
  • Uso de Slack o Microsoft Teams para la comunicación en tiempo real y actualizaciones rápidas entre los miembros del equipo.
  • Notion o Trello para gestionar tareas y hacer seguimiento del progreso del proyecto.

Ambientes colaborativos

  • Git es un sistema de control de versiones distribuido que permite a los desarrolladores rastrear cambios en el código y colaborar sin conflictos.
  • Los beneficios de usar Git incluyen la posibilidad de trabajar en diferentes ramas (branches), lo que permite experimentar sin afectar la base de código principal.
  • GitHub es una plataforma que facilita la gestión de repositorios Git, proporcionando herramientas para revisiones de código, seguimiento de problemas y documentación.
  • Comandos básicos de Git
git init # Inicializa un nuevo repositorio git clone # Clona un repositorio remoto git add . # Agrega todos los archivos al staging area git commit -m "Mensaje de commit" # Realiza un commit git push origin main # Envía cambios al repositorio remoto git pull origin main # Descarga y fusiona cambios del repositorio remoto

    Control de versiones

    • Google Colab es una herramienta en línea gratuita que permite escribir y ejecutar Python en un entorno de notebook.
    • Proporciona acceso a recursos de computación en la nube, incluyendo GPUs, lo que es ideal para entrenamiento de modelos de Machine Learning.
    • Es muy útil para colaboraciones en tiempo real, ya que permite que múltiples usuarios editen y ejecuten código simultáneamente.

    Google Collab

    Los Jupyter Notebooks son una herramienta popular que permite crear y compartir documentos que contienen código, ecuaciones, visualizaciones y texto explicativo.

    • Proporcionan un entorno interactivo que facilita la exploración de datos y la presentación de resultados.
    • Su capacidad para incluir celdas de código y Markdown permite documentar el proceso de análisis y compartirlo fácilmente con otros.

    Jupyter Notebooks

    Databricks

    Revisar especificaciones del proyecto

    Proyecto Final

    Este material digital es propiedad de la Universidad Rafael Landívar, se comparte por medio de una licencia Creative Commons CC BY-NC-ND del tipo "Atribución-No Comercial-Compartir igual", la cual permite copiar, distribuir y comunicar públicamente la obra, mientras se reconozca la autoría original, no se utilice con fines comerciales, ni se realicen obras derivadas. https://creativecommons.org/licenses/by-nc-nd/3.0/gt/