Want to create interactive content? It’s easy in Genially!

Reuse this genially

Metodología de Deep Learning

Ana Miguelena

Created on October 22, 2023

Start designing with a free template

Discover more than 1500 professional designs like these:

Timeline Diagram

Timeline Diagram 3

Timeline Diagram 4

Timeline Diagram 2

Triangle Diagram 3

Color Shapes SWOT

Lean Business Canvas

Transcript

Metodología de Deep Learning

No

DEsempeño satisfactorio

Guardar y utilizar modelo

Evaluación de desemepeño

Obtención de predicciones

Entrenamiento del modelo

Definición de HÍPerparámetros

Preparación de subconjuntos

Si se hace optimización

Procesamiento de datos

Si se usa Cross- validation

Descubrimiento de datos

Evaluación de desempeño

Utilizando las predicciones que se obtienen en el conjunto de prueba y las valores reales a los que corresponde (conocidos dado que don datos etiquetados), se pueden calcular diversas métricas que permiten evaluar em desempeño del modelo, para predecir con ejemplos que no ha visto antes (generalización). Algunas de las métricas más usadas son:

  • Precisión
  • Matriz de confusión
  • Sensibilidad
  • etc.

Guardar e utilizar el modelo

Si el modelo se evalúa con un desempeño suficiente o satisfactorio (criterio que debe ser establecido de acuerdo al problema y características de los datos). Este puede almacenarse para utilizarse con ejemplos de datos similares o bien en la resolución de problemas de clasificación y regresión en tiempo real.

Desempeño insatisfactorio

Si el valor que se obtiene con la precisión o cualquier otra métrica de evaluación es bajo para el objetivo que se quiere cumplir, será necesario replantear alguno de los pasos anteriores, por ejemplo

  • Obtener más datos.
  • Aplicar otra transformación a los datos u omitirla.
  • Seleccionar de otra forma el conjunto de entrenamiento (se puede resolver con Cross Validation)
  • Cambiar la estructura de la red, en número de capas o en la dimensión de las salidas
  • Agregar o modificar un método de regularización,
  • etc.

Procesamiento de datos

Involucra una serie de adecuaciones que se hacen al conjunto de datos con la finalidad de mejorar su desempeño en el entrenamiento del modelo. Algunas de estas transformaciones puden ser:

  • Detección y corrección de datos faltantes
  • Reducción de número de atributos (por redundancia o irrelevancia)
  • Balanceo de clases.
  • Conversión de tipo de datos (categórico a numérico)
  • Normalización
Tome en cuenta que también se puede hacer procesamiento de datos en las capas de modelo

Entrenamiento del modelo

Retropropagacion y descenso del graidente

En este proceso los parámetros (pesos y sesgos) de la red neuronal se actualizan con cada iteración. Estos valores se modifican con el objetivo de minimizar la función de pérdida, por lo que es importante verificar que este valor disminuya en cada iteración.

Utiliza el modelo para hacer predicciones

Una vez que se ha hecho el ajuste del modelo de red neuronal, se pueden utilizar para hacer predicciones en ejemplos o conjuntos de datos que no hayan sido utilizados durante el entrenamiento. Si los datos con lo que hace predicción son etiquetados (como lo sería en el conjunto de prueba) se utiliza para evaluar el ajuste del modelo.

Descubrimiento y descripción de datos

Esta fase abarca desde posiblemente recolectar los datos directamente del ambiente en que se plantea una problema de clasificación o regresión, o bien obtener un conjunto de datos previamente recolectado o utilizar un conjunto de datos de acceso abierto en Internet. También se considera en este paso la necesidad de conocer el origen de los datos, la descripción de sus atributos así como un análisis preliminar del tipo de datos y la distribución de éstos.

Asignación de hyperparámetros

  • Definición de una estructura para la red neuronal:
    • Número de capas
    • Tipo de capas
    • Dimensión de las salidas de las capas
  • Función del optimizador.
  • Función de error o pérdida.
  • Regularización
  • Número de épocas de entrenamiento
  • Tamaño de los paquetes (batch size)

Preparación de los conjuntos de datos

Y selección del atributo objetivo

Si el atributo objetivo es una variable numérica que se quiere predecir, se trata de un problema de regresión. Si el atributo objetivo es discreto y/o categórico, es un problema de clasificación. Si se tiene dos clases, es un problema de clasificación binario, pero si hay más clases se requiere hacer una codificación One-hot para manejar este tipo de problemas.

Al conjunto completo de datos, se le aplica una división al menos en Train y Test de manera que el conjunto de prueba no sea parte de los ejemplos que se usan para ajustar el modelo.