Want to create interactive content? It’s easy in Genially!
Metodología de Deep Learning
Ana Miguelena
Created on October 22, 2023
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Timeline Diagram
View
Timeline Diagram 3
View
Timeline Diagram 4
View
Timeline Diagram 2
View
Triangle Diagram 3
View
Color Shapes SWOT
View
Lean Business Canvas
Transcript
Metodología de Deep Learning
No
sí
DEsempeño satisfactorio
Guardar y utilizar modelo
Evaluación de desemepeño
Obtención de predicciones
Entrenamiento del modelo
Definición de HÍPerparámetros
Preparación de subconjuntos
Si se hace optimización
Procesamiento de datos
Si se usa Cross- validation
Descubrimiento de datos
Evaluación de desempeño
Utilizando las predicciones que se obtienen en el conjunto de prueba y las valores reales a los que corresponde (conocidos dado que don datos etiquetados), se pueden calcular diversas métricas que permiten evaluar em desempeño del modelo, para predecir con ejemplos que no ha visto antes (generalización). Algunas de las métricas más usadas son:
- Precisión
- Matriz de confusión
- Sensibilidad
- etc.
Guardar e utilizar el modelo
Si el modelo se evalúa con un desempeño suficiente o satisfactorio (criterio que debe ser establecido de acuerdo al problema y características de los datos). Este puede almacenarse para utilizarse con ejemplos de datos similares o bien en la resolución de problemas de clasificación y regresión en tiempo real.
Desempeño insatisfactorio
Si el valor que se obtiene con la precisión o cualquier otra métrica de evaluación es bajo para el objetivo que se quiere cumplir, será necesario replantear alguno de los pasos anteriores, por ejemplo
- Obtener más datos.
- Aplicar otra transformación a los datos u omitirla.
- Seleccionar de otra forma el conjunto de entrenamiento (se puede resolver con Cross Validation)
- Cambiar la estructura de la red, en número de capas o en la dimensión de las salidas
- Agregar o modificar un método de regularización,
- etc.
Procesamiento de datos
Involucra una serie de adecuaciones que se hacen al conjunto de datos con la finalidad de mejorar su desempeño en el entrenamiento del modelo. Algunas de estas transformaciones puden ser:
- Detección y corrección de datos faltantes
- Reducción de número de atributos (por redundancia o irrelevancia)
- Balanceo de clases.
- Conversión de tipo de datos (categórico a numérico)
- Normalización
Entrenamiento del modelo
Retropropagacion y descenso del graidente
En este proceso los parámetros (pesos y sesgos) de la red neuronal se actualizan con cada iteración. Estos valores se modifican con el objetivo de minimizar la función de pérdida, por lo que es importante verificar que este valor disminuya en cada iteración.
Utiliza el modelo para hacer predicciones
Una vez que se ha hecho el ajuste del modelo de red neuronal, se pueden utilizar para hacer predicciones en ejemplos o conjuntos de datos que no hayan sido utilizados durante el entrenamiento. Si los datos con lo que hace predicción son etiquetados (como lo sería en el conjunto de prueba) se utiliza para evaluar el ajuste del modelo.
Descubrimiento y descripción de datos
Esta fase abarca desde posiblemente recolectar los datos directamente del ambiente en que se plantea una problema de clasificación o regresión, o bien obtener un conjunto de datos previamente recolectado o utilizar un conjunto de datos de acceso abierto en Internet. También se considera en este paso la necesidad de conocer el origen de los datos, la descripción de sus atributos así como un análisis preliminar del tipo de datos y la distribución de éstos.
Asignación de hyperparámetros
- Definición de una estructura para la red neuronal:
- Número de capas
- Tipo de capas
- Dimensión de las salidas de las capas
- Función del optimizador.
- Función de error o pérdida.
- Regularización
- Número de épocas de entrenamiento
- Tamaño de los paquetes (batch size)
Preparación de los conjuntos de datos
Y selección del atributo objetivo
Si el atributo objetivo es una variable numérica que se quiere predecir, se trata de un problema de regresión. Si el atributo objetivo es discreto y/o categórico, es un problema de clasificación. Si se tiene dos clases, es un problema de clasificación binario, pero si hay más clases se requiere hacer una codificación One-hot para manejar este tipo de problemas.
Al conjunto completo de datos, se le aplica una división al menos en Train y Test de manera que el conjunto de prueba no sea parte de los ejemplos que se usan para ajustar el modelo.