En esta unidad se abordan los procesos fundamentales de preparación de datos, una fase crítica que determina la calidad y fiabilidad de cualquier análisis o modelo de aprendizaje automático posterior. El contenido comienza con la inspección inicial de los conjuntos de datos, analizando las metodologías para detectar valores nulos, registros duplicados y anomalías que puedan sesgar los resultados. Se profundiza en las técnicas de limpieza, evaluando los criterios para decidir entre la eliminación de información defectuosa o su recuperación mediante procesos de imputación y corrección de formatos.
Asimismo, la unidad trata las estrategias de normalización y estandarización de variables numéricas, fundamentales para asegurar que las diferentes escalas de los datos no perjudiquen el rendimiento de los algoritmos. Finalmente, se examina la transformación de variables categóricas en formatos numéricos mediante técnicas de codificación y discretización. El dominio de estos aspectos es vital para el desarrollo de las competencias profesionales en el ámbito del análisis de datos, ya que permite transformar datos en bruto, a menudo desorganizados y erróneos, en activos de información de alta calidad listos para la toma de decisiones estratégicas.
5101_UD2_INTRO
CESUR
Created on February 1, 2026
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Practical Microsite
View
Essential Microsite
View
Akihabara Microsite
View
Essential CV
View
Akihabara Resume
View
Corporate CV
View
Interactive Onboarding Guide
Explore all templates
Transcript
En esta unidad se abordan los procesos fundamentales de preparación de datos, una fase crítica que determina la calidad y fiabilidad de cualquier análisis o modelo de aprendizaje automático posterior. El contenido comienza con la inspección inicial de los conjuntos de datos, analizando las metodologías para detectar valores nulos, registros duplicados y anomalías que puedan sesgar los resultados. Se profundiza en las técnicas de limpieza, evaluando los criterios para decidir entre la eliminación de información defectuosa o su recuperación mediante procesos de imputación y corrección de formatos.
Asimismo, la unidad trata las estrategias de normalización y estandarización de variables numéricas, fundamentales para asegurar que las diferentes escalas de los datos no perjudiquen el rendimiento de los algoritmos. Finalmente, se examina la transformación de variables categóricas en formatos numéricos mediante técnicas de codificación y discretización. El dominio de estos aspectos es vital para el desarrollo de las competencias profesionales en el ámbito del análisis de datos, ya que permite transformar datos en bruto, a menudo desorganizados y erróneos, en activos de información de alta calidad listos para la toma de decisiones estratégicas.