Want to create interactive content? It’s easy in Genially!

Get started free

5101_UD1 - 3.5 (1) - 4 btn

CESUR

Created on January 29, 2026

Start designing with a free template

Discover more than 1500 professional designs like these:

SWOT Challenge: Classify Key Factors

Vision Board

Explainer Video: Keys to Effective Communication

Explainer Video: AI for Companies

Corporate CV

Flow Presentation

Discover Your AI Assistant

Transcript

Comprobaciones de integridad y contenido

Gestión de valores nulos

Validación de rangos y auditoría de procesos

Codificación y automatización de la verificación

Haz clic en los botones para ver más información

Comprobaciones de integridad y contenido

volver

La verificación de integridad básica consiste en comparar las dimensiones y los tipos de datos entre el DataFrame original y el archivo exportado. Mediante el código df_original.shape, se obtienen las dimensiones de filas y columnas que deben coincidir exactamente con df_leido = pd.read_csv('exportado.csv'); df_leido.shape tras la reimportación. Asimismo, la comparación de tipos a través de df_original.dtypes.equals(df_leido.dtypes) sirve para detectar conversiones no deseadas, como columnas numéricas que pasan a ser texto, fechas interpretadas como cadenas o pérdidas de precisión en valores flotantes. Para asegurar que los nombres de las columnas se preservan sin cambios ni omisiones, se utiliza la función df_original.columns.equals(df_leido.columns). En cuanto al contenido, aunque df_original.equals(df_leido) verifica la igualdad exacta de todos los valores, este método puede resultar demasiado estricto al fallar por diferencias mínimas de redondeo. Un enfoque más robusto consiste en emplear:pd.testing.assert_frame_equal(df_original, df_leido, check_dtype=True, check_exact=False, rtol=1e-5).

Comprobaciones de integridad y contenido

volver

Esta instrucción permite una tolerancia relativa en comparaciones numéricas mientras mantiene una revisión estricta de los tipos. Además, genera excepciones descriptivas que indican con precisión qué filas y columnas difieren, lo que facilita la depuración de cualquier problema surgido en la exportación.

Gestión de valores nulos

volver

La verificación de valores nulos permite detectar si se han perdido o introducido datos ausentes de forma accidental. El códigonulos_original = df_original.isnull().sum(); nulos_leido = df_leido.isnull().sum(); diferencias = nulos_original.compare(nulos_leido) Identifica las columnas donde el recuento de nulos ha variado. Es común que formatos como el CSV interpreten cadenas vacías como nulos o viceversa, generando discrepancias que afectan a los análisis estadísticos. Para confirmar que los valores nulos ocupan exactamente las mismas posiciones en ambos objetos, se utiliza la comprobación (df_original.isnull() == df_leido.isnull()).all().all().

Validación de rangos y auditoría de procesos

volver

La validación de rangos y valores detecta corrupciones mediante comprobaciones de La validación de rangos y valores detecta corrupciones mediante comprobaciones de coherencia lógica. Por ejemplo, el código assert df_leido['edad'].between(0, 120).all(), 'Valores de edad fuera de rango' sirve para verificar que las columnas numéricas mantienen rangos válidos tras la exportación. Además, la comparación de estadísticas descriptivas con df_original.describe().compare(df_leido.describe()) permite identificar cambios en medias, desviaciones estándar, mínimos y máximos que podrían indicar transformaciones no deseadas. En el caso de las columnas categóricas, el uso de set(df_original['categoria'].unique()) == set(df_leido['categoria'].unique()) confirma que todas las etiquetas se preservan íntegramente. Para asegurar una trazabilidad completa, la generación de logs de exportación registra metadatos para auditoría y depuración. Una implementación común utiliza el módulo logging. Estos registros deben incluir un hash MD5 del archivo, generado mediante import hashlib; hash_md5 = hashlib.md5(open(archivo, 'rb').read()).hexdigest(), lo cual facilita la detección de modificaciones no autorizadas o corrupciones durante el movimiento de los archivos.

Codificación y automatización de verificación

volver

La verificación de codificación previene problemas con caracteres especiales que suelen aparecer en campos de texto. El código with open('archivo.csv', 'r', encoding='utf-8') as f: contenido = f.read() seguido de una búsqueda del carácter de reemplazo '' en el contenido ayuda a detectar fallos en la codificación. De manera más específica, la función df_leido.select_dtypes(include='object').apply(lambda x: x.str.contains('').any()) identifica qué columnas de texto presentan caracteres corruptos. Para archivos CSV, confirmar que el archivo es decodificable sin errores se logra con with open('archivo.csv', 'rb') as f: raw = f.read(); raw.decode('utf-8').