M3
Actividades de la gestión de datos
EL CICLO DE VIDA DE LOS DATOS Y SU RELEVANCIA EN LA GESTIÓN INSTITUCIONAL
Introducción
La gestión del ciclo de vida de los datos es uno de los principales desafíos para las instituciones. Reconocer y atender cada etapa permite asegurar la calidad, trazabilidad, seguridad y valor de los datos como activos organizacionales. El Plan Nacional de Infraestructura de Datos de Colombia (PNID) describe el ciclo de vida de los datos, el cual está conformado por fases sucesivas que permiten planificar, crear, usar, mantener, preservar y eventualmente retirar o reutilizar los datos.
Por su parte, el marco DAMA-DMBOK2 no presenta un ciclo lineal, sino un conjunto de funciones interconectadas, cuyo propósito es “permitir a las organizaciones obtener valor de sus activos de datos”. Estas funciones se relacionan directamente con las etapas del ciclo de vida, pero con una visión más holística y de gestión continua. En este módulo recorreremos las fases del ciclo de vida según el PNID, mostrando cómo se vinculan y se enriquecen con las funciones planteadas por DAMA.
2. Procesar
1. Crear y obtener
3. Almacenamiento
Etapas del ciclo de vida del dato
6. Archivo y presentación
(Modelo de Colombia + funciones DAMA)
7. Reutilizar
4. Intercambio
5. Uso y análisis de datos
(transferir y compartir)
Haz clic en cada botón para ampliar la información
Profundizamos en las funciones de DAMA más importantes en el ciclo de vida.
Integración de Datos e interoperabilidad
Arquitectura de Datos y Modelado y Diseño
Gestión de Datos Maestros y de Referencia
Referencias bibliográficas
- DAMA International. (2017). DAMA-DMBOK: Data management body of knowledge (2nd ed.). Technics Publications.
- Infraestructura de Datos del Estado. (s. f.). Recurso 3. https://infraestructuradatos.gov.co/798/articles-195195_recurso_3.pdf
- Ministerio de Tecnologías de la Información y las Comunicaciones. (s. f.). Marco de interoperabilidad para Gobierno Digital. Lenguaje Común. https://lenguaje.mintic.gov.co/sites/default/files/archivos/marco_de_interoperabilidad_para_gobierno_digital.pdf
- Ministerio de Tecnologías de la Información y las Comunicaciones. (2020). Inventario de herramientas de analítica de datos. https://herramientas.datos.gov.co/sites/default/files/2020-11/Inventario%20herramientas%20anal%C3%ADtica_0.pdf
- Ministerio de Tecnologías de la Información y las Comunicaciones. (2023). Guía general Proceso de Arquitectura Empresarial – AE (MAE.G.PA). https://mintic.gov.co/arquitecturaempresarial/630/articles-237652_recurso_1.pdf
Almacenamiento
Se refiere al diseño, implementación y soporte de los repositorios donde se alojan los datos, equilibrando disponibilidad, integridad, seguridad y costos.
Funciones DAMA vinculadas:
- Almacenamiento de Datos y Operaciones: abarca las prácticas de administración de bases de datos, gestión de rendimiento, políticas de retención y disposición.
- Seguridad de Datos: protege los datos almacenados frente a accesos indebidos o pérdidas.
- Gestión de Documentos y Contenido: especialmente relevante para datos no estructurados.
Reutilizar
Consiste en emplear datos originalmente creados para otro propósito, habilitando nuevos análisis o aplicaciones.
Funciones DAMA vinculadas:
- Arquitectura de Datos y Modelado de Datos: diseñan para maximizar la reutilización futura.
- Gestión de Metadatos: facilita entender y reutilizar datos en nuevos contextos.
- Integración de Datos: permite reusar flujos de integración o servicios de datos.
- Gestión de Calidad de Datos: asegura que los datos reutilizados mantengan valor y confiabilidad.
- Gestión del Cambio Organizacional: fomenta una cultura institucional orientada a aprovechar los datos más allá de su propósito inicial.
El modelo de Colombia describe la reutilización como una fase separada al final del ciclo, lo que podría sugerir una visión más reactiva. El marco de DAMA, en cambio, incorpora la reutilización de manera transversal y proactiva, como un principio de diseño y una meta estratégica para maximizar el valor de los activos de datos.
Procesar
Comprende las actividades de transformación, limpieza, integración y preparación de datos para que sean aptos para los procesos organizacionales.
Funciones DAMA vinculadas:
- Integración de Datos e Interoperabilidad (DII): asegura que los datos lleguen donde se necesitan, en el formato requerido.
- Gestión de Datos Maestros y de Referencia (MDM/RDM): permite consolidar y mantener datos críticos consistentes, como personas, entidades o servicios.
- Gestión de Calidad de Datos: garantiza que los datos procesados sean confiables y aptos para su uso.
Integración de Datos e interoperabilidad
La función de Integración de Datos e Interoperabilidad (DII) incluye los procesos relacionados con el movimiento y la consolidación de datos dentro y entre almacenes, aplicaciones y organizaciones. Su objetivo principal es hacer que los datos estén disponibles en los formatos y plazos requeridos, consolidándolos física o virtualmente, y reduciendo la complejidad y el costo mediante el uso de modelos e interfaces compartidas. Esta disciplina es fundamental para el Data Warehousing, la Inteligencia de Negocio, la Gestión de Datos Maestros y la gestión de Big Data, buscando integrar diversos tipos de información. La necesidad de gestionar la complejidad y los altos costos asociados a las soluciones punto a punto (que pueden generar miles o millones de interfaces) es un motivador clave para la DII. Los modelos de intercambio de datos son más eficientes y rentables, a menudo empleando modelos como Data Commons, Mercado de Datos, Data Trust, data warehouses o soluciones de datos maestros, para consolidar la información y proporcionar vistas consistentes. Para la integración entre diferentes entidades de un país, la DII es esencial para el intercambio de datos entre ellas. El Gobierno de Datos juega un rol crucial al establecer acuerdos de compartición de datos (Memorándums de Entendimiento – MOU) que estipulan las responsabilidades y el uso aceptable de los datos intercambiados, especialmente en industrias reguladas o con información personal/confidencial. El linaje de datos es vital para documentar el origen y las transformaciones de la información al integrarse entre organizaciones. Un ejemplo destacado de integración a nivel nacional es el Modelo Nacional de Intercambio de Información (NIEM) en Estados Unidos, diseñado para homogeneizar el intercambio de documentos y transacciones entre entidades gubernamentales y asegurar la interoperabilidad. Además, los Datos de Referencia de la Industria, mantenidos por organismos gubernamentales o asociaciones, son un prerrequisito para la interoperabilidad y el intercambio de datos a gran escala, como los códigos de clasificación de enfermedades.
Intercambio (transferir y compartir)
Los datos deben poder compartirse con otros actores y actrices, sustentados en interoperabilidad y lenguajes comunes de intercambio.
Funciones DAMA vinculadas:
- Integración de Datos e Interoperabilidad: facilita el intercambio seguro y eficiente entre sistemas y organizaciones.
- Gestión de Datos Maestros y de Referencia: asegura consistencia en los datos que circulan.
- Seguridad de Datos: establece medidas de protección y control de acceso en la transferencia.
Gestión de Datos Maestros y de Referencia
Tanto los Datos Maestros como los Datos de Referencia son considerados recursos compartidos que proveen contexto y significado a otros datos, siendo esencial su gestión a nivel organizacional para asegurar que sean completos, consistentes, actuales y oficiales. Los Datos Maestros describen las entidades fundamentales como usuarios, servicios, empleados o ubicaciones, ofreciendo el marco para transacciones y análisis. La Gestión de Datos Maestros (MDM) se encarga de controlar los valores e identificadores de estos datos para garantizar un uso consistente y preciso en todos los sistemas, mitigando el riesgo de ambigüedad. Por su parte, los Datos de Referencia son utilizados para caracterizar o clasificar otros datos, o para vincular información dentro y fuera de la organización. Son generalmente menos volátiles, más pequeños y menos complejos que los Datos Maestros o los datos transaccionales, y no implican la resolución de entidades. Ejemplos incluyen códigos de países, estados, o tipos de orden. La Gestión de Datos de Referencia (RDM) asegura la consistencia y accesibilidad de estos valores de dominio definidos. Los Datos Transaccionales registran los detalles de las actividades de la organización, como las solicitudes de usuarios o los servicios prestados. Su efectividad y la capacidad de aprovecharlos dependen directamente de la calidad y disponibilidad de los Datos Maestros y de Referencia, ya que estos últimos proporcionan el contexto esencial para interpretar y enmarcar las transacciones. Ambas disciplinas, MDM y RDM, buscan reducir costos, mejorar la calidad de los datos y disminuir los riesgos, promoviendo un entendimiento y uso consistente de la información crítica en toda la organización.
Archivo y preservación
Implica retirar datos de entornos de producción activos y conservarlos en repositorios históricos o eliminarlos de forma segura.
Funciones DAMA vinculadas:
- Almacenamiento de Datos y Operaciones: establece políticas de conservación, expiración y disposición.
- Gestión de Documentos y Contenido: regula la preservación de registros y documentos conforme a estatutos y regulaciones.
Arquitectura de Datos y Modelado y Diseño
La Arquitectura de Datos se centra en definir el plan maestro para gestionar los activos de datos. Su objetivo es ser un puente entre la estrategia de la organización y la ejecución tecnológica, estableciendo requisitos y diseños de datos estratégicos. La arquitectura abarca dominios como negocio (áreas misionales), aplicaciones y tecnología, y produce artefactos clave como modelos, definiciones y flujos de datos. Las actividades incluyen la integración con la arquitectura empresarial, la definición de requisitos de datos para proyectos, la revisión de diseños y la garantía del cumplimiento de estándares. El Gobierno de Datos es esencial para alinear y controlar estas actividades. El Modelado y Diseño de Datos describe el proceso de descubrir, analizar, representar y comunicar los requisitos de datos en un modelo preciso. Los modelos de datos, constituyen una herramienta gráfica de comunicación, y son cruciales para entender la organización y sus activos de datos, facilitando la alineación de aplicaciones con las necesidades del negocio y la reducción de costos. Estos modelos pueden ser conceptuales, lógicos o físicos, utilizando componentes como entidades, relaciones y atributos en diferentes esquemas (Relacional, Dimensional, NoSQL, entre otros). Las actividades clave incluyen la planificación, construcción (ingeniería hacia adelante y reversa) y revisión de los modelos de datos, garantizando su calidad y mantenimiento. Además, los modelos de datos son una fuente importante de Metadatos esenciales para otras funciones de gestión de datos.
Crear y obtener
Los datos pueden ser adquiridos de fuentes externas, ingresados manualmente o capturados mediante sistemas y dispositivos. En esta etapa es clave definir qué datos se necesitan y cómo se representarán.
Funciones DAMA vinculadas:
- Arquitectura de Datos: establece el plan para gestionar los activos de datos y los requisitos estratégicos.
- Modelado y Diseño de Datos: permite representar, documentar y comunicar los requisitos de datos de manera consistente, facilitando su posterior reutilización.
Uso y análisis de datos
Los datos se aplican en procesos internos y externos, soportan la toma de decisiones y pueden ser expuestos a terceros. Incluye analítica avanzada para generar conocimiento.
Funciones DAMA vinculadas:
- Inteligencia de Negocios y Data Warehousing: estructura los datos para habilitar reportes y decisiones basadas en evidencia.
- Big Data, Ciencia de Datos y Analítica Avanzada: permite descubrir patrones, tendencias y predicciones a partir de grandes volúmenes de datos.
- Gestión de Documentos y Contenido: organiza y clasifica la información no estructurada.
- Seguridad y Auditoría de Datos: garantiza trazabilidad y cumplimiento normativo.
M3 R1 El ciclo de vida de los datos
BID-INDES
Created on October 7, 2025
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Explainer Video: AI for Companies
View
Explainer Video: Keys to Effective Communication
View
Corporate CV
View
Flow Presentation
View
Discover Your AI Assistant
View
Urban Illustrated Presentation
View
Geographical Challenge: Drag to the map
Explore all templates
Transcript
M3
Actividades de la gestión de datos
EL CICLO DE VIDA DE LOS DATOS Y SU RELEVANCIA EN LA GESTIÓN INSTITUCIONAL
Introducción
La gestión del ciclo de vida de los datos es uno de los principales desafíos para las instituciones. Reconocer y atender cada etapa permite asegurar la calidad, trazabilidad, seguridad y valor de los datos como activos organizacionales. El Plan Nacional de Infraestructura de Datos de Colombia (PNID) describe el ciclo de vida de los datos, el cual está conformado por fases sucesivas que permiten planificar, crear, usar, mantener, preservar y eventualmente retirar o reutilizar los datos.
Por su parte, el marco DAMA-DMBOK2 no presenta un ciclo lineal, sino un conjunto de funciones interconectadas, cuyo propósito es “permitir a las organizaciones obtener valor de sus activos de datos”. Estas funciones se relacionan directamente con las etapas del ciclo de vida, pero con una visión más holística y de gestión continua. En este módulo recorreremos las fases del ciclo de vida según el PNID, mostrando cómo se vinculan y se enriquecen con las funciones planteadas por DAMA.
2. Procesar
1. Crear y obtener
3. Almacenamiento
Etapas del ciclo de vida del dato
6. Archivo y presentación
(Modelo de Colombia + funciones DAMA)
7. Reutilizar
4. Intercambio
5. Uso y análisis de datos
(transferir y compartir)
Haz clic en cada botón para ampliar la información
Profundizamos en las funciones de DAMA más importantes en el ciclo de vida.
Integración de Datos e interoperabilidad
Arquitectura de Datos y Modelado y Diseño
Gestión de Datos Maestros y de Referencia
Referencias bibliográficas
Almacenamiento
Se refiere al diseño, implementación y soporte de los repositorios donde se alojan los datos, equilibrando disponibilidad, integridad, seguridad y costos.
Funciones DAMA vinculadas:
Reutilizar
Consiste en emplear datos originalmente creados para otro propósito, habilitando nuevos análisis o aplicaciones.
Funciones DAMA vinculadas:
- Arquitectura de Datos y Modelado de Datos: diseñan para maximizar la reutilización futura.
- Gestión de Metadatos: facilita entender y reutilizar datos en nuevos contextos.
- Integración de Datos: permite reusar flujos de integración o servicios de datos.
- Gestión de Calidad de Datos: asegura que los datos reutilizados mantengan valor y confiabilidad.
- Gestión del Cambio Organizacional: fomenta una cultura institucional orientada a aprovechar los datos más allá de su propósito inicial.
El modelo de Colombia describe la reutilización como una fase separada al final del ciclo, lo que podría sugerir una visión más reactiva. El marco de DAMA, en cambio, incorpora la reutilización de manera transversal y proactiva, como un principio de diseño y una meta estratégica para maximizar el valor de los activos de datos.Procesar
Comprende las actividades de transformación, limpieza, integración y preparación de datos para que sean aptos para los procesos organizacionales.
Funciones DAMA vinculadas:
Integración de Datos e interoperabilidad
La función de Integración de Datos e Interoperabilidad (DII) incluye los procesos relacionados con el movimiento y la consolidación de datos dentro y entre almacenes, aplicaciones y organizaciones. Su objetivo principal es hacer que los datos estén disponibles en los formatos y plazos requeridos, consolidándolos física o virtualmente, y reduciendo la complejidad y el costo mediante el uso de modelos e interfaces compartidas. Esta disciplina es fundamental para el Data Warehousing, la Inteligencia de Negocio, la Gestión de Datos Maestros y la gestión de Big Data, buscando integrar diversos tipos de información. La necesidad de gestionar la complejidad y los altos costos asociados a las soluciones punto a punto (que pueden generar miles o millones de interfaces) es un motivador clave para la DII. Los modelos de intercambio de datos son más eficientes y rentables, a menudo empleando modelos como Data Commons, Mercado de Datos, Data Trust, data warehouses o soluciones de datos maestros, para consolidar la información y proporcionar vistas consistentes. Para la integración entre diferentes entidades de un país, la DII es esencial para el intercambio de datos entre ellas. El Gobierno de Datos juega un rol crucial al establecer acuerdos de compartición de datos (Memorándums de Entendimiento – MOU) que estipulan las responsabilidades y el uso aceptable de los datos intercambiados, especialmente en industrias reguladas o con información personal/confidencial. El linaje de datos es vital para documentar el origen y las transformaciones de la información al integrarse entre organizaciones. Un ejemplo destacado de integración a nivel nacional es el Modelo Nacional de Intercambio de Información (NIEM) en Estados Unidos, diseñado para homogeneizar el intercambio de documentos y transacciones entre entidades gubernamentales y asegurar la interoperabilidad. Además, los Datos de Referencia de la Industria, mantenidos por organismos gubernamentales o asociaciones, son un prerrequisito para la interoperabilidad y el intercambio de datos a gran escala, como los códigos de clasificación de enfermedades.
Intercambio (transferir y compartir)
Los datos deben poder compartirse con otros actores y actrices, sustentados en interoperabilidad y lenguajes comunes de intercambio.
Funciones DAMA vinculadas:
Gestión de Datos Maestros y de Referencia
Tanto los Datos Maestros como los Datos de Referencia son considerados recursos compartidos que proveen contexto y significado a otros datos, siendo esencial su gestión a nivel organizacional para asegurar que sean completos, consistentes, actuales y oficiales. Los Datos Maestros describen las entidades fundamentales como usuarios, servicios, empleados o ubicaciones, ofreciendo el marco para transacciones y análisis. La Gestión de Datos Maestros (MDM) se encarga de controlar los valores e identificadores de estos datos para garantizar un uso consistente y preciso en todos los sistemas, mitigando el riesgo de ambigüedad. Por su parte, los Datos de Referencia son utilizados para caracterizar o clasificar otros datos, o para vincular información dentro y fuera de la organización. Son generalmente menos volátiles, más pequeños y menos complejos que los Datos Maestros o los datos transaccionales, y no implican la resolución de entidades. Ejemplos incluyen códigos de países, estados, o tipos de orden. La Gestión de Datos de Referencia (RDM) asegura la consistencia y accesibilidad de estos valores de dominio definidos. Los Datos Transaccionales registran los detalles de las actividades de la organización, como las solicitudes de usuarios o los servicios prestados. Su efectividad y la capacidad de aprovecharlos dependen directamente de la calidad y disponibilidad de los Datos Maestros y de Referencia, ya que estos últimos proporcionan el contexto esencial para interpretar y enmarcar las transacciones. Ambas disciplinas, MDM y RDM, buscan reducir costos, mejorar la calidad de los datos y disminuir los riesgos, promoviendo un entendimiento y uso consistente de la información crítica en toda la organización.
Archivo y preservación
Implica retirar datos de entornos de producción activos y conservarlos en repositorios históricos o eliminarlos de forma segura.
Funciones DAMA vinculadas:
Arquitectura de Datos y Modelado y Diseño
La Arquitectura de Datos se centra en definir el plan maestro para gestionar los activos de datos. Su objetivo es ser un puente entre la estrategia de la organización y la ejecución tecnológica, estableciendo requisitos y diseños de datos estratégicos. La arquitectura abarca dominios como negocio (áreas misionales), aplicaciones y tecnología, y produce artefactos clave como modelos, definiciones y flujos de datos. Las actividades incluyen la integración con la arquitectura empresarial, la definición de requisitos de datos para proyectos, la revisión de diseños y la garantía del cumplimiento de estándares. El Gobierno de Datos es esencial para alinear y controlar estas actividades. El Modelado y Diseño de Datos describe el proceso de descubrir, analizar, representar y comunicar los requisitos de datos en un modelo preciso. Los modelos de datos, constituyen una herramienta gráfica de comunicación, y son cruciales para entender la organización y sus activos de datos, facilitando la alineación de aplicaciones con las necesidades del negocio y la reducción de costos. Estos modelos pueden ser conceptuales, lógicos o físicos, utilizando componentes como entidades, relaciones y atributos en diferentes esquemas (Relacional, Dimensional, NoSQL, entre otros). Las actividades clave incluyen la planificación, construcción (ingeniería hacia adelante y reversa) y revisión de los modelos de datos, garantizando su calidad y mantenimiento. Además, los modelos de datos son una fuente importante de Metadatos esenciales para otras funciones de gestión de datos.
Crear y obtener
Los datos pueden ser adquiridos de fuentes externas, ingresados manualmente o capturados mediante sistemas y dispositivos. En esta etapa es clave definir qué datos se necesitan y cómo se representarán.
Funciones DAMA vinculadas:
Uso y análisis de datos
Los datos se aplican en procesos internos y externos, soportan la toma de decisiones y pueden ser expuestos a terceros. Incluye analítica avanzada para generar conocimiento.
Funciones DAMA vinculadas: