Want to make creations as awesome as this one?

Transcript

El almacén de datos y sus elementos

Semana 3

Un almacén de datos generalmente se usa para conectar y analizar datos comerciales de fuentes heterogéneas. El almacén de datos es el núcleo del sistema de BI que está diseñado para el análisis y la generación de informes de datos. En un almacén de datos se pueden definir tres niveles:

BDOAMATI3I0724

Instrucciones para áreas que cuentan con dos o más elementos interactivos:

Instrucciones para áreas que solamente cuentan con un elemento interactivo:

Preguntade refuerzo

Pase el cursor sobre el elemento para conocer más información.

Dé clic en el apartado para conocer su contenido.

<- Paleta de colores PRINCIPAL

Colores secundarios

Bases de Datos Orientadas al Almacenamiento Masivo

Nivel inferior

Pase el cursor sobre cada elemento para conocer más información.

Dé clic en cada apartado para conocer su contenido.

1

Dé clic en cada apartado para conocer su contenido.

Nivel medio

2

Nivel superior

3

Un almacén de datos típico tiene cuatro componentes principales: una base de datos central, herramientas ETL (limpia los datos operacionales, elimina los datos duplicados y los estandariza para crear una única fuente de información), metadatos y herramientas de acceso.Todos estos componentes están diseñados para ser rápidos, demodo que permitan obtener resultados con rapidez y analizardatos sobre la marcha.

¡A practicar!

Seleccione la respuesta correcta y dé clic en enviar.

Las empresas han confiado en el proceso ETL por muchos años para obtener una vista consolidada de los datos que que den lugar a mejores decisiones de negocios. Hoy día, este método de integración de datos de múltiples sistemas y fuentes sigue siendo un componente central de la caja de herramientas de integración de datos de una organización.

Instrucciones para áreas que cuentan con dos o más elementos interactivos:

Instrucciones para áreas que solamente cuentan con un elemento interactivo:

Preguntade refuerzo

<- Paleta de colores PRINCIPAL

Dé clic en cada apartado para conocer su contenido.

Pase el cursor sobre el elemento para conocer más información.

Colores secundarios

ETL es un tipo de integración de datos que hace referencia a los tres pasos (extraer, transformar, cargar) que se utilizan para mezclar datos de múltiples fuentes. Se utiliza a menudo para construir un almacén de datos. Durante este proceso, los datos se toman (extraen) de un sistema de origen, se convierten (transforman) en un formato que se puede almacenar y se almacenan (cargan) en un data warehouse u otro sistema. Extraer, cargar, transformar es un enfoque alterno, pero diseñado para canalizar el procesamiento de la base de datos para mejorar el desempeño.

Dé clic en el apartado para conocer su contenido.

Pase el cursor sobre cada elemento para conocer más información.

Dé clic en cada apartado para conocer su contenido.

¡A practicar!

Dé clic en "Volver a contestar" si desea responder nuevamente las preguntas.

Seleccione la respuesta correcta y dé clic en enviar.

Balusamy, B. et al. (2021). Big data: concepts, technology, and architecture. John Wiley & Sons, Incorporated. https://ebookcentral.proquest.com/lib/bibliouniminuto-ebooks/reader.action? docID=6509398&ppg=1 Casas Roma, J., Nin Guerrero, J. y Julbe López, F. (2019). Big data. Análisis de datos en entornos masivos. Editorial UOC. https://elibro.net/es/ereader/uniminuto/117744?page=1

Referencias:

©UNIMINUTO. Todos los derechos reservados. Todos los derechos de Propiedad Industrial e Intelectual de este material son propiedad exclusiva de la Corporación Universitaria Minuto de Dios.

Nivel medio

El nivel medio utiliza un servidor OLAP para consultas rápidas, empleando modelos ROLAP, MOLAP o HOLAP según el sistema.

Esta etapa implica la extracción de datos de diversas fuentes, como bases de datos, archivos planos, aplicaciones de software, o incluso fuentes externas como APIs. El objetivo es recopilar todos los datos relevantes necesarios para el análisis.

Extraer - Datos fuente (Extract - Source Data)

Nivel inferior

El nivel inferior transforma datos de múltiples fuentes mediante ETL o ELT, generalmente en un servidor de base de datos relacional.

Los datos transformados se cargan en un sistema de almacenamiento de datos, como un data warehouse. Aquí, los datos están organizados de manera que sean fácilmente accesibles y analizables por las herramientas de inteligencia empresarial y analítica.

Cargar - Almacén de datos en la nube (Load - Cloud Data Warehouse)

Nivel superior

Está representado por algún tipo de interfaz de usuario front-end o herramienta de generación de informes, que permite a los usuarios finales realizar análisis de datos ad hoc sobre sus datos empresariales.

Una vez extraídos, los datos se someten a procesos de limpieza y transformación. Esto puede incluir la eliminación de datos duplicados, la corrección de errores, la conversión de formatos de datos, y la agregación o disgregación de datos para alinearlos con los objetivos del análisis.

Transformar - Motor de transformación (Transform - Transformation Engine)