Want to make creations as awesome as this one?

Transcript

Alumno: Rosalío Cruz Martínez. Asesora: Nancy Ruiz Monroy.

Actividad 2.2. Modelos y arquitecturas para Big Data

Empezar

Las arquitecturas de Big Data son el diseño de sistemas y modelos para gestionar, almacenar y analizar grandes volúmenes de datos. Para ello, se utilizan tecnologías, procesos y recursos que permiten transformar los datos en información que ayude a tomar decisiones.

Arquitecturas

En Big Data, los modelos, frameworks y arquitecturas son herramientas que permiten analizar y procesar datos para obtener información útil para las empresas, organizaciones, etc.

Algunas arquitecturas de Big Data son: Arquitectura Lambda: Combina el procesamiento por lotes y en tiempo real. En una arquitectura lambda, los datos de entrada son enviados en paralelo, tanto a un sistema de procesamiento offline como a uno online. Ambas líneas de procesamiento ejecutan la misma lógica de negocio y vuelcan sus resultados en una capa de servicio.Arquitectura Kappa: Se centra en el flujo de datos en tiempo real.La arquitectura kappa se basa en mantener dos líneas de procesamiento diferentes, una para la capa batch y otra para la capa speed.La propuesta detrás de kappa es abordar tanto el procesamiento cercano al tiempo real como el procesamiento continuo de datos, utilizando una única línea de procesamiento. Es por esto que laarquitectura kappa consta solo de dos capas: stream processing (o real-time) y serving.

+ INFO

Modelos
Permiten analizar y generar relaciones entre los datos, lo que ayuda a descubrir información valiosa para los tomadores de decisiones. Algunos de los modelos más utilizados son:-Análisis descriptivo de datos.-Análisis exploratorio de datos.-Estadística inferencial de datos.-Análisis predictivo de datos Análisis causal de datos.
Frameworks

Son conjuntos de reglas, convenciones y patrones de diseño que ayudan a reducir la complejidad y mejorar la consistencia y el mantenimiento del código. Apache Hadoop y Apache Spark son algunos de los frameworks más utilizados en Big Data:Apache Hadoop: Es un framework gratuito y de código abierto que permite procesar grandes volúmenes de datos. Es escalable y cuenta con un alto nivel de seguridad. Apache Spark: Es un framework de programación para procesamiento de datos distribuidos que se caracteriza por ser rápido y de propósito general. Está escrito principalmente en Scala, pero es compatible con otros lenguajes como Java y Python.

Santos, M. Y., & Costa, C. (2020). Big data: Concepts, warehousing, and analytics. River Publishers. Capítulo 5. Páginas 158 - 194. https://ebookcentral-proquest-com.wdg.biblio.udg.mx:8443/lib/wdgbiblio/detail.action?docID=6184637&query=Big+Data# López Murphy, J. J. & Zarza, G. (2017). La ingeniería del big data: cómo trabajar con datos. Editorial UOC. Capítulo 8. Páginas 127 – 145. https://elibro-net.wdg.biblio.udg.mx:8443/es/lc/udg/titulos/59093 Salazar, A. (2016, 01 de noviembre). Infraestructura para Big Data. Revista Digital Universitaria. 17(11). http://www.revista.unam.mx/vol.17/num11/art77/ The apache software foundation. (s. f.). Map Reduce Tutorial. Consultado el 01 de julio de 2022. https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html SAS Institute Inc. (s. f). Hadoop ¿Qué es y porqué es importante? Consultado el 01 de julio de 2022. https://www.sas.com/es_mx/insights/big-data/hadoop.html IBM. (s. f.). ¿Qué es MapReduce? Consultado el 01 de julio de 2022. https://www.ibm.com/mx-es/topics/mapreduce Arias, E. (2022, 06 de junio). Diccionario de arquitecturas de datos. Todobi.com. https://todobi.com/diccionario-de-arquitecturas-de-datos/ PandaID.com. (2019, 02 de abril). Big Data – Procesos en tiempo real. https://www.pandaid.com/big-data-procesos-en-tiempo-real/

Referencias:

¿Tienes una idea?

¡Que fluya la comunicación!

Con las plantillas de Genially podrás incluir recursos visuales para dejar a tu audiencia con la boca abierta. También destacar alguna frase o dato concreto que se quede grabado a fuego en la memoria de tu público e incluso embeber contenido externo que sorprenda: vídeos, fotos, audios... ¡Lo que tú quieras!¿Necesitas más motivos para crear contenidos dinámicos? Bien: el 90% de la información que asimilamos nos llega a través de la vista y, además, retenemos un 42% más de información cuando el contenido se mueve.

  • Genera experiencias con tu contenido.
  • Tiene efecto WOW. Muy WOW.
  • Logra que tu público recuerde el mensaje.
  • Activa y sorprende a tu audiencia.