Want to make creations as awesome as this one?

Transcript

Actividad 2.2. Modelos y arquitecturas para Big Data

Aranza Valdivia

Empezar

genial

BIG DATA

El Big Data se refiere a conjuntos de datos tan vastos y complejos que las herramientas tradicionales de gestión de datos resultan insuficientes para su almacenamiento, análisis y procesamiento eficiente. Imagina una inundación de datos que llega a tu empresa todos los días, desde registros de transacciones hasta interacciones en redes sociales, datos de sensores y mucho más.Características del Big Data:Volumen: Cantidades masivas de datos que crecen exponencialmente.Velocidad: Datos que se generan y se deben procesar a alta velocidad.Variedad: Datos estructurados (bases de datos), semiestructurados (archivos XML) y no estructurados (texto, imágenes, videos).Veracidad: La calidad y fiabilidad de los datos son cruciales para obtener resultados precisos.

modelos de big dATA

1- Relacionales

2- No relacionales

3- Semiestructurados

4- No Semiestructurados

5- Flujo de datos

6- Ventanas de tiempo

8- Analisis de redes sociales

9- Internet de las cosas

10- Ventanas de tiempo

11- Baja latencia

Spark es un framework más rápido y versátil que Hadoop. Utiliza la memoria en lugar del disco duro para procesar los datos, lo que lo hace mucho más rápido. Además, Spark ofrece una API más fácil de usar y una variedad de módulos para diferentes tipos de procesamiento de datos.

Ecosistema:HDFS (Hadoop Distributed File System): Un sistema de archivos distribuido que almacena grandes volúmenes de datos en múltiples nodos.

Frameworks para Big Data

Hadoop es un framework de software de código abierto que permite el procesamiento distribuido de grandes conjuntos de datos a través de clústeres de computadoras.

+ inf

Capa de Streaming: Procesamiento de datos en tiempo real utilizando herramientas como Kafka o Spark Streaming.

Capa de Batch: Procesamiento de grandes volúmenes de datos históricos utilizando herramientas como Hadoop MapReduce o Spark.

Arquitectura Lambda…

La arquitectura Lambda es un enfoque híbrido que combina el procesamiento por lotes (batch) y el procesamiento en tiempo real (streaming) de datos.

+ info

Implementación de Big Data: Un Enfoque Integral

Escalabilidad: La capacidad de adaptarse a volúmenes de datos crecientes sin comprometer el rendimiento.Rendimiento: La velocidad con la que los datos pueden ser procesados y analizados.Costo: Los costos asociados al hardware, software, almacenamiento y personal.Seguridad: La protección de los datos sensibles y la privacidad de los usuarios.

Amazon utiliza algoritmos de recomendación basados en el historial de compras, productos vistos y búsquedas de cada usuario para sugerir productos relevantes.Beneficios: Aumento de las ventas, mejora de la experiencia del cliente y fidelización.

Casos de uso reales

El Big Data ha revolucionado la forma en que las empresas operan, ofreciendo una gran cantidad de casos de uso reales y beneficios tangibles

Los bancos utilizan el Big Data para analizar patrones de transacciones y detectar actividades sospechosas que podrían indicar un fraude.

- Genially

¿Tienes una idea?

Con las plantillas de Genially podrás incluir recursos visuales para dejar a tu audiencia con la boca abierta. También destacar alguna frase o dato concreto que se quede grabado a fuego en la memoria de tu público e incluso embeber contenido externo que sorprenda: vídeos, fotos, audios... ¡Lo que tú quieras!

¿Tienes una idea?

Con las plantillas de Genially podrás incluir recursos visuales para dejar a tu audiencia con la boca abierta. También destacar alguna frase o dato concreto que se quede grabado a fuego en la memoria de tu público e incluso embeber contenido externo que sorprenda: vídeos, fotos, audios... ¡Lo que tú quieras!