Want to create interactive content? It’s easy in Genially!

Get started free

Introducción al Big Data

Innovación Académica

Created on May 27, 2024

Start designing with a free template

Discover more than 1500 professional designs like these:

Terrazzo Presentation

Visual Presentation

Relaxing Presentation

Modern Presentation

Colorful Presentation

Modular Structure Presentation

Chromatic Presentation

Transcript

Introducción al Big Data

Fundamentos teológicos del Big Data

Sabiduría, datos, información y conocimiento

El modelo de la pirámide DIKW (Data, Information, Knowledge, Wisdom) representa de forma ascendente, o descendente, el manejo de los datos, siendo su top el funcional y subjetivo.

dATA

  • 1. Datos: conjunto de hechos recolectados.
  • 2. Información: conjunto organizado de datos con un propósito en particular.

Information

  • 3. Conocimiento: después de recolectar y organizar los hechos podemos implementar las operaciones complejas, técnicas especializadas y métodos expertos orientados a generar información valiosa para las organizaciones y que a su vez se vean reflejadas en la toma de decisiones.

Knowledge

Wisdom

  • 4. Sabiduría: el conocimiento almacenado que está preparado para la ejecución de tareas y resolución en la toma de decisiones.

¿Con base a qué podemos diferenciar el significado de los siguientes conceptos? Datos, información y conocimiento

R= Con base a la integridad y al procesamiento. Es decir, recolectamos datos para procesarlos y convertirlos en conocimiento.

Da clic en la pregunta para conocer la respuesta

Los sistemas Big Data son receptores que cumplen con las expectativas de las organizaciones basados en estos fundamentos.

  • Caracterización del dato: caracterizamos los datos con la finalidad de inmiscuirlos de una forma particular de acuerdo con la necesidad del negocio.

A continuación, se comparte su clasificación:

Datos en cuanto al tipo

Su clasificación se deriva con base a las operaciones con las que están relacionados.

  • Tipos simples: se dividen en lógicos, numéricos y tipo carácter, tienen como principal característica establecer un valor o un rango.
  • Tipos compuestos: pueden representar un valor, rango definido o cualquier otra cosa como un nombre, dirección o teléfono.

Datos en cuanto al formato

Su clasificación tiene como base poder determinar los diferentes tipos de datos que se pueden llegar a almacenar, recordemos que podemos tener archivos de datos como imagen, audio o archivos de programas como los que usamos cotidianamente ( .doc. .xls .txt .).

  • Tipos de datos estructurados: representados por datos que fueron organizados de acuerdo con una necesidad en particular.
  • Tipos de datos semiestructurados: almacenan datos en tablas, pero no están predeterminados para seguir un orden o esquema específicamente.
  • Tipos de datos no estructurados: están almacenados de cualquier forma en particular, un ejemplo: almacenar de la misma manera diferentes tipos de archivos como JPG, MP3 y AVI.

Datos en cuanto al generador

Esta clasificación está definida por el origen de los datos, es decir, quién fue el generador de la información.

  • Datos generados por las personas: esta información está generada por los integrantes de la organización con relación a la interacción con sus consumidores al incluir información como videos, hojas de texto y correos electrónicos.
  • Datos generados por las maquinas: estos archivos son generados por los diferentes dispositivos como parte de su operación, un ejemplo son los archivos logs que generan los servidores y ordenadores en general.

Datos en cuanto al tamaño

Se clasifican por la información almacenada de acuerdo con el tamaño.

  • Datos pequeños (gigabytes): algunas bases de datos son consideradas pequeñas por cumplir con esta condición, normalmente son bases de datos de proveedores.
  • Datos medianos (terabytes): más allá del tamaño en gigabytes, son las bases de datos que llevan interacciones entre los procesos o servicios que ofrecen las organizaciones con sus clientes, por ejemplo: ventas, facturas o devoluciones.
  • Datos grandes (petabytes): definido de esta manera por su alto volumen de información en billones de registros.
  • Datos muy grandes (exabytes): son los datos más grandes que podemos almacenar. Por su tamaño podemos encontrarlos en imágenes de alta resolución, por ejemplo: sistemas satelitales o imágenes de equipos médicos.

Datos en cuanto a su rol

Se clasifica por su nivel de funcionalidad en cuanto a la toma de decisiones en la organización.

  • Datos maestros: de alta importancia a lo largo de los principales objetivos de la empresa, por lo regular tienen implicaciones en todos los departamentos entre empleados, servicios, productos y usuarios.
  • Datos operacionales: son los datos generados en el día a día, se genera entre los empleados con los usuarios y necesitan de los datos maestros para poder ejecutarse.
  • Datos externos: son todos aquellos que vienen a repercutir de manera directa a la organización, son posibles circunstancias fuera del alcance de la empresa.
  • Datos analíticos: son tomados en cuenta para la toma de decisiones debido a que estos fueron previamente elaborados y organizados, es decir, nos pueden entregar resultados.

Datos en cuanto a su latencia

Este tipo de datos está clasificado por el tiempo que tardan en generarse y su disponibilidad para poder utilizarlos como información.

  • Datos en tiempo real: estos datos los obtenemos en el momento en el que son generados.
  • Datos en lotes: necesitan de un tiempo de generación determinado y suelen estar disponibles en volumen. Se generan por paquetes de datos y no en tiempo real.
  • Datos en cuanto a su sensibilidad: en la actualidad se aplican normas de privacidad en el manejo de la información. De ahí es necesario tener restricciones en procesamiento de datos por lo que la información no es de orden público.
  • Riesgo alto: información muy delicada cuyo acceso es restringido debido a que puede ser utilizado para diversos fines.
  • Riesgo medio: son datos de suma importancia que pueden ser utilizados con algunas restricciones por personal autorizado y/o bajo supervisión.
  • Riesgo bajo: son datos abiertos al público en general.

Big Data en contexto

Big Data no es solo un modelo que tiene como objetivo procesar los datos y resultados de información valiosa, esta herramienta es capaz de procrear la información necesaria para generar nuevos modelos de negocio, incluso cambios en la cultura empresarial.

Big Data surge por la necesidad de atacar las grandes cantidades de datos para estructurarlos, y con base a eso poder tener información valiosa como las métricas de la organización.

Etapas de análisis en la explotación de la información

Big Data es un sistema experto en el manejo de datos, analizándolos por medio de herramientas con la finalidad de poder gestionar de manera adecuada su información. Para esto se tienen las siguientes categorías:

  • Análisis descriptivo: tiene como fundamento el manejo de datos históricos.
  • Análisis prescriptivo: este tipo de análisis se hace posterior a la obtención de datos, es decir, de manera correctiva se busca obtener soluciones teniendo la operación en curso.
  • Análisis predictivo: se basa en análisis realizados con anticipación y con base a estos poder obtener tendencias, es decir, puede tratar de predecir el futuro y con esto evitar errores pasados.
  • Análisis cognitivo: va más allá de un análisis, tiene como objetivo poder crear programas, por ejemplo: en el uso de robots, inteligencia artificial y robótica.