BIG DATA
Rafael Jesús Iglesia
Created on March 24, 2024
Over 30 million people build interactive content in Genially.
Check out what others have designed:
SANTIAGOVR_EN
Presentation
WWII TIMELINE WITH REVIEW
Presentation
BLENDED LEARNING
Presentation
TAKING A DEEPER DIVE
Presentation
WWII JUNE NEWSPAPER
Presentation
AUSSTELLUNG STORYTELLING
Presentation
HISTORY OF THE EARTH
Presentation
Transcript
BIG DATaDATOS MASIVOS
2024
normativa
Bloque 3 – Datos masivos, ciberseguridad e inteligencia artificial correspondiente a 1ºESO. Además, se evalúan los criterios 3.1 (Conocer la naturaleza de las distintas tipologías de datos siendo conscientes de la cantidad de datos generados hoy en día; analizarlos, visualizarlos y compararlos), 3.2 (Comprender y utilizar el periodismo de datos) y 3.3 (Entender y distinguir los dispositivos de una ciudad inteligente).
APLICACIONES
LAS 5 V
BIG DATA
DATOS
ESTRUCTURA
METADATOS
GENERACION
ACTIVIDADES
CIERRE
UNIDAD MEDIDA
ALMACENAJE
índice
TRANSPORTE
RECOGIDA DATOS
ANALISIS DATOS
LA NUBE
BIG DATA
01
ENTRADA Y SALIDA DE DATOS
Gracias a los datos podemos tomar decisiones, hacer cálculos y comprender el mundo que nos rodea. Por ejemplo, para saber qué tiempo hará el sábado, nos fijamos en los datos meteorológicos: la temperatura, la humedad, la posibilidad de lluvia...; al compartir una imagen desde nuestro teléfono móvil, estamos enviando datos de ella en forma de píxeles; al localizar una dirección con un GPS, recibimos datos geoespaciales; historial clínico médico, expediente educativo, datos deportivos como en el futbol, etc.
BIG DATA
DATOS MASIVOS
Los datos son los componentes fundamentales de la información, que nos ayudan a representar conceptos o instrucciones en un formato adecuado para su procesamiento.
Cada día generamos una enorme cantidad de datos. Según estudios, en 2021 se generaban 2,5 quintillones de bytes de datos diariamente en todo el mundo. Esta cantidad seguirá aumentando a medida que más personas accedan a Internet y usen dispositivos electrónicos.Los datos se generan en diferentes formas: mensajes en redes sociales, búsquedas en Internet, compras online, uso de aplicaciones móviles, entre otros. La mayoría de estos datos son generados por los usuarios, pero también hay datos generados automáticamente por dispositivos y sensores, como cámaras de seguridad, GPS y sistemas meteorológicos.El procesamiento y análisis de estos datos masivos nos permite tomar decisiones más informadas y desarrollar soluciones innovadoras para mejorar nuestras vidas.
BIG DATA
DATOS MASIVOS
⚫ Estructurados. Son los datos que pueden ser almacenados en tablas y tienen un formato claramente definido. Por ejemplo, las letras, los números, las fechas, los NIF, las matrículas de los coches, etc. ⚫ No estructurados. Son los datos recogidos en su formato original, que no pueden ser almacenados en tablas ni desglosados en los tipos de información que ofrecen. Por ejemplo, un correo electrónico, una imagen, un documento de audio, etc.
BIG DATA
DATOS MASIVOS
De acuerdo con su estructura, los datos pueden ser de dos tipos:
Hasta hace no mucho tiempo cuando vuestros familiares tenían vuestra edad una fotografía no era más que un papel impreso con información visual. Hoy en día, sin embargo, una foto tomada con vuestro móvil puede contener todo tipo de información: los colores y objetos que incluye, el dispositivo que se ha utilizado, el lugar y la fecha en que se ha tomado, etc. Si pensamos que una solo foto genera todos estos datos añade todas las fotos y videos que haceis con el móvil diariamente; la información de las webs que visitas y de las redes sociales, los mensajes que envías, etc.Cada día generamos una enorme cantidad de datos. Según estudios, en 2021 se generaban 2,5 quintillones de bytes de datos diariamente en todo el mundo. Esta cantidad seguirá aumentando a medida que más personas accedan a Internet y usen dispositivos electrónicos.
BIG DATA
ejemplo en el mundo real
1. Entrada. Los datos se recogen a través de pantallas, sensores, cámaras, micrófonos, dispositivos inteligentes, etc.2. Análisis. Los datos se analizan y se depuran, y se detectan patrones y conclusiones. 3. Salida. Los datos se refinan y se presenta la información en forma de gráficos, análisis, audios, vídeos, etc.
Big data (o también datos masivos o macrodatos) es el término que se emplea para hacer referencia a los grandes conjuntos de datos digitales y a las herramientas y tecnologías necesarias para procesarlos, analizarlos, almacenarlos e identificar en ellos patrones de comportamiento.
BIG DATA
definicion
- Volumen: La cantidad de datos generados y almacenados es muy grande y continúa creciendo.
- Velocidad: Los datos se generan y deben ser procesados rápidamente para tomar decisiones en tiempo real.
- Variedad: Los datos provienen de diversas fuentes y en diferentes formatos, como texto, imágenes, videos, etc.
- Veracidad: La calidad y precisión de los datos es importante, ya que los datos erróneos pueden afectar el análisis y las decisiones.
- Valor: Los datos deben ser útiles y proporcionar información valiosa para la toma de decisiones.
El Big Data se caracteriza principalmente por las 5 V’s:
BIG DATA
las 5 v.
- Volumen: Cada día, millones de personas alrededor del mundo suben fotos y vídeos a Instagram. Esto significa que se generan grandes cantidades de datos. El volumen de datos en Instagram es enorme y sigue creciendo cada día.
- Velocidad: Cuando suben una foto o un vídeo a Instagram, esta información se difunde rápidamente a través de la red a sus seguidores y a otras personas que pueden encontrar su contenido. La velocidad con la que se generan y se transmiten estos datos es realmente impresionante.
- Variedad: En Instagram, no solo se comparten fotos y vídeos, también se pueden encontrar comentarios, “me gusta”, etiquetas, mensajes directos y mucho más. Esto significa que hay una gran variedad de tipos de datos en la plataforma.
- Veracidad: Aunque la mayoría de las personas comparten fotos y vídeos reales en Instagram, a veces algunas personas pueden subir contenido falso o manipulado. La veracidad se refiere a la calidad y exactitud de los datos. Es importante ser capaces de distinguir entre datos verdaderos y falsos.
- Valor: Aunque hay millones de datos en Instagram, no todos ellos son útiles o relevantes para todos. El valor se refiere a la importancia o utilidad de los datos para un propósito específico. Por ejemplo, una empresa que vende ropa deportiva puede encontrar valor en los datos de las personas que siguen a influencers del fitness, ya que podrían ser clientes potenciales.
Imagina que estás en una red social como Instagram.
BIG DATA
Ejemplo del mundo real – INSTAGRAM
DEPORTES FUTBOL
METEOROLOGÍA
TRÁFICO
SEGURIDAD
OCIO Y COMERCIO
MEDICINA
El big data tiene aplicaciones en múltiples campos, entre ellos los siguientes:
BIG DATA
APLICACIONES
BIG DATA
02
TRANSPORTE Y ALMACENAJE DE DATOS
Seguro que crees que todos los datos se transmiten de forma inalámbrica, utilizando satélites, la realidad es que la transmisión de datos se lleva a cabo principalmente por cable, porque es la forma más barata y eficaz. Se utilizan para esto las redes de fibra óptica terrestres y submarinas, que conectan unos continentes con otros. Las redes submarinas están formadas por cables de fibra óptica depositados en el fondo de los océanos por barcos que recorren las aguas desenrollando lentamente los cables.Aunque parezca que hoy vivimos en una era inalámbrica, los responsables de que tengas Internet en casa siguen siendo más de 1.000 millones de metros de cable submarino que diferentes empresas llevan instalando desde 1866 para transportar datos entre continentes.
BIG DATA
Info
TRANSPORTE
Piensa cómo se enviarían en tu misma aula un archivo entre dos portátiles conectados a internet. Podríamos enviar un archivo de música de un ordenador a otro a través de la red Wi-Fi del instituto y para ello, ambos equipos deben estar conectados de forma segura (con su correspondiente usuario y contraseña) a la WiFi del instituto, que tiene implementadas un buen número de medidas de seguridad que garantizan la integridad de los datos durante el transporte. Si no fuera así, cualquiera podría interceptar la comunicación, modificar los datos y corromper el archivo o incluso modificar su contenido, con lo que se generarían enormes problemas. Piensa ahora que en vez de estar enviando una simple canción entre dos amigos, lo que se están enviando son datos de transferencias bancarias entre millones de personas. ¿Ves ahora lo importante que es el transporte de datos masivos?
Un ejemplo de transporte de datos masivos que podríamos tener en cuenta es la forma en que la música se transmite a través de internet. Cuando alguien quiere escuchar una canción en una plataforma de streaming como Spotify, los datos de esa canción se envían desde los servidores de Spotify a través de internet hasta el dispositivo del usuario. El transporte de estos datos es importante porque si la conexión a internet es lenta o inestable, la canción puede detenerse o incluso no reproducirse en absoluto.
BIG DATA
Ejemplo del mundo real – SPOTIFY
El almacenamiento de datos es otro aspecto importante en el manejo del Big Data. Debido al gran volumen de datos generados, es necesario contar con sistemas de almacenamiento que sean capaces de guardar y gestionar la información de manera eficiente.Existen dos enfoques principales para almacenar datos:Almacenamiento local: Los datos se guardan en dispositivos físicos, como discos duros, servidores o sistemas de almacenamiento en red (NAS). Este enfoque puede ser costoso y limitado en cuanto a espacio y escalabilidad.Almacenamiento en la nube: Los datos se guardan en servidores remotos, accesibles a través de Internet. El almacenamiento en la nube ofrece escalabilidad y flexibilidad, ya que se puede ampliar o reducir según las necesidades. Sin embargo, la seguridad y privacidad de los datos deben ser consideradas al utilizar servicios en la nube.En ambos casos, es crucial mantener copias de seguridad de los datos para prevenir pérdidas y garantizar la disponibilidad de la información.
BIG DATA
ALMACENAJE
Hablamos generalmente de la nube como si realmente los datos se quedarán flotando en el espacio, pero esto no es así. Los datos de la nube se almacenan de la misma forma en que tú guardas tus archivos en tu ordenador. El almacenaje de todos los datos que generamos se lleva a cabo en grandes centros de datos distribuidos por todos los países. Los centros de datos están formados por ordenadores de gran potencia, denominados servidores, que se encargan de almacenar y gestionar millones y millones de datos. Estos centros funcionan permanentemente, ya que, si dejaran de hacerlo, no funcionan los semáforos, los cajeros, los hospitales, etc. Por lo tanto, son considerados estructuras fundamentales para los países, igual que los servicios de luz y agua, por ejemplo. Los centros de datos consumen mucha energía para mantener encendidos los servidores y refrigerar las instalaciones.
BIG DATA
¿Los datos se almacenan en la nube?
BIG DATA
LA NUBE
BIG DATA
03
RECOGIDA Y ANALISIS DE DATOS
La recogida de datos es el proceso de recolectar información de diversas fuentes para su análisis y uso posterior. En el contexto del Big Data, es fundamental seleccionar y recopilar datos relevantes y de calidad para obtener resultados precisos y significativos. Existen diferentes métodos y herramientas para recolectar datos, como formularios en línea, sensores, registros de aplicaciones y dispositivos, entre otros.Algunas consideraciones importantes en la recogida de datos son:- Privacidad: Es fundamental respetar la privacidad de las personas y cumplir con las leyes y regulaciones de protección de datos. Esto incluye informar a los usuarios sobre la recopilación y uso de sus datos y solicitar su consentimiento cuando sea necesario.- Calidad: Asegurar que los datos recogidos sean precisos y de calidad es crucial para obtener resultados confiables en el análisis.
BIG DATA
RECOGIDA DE DATOS
Imagina que estamos trabajando en una investigación sobre el uso de dispositivos móviles en jóvenes de 12 a 13 años. Para recopilar datos relevantes y de calidad, podríamos diseñar una encuesta online (con Google Docs o Forms, por ejemplo) que pregunte sobre el tipo de dispositivo que utilizan, la frecuencia de uso, las aplicaciones que más usan y el tiempo que dedican a ellas.Sería importante asegurarnos de respetar la privacidad de los encuestados, por lo que incluiríamos una sección en la que les informamos sobre el uso que se dará a sus respuestas y pediríamos su consentimiento para participar. También deberíamos asegurarnos de que la encuesta sea fácil de entender y responder para los jóvenes, tal vez incluyendo preguntas con opciones de respuesta múltiple o de selección rápida.Una vez que recolectemos los datos, podemos analizarlos para obtener información valiosa sobre el uso de dispositivos móviles en esta edad. Podríamos descubrir, por ejemplo, que la mayoría de los jóvenes usan su teléfono para jugar videojuegos o ver videos, y que esto ocupa una cantidad significativa de su tiempo libre. Este tipo de información podría ayudar a padres y educadores a tomar decisiones informadas sobre el uso de dispositivos móviles en esta edad..
BIG DATA
Ejemplo del mundo real – INVESTIGACIÓN SOBRE USO DE DISPOSITIVOS MÓVILES
El análisis de datos es el proceso de examinar, procesar y transformar los datos recogidos para extraer información útil y generar conocimientos. En el Big Data, el análisis se lleva a cabo mediante herramientas y técnicas avanzadas que pueden manejar grandes volúmenes de datos y encontrar patrones, tendencias y relaciones ocultas.Hay diferentes tipos de análisis de datos en el contexto del Big Data:Análisis descriptivo: Se enfoca en describir y resumir los datos, utilizando herramientas de visualización y estadísticas para identificar patrones y tendencias.Análisis predictivo: Utiliza algoritmos y técnicas de aprendizaje automático para predecir eventos futuros o comportamientos basándose en los datos históricos.Análisis prescriptivo: Propone acciones o decisiones basadas en el análisis predictivo, optimizando resultados y solucionando problemas.
BIG DATA
ANALISIS DE DATOS
Supongamos que tenemos una tienda de golosinas y queremos aumentar nuestras ventas. Para lograrlo, podemos recopilar datos sobre nuestros clientes, como su edad, género, preferencias de sabor y frecuencia de visita. Una vez que tenemos estos datos, podemos realizar diferentes tipos de análisis para obtener información valiosa.Por ejemplo, con el análisis descriptivo, podemos obtener una imagen general de nuestros clientes y determinar cuáles son los productos más populares. Podríamos descubrir que los adolescentes prefieren los dulces ácidos y los adultos prefieren los chocolates.Con el análisis predictivo, podemos usar modelos matemáticos para predecir qué productos podrían venderse mejor en el futuro. Podríamos descubrir que, en función de las tendencias de compra anteriores, el lanzamiento de una nueva línea de gomitas ácidas podría tener un gran éxito entre los adolescentes.Finalmente, con el análisis prescriptivo, podemos usar los resultados del análisis predictivo para recomendar acciones específicas. En nuestro caso, podríamos recomendar que la tienda se concentre en promocionar la nueva línea de gomitas ácidas en las redes sociales y colocarlos en un lugar destacado en la tienda.
BIG DATA
Ejemplo del mundo real – LA TIENDA DE GOLOSINAS
BIG DATA
04
Generación de nuevos datos
BIG DATA
Creación de datos a través de la interacción
Todos generamos datos de diferentes maneras a medida que interactuamos con el mundo digital. Los estudiantes, al igual que otros usuarios de Internet, contribuís a la creación de nuevos datos cada vez que utilizáis dispositivos electrónicos y aplicaciones. Algunos ejemplos de cómo generamos datos son:- Redes sociales: Cuando publicamos, comentamos o compartimos contenido en plataformas como Facebook, Instagram o Twitter, creamos nuevos datos.- Búsquedas online: Cada vez que realizamos una búsqueda en Google o en otro motor de búsqueda, se generan datos relacionados con nuestras consultas y preferencias.- Aplicaciones móviles: Al utilizar aplicaciones en nuestros dispositivos, generamos datos sobre nuestras actividades, ubicación y preferencias.
BIG DATA
05
METADATOS
Las empresas de análisis de datos desarrollan herramientas para analizar metadatos y detectar patrones con los que dirigir acciones comerciales, principalmente. Un metadato particular recogido en una imagen no resulta de interés, pero recopilar todos los metadatos de todas las imágenes generadas en una zona de España, por ejemplo, puede servir para detectar relaciones y comportamientos de las personas que viven en esa zona. El estudio de estos datos puede afectar a nuestra privacidad. Por ello, es importante que seamos conscientes de los datos y metadatos que proporcionamos en nuestras interacciones digitales, para evitar que sean obtenidos sin nuestro consentimiento.
BIG DATA
METADATOS
Los metadatos son datos que describen otros datos. Por ejemplo, al envíar un correo: además de haber unos datos principales, que son el mensaje, el emisor y el destinatario (la persona a la que le llega), se generan otros datos, como son la fecha de envío, la localización o determinadas informaciones del equipo referentes a la transacción electrónica realizada. Los metadatos aportan información adicional y ayudan a organizar y catalogar los datos. Podemos encontrar metadatos en todos los ficheros digitales, desde web y documentos HTML hasta canciones, documentos de texto, vídeos, fotos, etc.
BIG DATA
06
LA MEDIDA DE LOS DATOS
BIG DATA
UNIDADES DE MEDIDA DE ALMACENAMIENTO
B I G D A T A
ESTO SE HA ACABADO...
Medicina En este campo, el uso de datos masivos se dirige a la detección temprana de enfermedades. A partir del análisis de la información genética y de distintas enfermedades se pueden generar medicamentos personalizados para cada paciente. A partir de los datos geográficos, las condiciones climatológicas y otras informaciones, se pueden predecir enfermedades en áreas específicas, prevenir brotes epidémicos, generar alertas, etc.
Meteorología A partir de los datos suministrados por los sensores y satélites meteorológicos pueden establecerse fiables pronósticos del tiempo, identificarse patrones de desastres naturales y proporcionar alertas tempranas ante eventos naturales peligrosos.
El fútbol ha evolucionado y ahora va más allá de ser simplemente un deporte jugado en un campo. Hoy en día es un campo de batalla estratégico donde los datos desempeñan un papel crucial. El Big Data en el fútbol funciona mediante la recopilación de una amplia variedad de datos durante los partidos y los entrenamientos. Entender que es el big data en el futbol es saber que estos datos van desde estadísticas básicas, como goles y asistencias, hasta información más detallada, como la distancia recorrida por los jugadores, la velocidad, la posesión del balón y la precisión en los pases. Los sensores incorporados en la ropa y los equipos de los jugadores, así como las cámaras instaladas en los estadios, recopilan datos en tiempo real. Estos datos se transmiten a sistemas de software especializados, que utilizan algoritmos avanzados para analizar patrones y tendencias. El objetivo es obtener información valiosa que pueda utilizarse para mejorar el rendimiento individual y del equipo.
Tráfico Los datos que transmiten los sistemas de GPS, los sensores de los vehículos y las cámaras de las carreteras ayudan en el campo de la logística identificando las rutas de entrega más eficaces, con lo cual se reducen los tiempos de entrega y los gastos de combustible.
Seguridad La información que proporciona el big data en este campo permite detectar patrones de conducta y prevenir amenazas a la seguridad, lo cual facilita la anticipación policial y la disminución de la criminalidad. De forma parecida, en ciberseguridad, el análisis de datos de tráfico de red ayuda a prevenir fraudes cibernéticos y ataques de piratas informáticos.
Ocio y comercio El big data permite atraer consumidores y orientar anuncios. Empresas como Netflix generan contenidos específicos a partir de los hábitos de consumo de sus clientes. Empresas como Amazon estudian los hábitos de compra e intereses de sus clientes, además de las tendencias del momento, para determinar con antelación qué productos serán más interesantes.