Want to create interactive content? It’s easy in Genially!
DATOS ESTRUCTURADOS - SEMIESTRUCTURADOS Y NO ESTRUCTURADOS
carlos chavez
Created on November 6, 2022
DEFINICIÓN Y EJEMPLOS DE CADA UNO
Start designing with a free template
Discover more than 1500 professional designs like these:
Transcript
TIPOS DE DATOS
Estos conceptos son de uso habitual en el ámbito del Big Data y hacen referencia a la estructura con la que se organizan los datos.
Es decir, se centran en la manera en que los datos se agrupan, almacenan y se relacionan entre sí, de forma que puedas localizarlos fácilmente, acceder a ellos, analizarlos o modificarlos.
Básicamente, son aquellos que se encuentran ordenados
Datos estructurados
Estos datos se gestionan mediante un tipo de lenguaje de programación estructurado, conocido como SQL (Structured Query Language)
+nf
- Una tabla Excel.
- Hojas de cálculo.
- Bases de datos de cualquier otro tipo.
- Aplicaciones para realizar cuestionarios tipo test.
- Formularios web.
- Fichas estandarizadas de clientes.
- Encuestas a usuarios de un servicio.
+nfo
+info
No encajan en un formato de tablas/filas/columnas, sino que se organizan mediante etiquetas o «tags» que permiten agruparlos y crear jerarquías. También se les conoce como no relacionales o NoSQL.
Datos semiestructurados
Entre las principales fuentes para recabarlos están los mencionados correos electrónicos
- Archivos comprimidos.
- XML y otros lenguajes de marcado.
- Ejecutables binarios.
- Paquetes TCP / IP
Datos no estructurados
Suponen alrededor del 80 % de los datos existentes en cualquier organización y su manejo te resulta mucho más dificultoso que en los dos casos anteriores
- Documentos de oficina en archivos de texto.
- Archivos de imágenes.
- Archivos PDF.
- Archivos de registro y de datos de aplicaciones como .ini o .dll.
- Datos de redes sociales como Facebook y Twitter o de plataformas como YouTube.
- Datos de ubicaciones y mensajería instantánea.
- Grabaciones telefónicas, archivos de audio como MP3.
Los siguientes puntos destacan las diferencias entre los datos estructurados frente a los datos no estructurados frente a los datos semiestructurados:
Organización: Los datos estructurados están bien organizados; por lo tanto, tiene el nivel más alto de organización, mientras que los datos semiestructurados están parcialmente organizados; por lo tanto, el nivel de organización es menor que el de los datos estructurados pero mayor que el de los datos no estructurados.
Los datos estructurados dependen de la base de datos relacional o del esquema, por lo que son menos flexibles y difíciles de escalar, mientras que los datos semiestructurados son más flexibles y más simples de escalar que los datos estructurados.
Sin embargo, los datos no estructurados no tienen un esquema que los haga más flexibles y escalables de los otros dos. Versionado: Dado que los datos estructurados se basan en una base de datos relacional, el control de versiones se realiza sobre tuplas, filas y tablas. Por otro lado, en los datos semiestructurados, las tuplas o los gráficos son posibles, ya que solo se admite una base de datos parcial.
Por último, en los datos no estructurados, es probable que el control de versiones sea un dato completo, ya que no hay soporte de base de datos. Gestión de transacciones: Tambien en los datos estructurados, ni la gestión de transacciones ni la concurrencia de datos están presentes.