Want to create interactive content? It’s easy in Genially!

Get started free

DATOS ESTRUCTURADOS - SEMIESTRUCTURADOS Y NO ESTRUCTURADOS

carlos chavez

Created on November 6, 2022

DEFINICIÓN Y EJEMPLOS DE CADA UNO

Start designing with a free template

Discover more than 1500 professional designs like these:

Transcript

TIPOS DE DATOS

Estos conceptos son de uso habitual en el ámbito del Big Data y hacen referencia a la estructura con la que se organizan los datos.

Es decir, se centran en la manera en que los datos se agrupan, almacenan y se relacionan entre sí, de forma que puedas localizarlos fácilmente, acceder a ellos, analizarlos o modificarlos.

Básicamente, son aquellos que se encuentran ordenados

Datos estructurados

Estos datos se gestionan mediante un tipo de lenguaje de programación estructurado, conocido como SQL (Structured Query Language)

+nf

  • Una tabla Excel.
  • Hojas de cálculo.
  • Bases de datos de cualquier otro tipo.
  • Aplicaciones para realizar cuestionarios tipo test.
  • Formularios web.
  • Fichas estandarizadas de clientes.
  • Encuestas a usuarios de un servicio.

+nfo

+info

No encajan en un formato de tablas/filas/columnas, sino que se organizan mediante etiquetas o «tags» que permiten agruparlos y crear jerarquías. También se les conoce como no relacionales o NoSQL.

Datos semiestructurados

Entre las principales fuentes para recabarlos están los mencionados correos electrónicos

  • Archivos comprimidos.
  • XML y otros lenguajes de marcado.
  • Ejecutables binarios.
  • Paquetes TCP / IP

Datos no estructurados

Suponen alrededor del 80 % de los datos existentes en cualquier organización y su manejo te resulta mucho más dificultoso que en los dos casos anteriores

  • Documentos de oficina en archivos de texto.
  • Archivos de imágenes.
  • Archivos PDF.
  • Archivos de registro y de datos de aplicaciones como .ini o .dll.
  • Datos de redes sociales como Facebook y Twitter o de plataformas como YouTube.
  • Datos de ubicaciones y mensajería instantánea.
  • Grabaciones telefónicas, archivos de audio como MP3.

Los siguientes puntos destacan las diferencias entre los datos estructurados frente a los datos no estructurados frente a los datos semiestructurados:

Organización: Los datos estructurados están bien organizados; por lo tanto, tiene el nivel más alto de organización, mientras que los datos semiestructurados están parcialmente organizados; por lo tanto, el nivel de organización es menor que el de los datos estructurados pero mayor que el de los datos no estructurados.

Los datos estructurados dependen de la base de datos relacional o del esquema, por lo que son menos flexibles y difíciles de escalar, mientras que los datos semiestructurados son más flexibles y más simples de escalar que los datos estructurados.

Sin embargo, los datos no estructurados no tienen un esquema que los haga más flexibles y escalables de los otros dos. Versionado: Dado que los datos estructurados se basan en una base de datos relacional, el control de versiones se realiza sobre tuplas, filas y tablas. Por otro lado, en los datos semiestructurados, las tuplas o los gráficos son posibles, ya que solo se admite una base de datos parcial.

Por último, en los datos no estructurados, es probable que el control de versiones sea un dato completo, ya que no hay soporte de base de datos. Gestión de transacciones: Tambien en los datos estructurados, ni la gestión de transacciones ni la concurrencia de datos están presentes.