Want to make creations as awesome as this one?

Transcript

Nombre: Anahi Sinaca Martinez

Empezar

Recopilación y análisis de

Datos

Ciencia de Datos

Que son los datos

Es un contenido informativo que se registra en algún soporte físico y/o electrónico.Los datos describen hechos empíricos, y para examinarlos deben de estar organizados.

Tipos de datos

Generado por Máquina

Datos Estructurados

Lenguaje Natural

Datos no Estructurados

Basado en Gráficos

Audio, video e imágenes

(López, C. 2024, Eficiencia empresarial a través de flujos de trabajo y análisis de datos, párr. 3)

Flujo de trabajo

Es un proceso de recolección, almacenamiento, limpieza, análisis y representación. Cuyo fin es generar reportes con KPI (Indicadores clave del negocio) que sean útiles para el mismo.

  1. Recopilaciónde datos. Se recopilan de fuentes de almacenamiento con información adecuada.
  2. Preparación de datos. En este paso se empieza a descartar información innecesaria o repetitiva, no apta para el análisis de datos.
  3. Introducción de datos. Los datos se envian y son traducidos a un lenguaje entendible.
  4. Procesamiento / limpieza de datos. A través de algoritmos por medio de una técnica de programación denominada machine learning son preparados y optimizados.
  5. Interpretación de datos. En este paso se utiliza la información antes dada para introducirlas en gráficas y tablas.
  6. Almacenamiento de datos. Consiste en el almacenamiento de toda esta información útil resultante del procesamiento y análisis de datos de forma segura.

Etapas de la ciencia de datos

Para mejorar la productividad en el trabajo

Recopilacion de datos

Por medio de:

  • Encuestas
  • Informes
  • Tablas
  • Softwares

Formatos de

LOS DATOS

  • Numérico
  • Alfabético
  • Gráfico

(Lenis, A. 2023, ¿Qué es el almacenamiento de datos, cómo funciona y qué tipos existen?, párr. 6-7)

02

Almacenamiento de datos

Existen dos tipos de almacenamiento de datos:Los primarios, que se encargan de recabar los datos de forma temporal mientras haya electricidad, de la misma forma que lo hace nuestra memoria a corto plazo; un ejemplo es la memoria de acceso aleatorio (RAM) de una computadora. Los secundarios, los cuales tienen la capacidad de grabar datos de manera permanente y sin perderlos, aun cuando no haya electricidad. De forma similar a nuestra memoria a largo plazo; un ejemplo es el disco duro (HDD) de la computadora.

Aspectos éticos

  • Establecer límites claros para la obtención de los datos.
  • Determinar la relevancia de los datos para el uso previsto.
  • Definir con claridad el uso que se dará a los datos antes de solicitarlos.
  • Abstenerse de utilizar los datos para usos distintos al determinado originalmente sin el consentimiento de las personas afectadas.
  • Asegurarse de proteger los datos contra el acceso ilícito o piratería.
  • Asegurar que los avances, prácticas y políticas sobre el uso de los datos sean abiertos y transparentes.
  • Garantizar que las personas cuyos datos se han recolectado tengan acceso a los mismos y puedan solicitar bien sea modificaciones o su eliminación definitiva.

(Buenadicha, C., Galdon Clavell, G., Hermosilla, M., Loewe, D. y Pombo, C. 2019, La gestión ética de los datos, p. 23)

Referencias

Fernandez, R. (2020, 9 abril). Tipos de Datos para un Data Scientist . Cursos de Programación de 0 a Experto Garantizados. Cursos de Programación de 0 A Experto Garantizados. https://unipython.com/tipos-de-datos-para-un-data- scientist/López, C. (2024, 5 marzo). Eficiencia empresarial a través de flujos de trabajo y análisis de datos. Icorp. https://icorp.com.mx/blog/flujos-de-trabajo-y-analisis- de-datos/Bantu Group. (2020, 30 marzo). Las 6 etapas del procesamiento y análisis de datos. https://www.bantugroup.com/blog/etapas-del-procesamiento-y-analisis-de- datosLenis, A. (2023, 20 enero) ¿Qué es el almacenamiento de datos, cómo funciona y qué tipos existen?. Hubspot. https://blog.hubspot.es/marketing/que-es- almacenamiento-de- datos#:~:text=El%20almacenamiento%20de%20datos%20es%20posible%20gracias%20a%20diferentes%20sistemas,transmisi%C3%B3n%20de%20datos%20por%20red.Buenadicha, C., Galdon Clavell, G., Hermosilla, M., Loewe, D. y Pombo, C. (marzo 2019). La gestión ética de los datos. BID. https://publications.iadb.org/publications/spanish/document/La_Gesti%C3%B3n_%C3%89tica_de_los_Datos.pdf

¡Gracias!

(Fernandez, R, 2012, Tipos de Datos para un Data Scientist, párr. 2)

Datos Estructurados

Los datos estructurados son datos que dependen de un modelo de datos, es fácil almacenarlas en tablas dentro de bases de datos o archivos excel.

Son datos que no son fáciles de encajar en un modelo de datos porque el contenido es específico del contexto o varía. Un ejemplo podria ser un correo electrónico. Aunque el correo electrónico contiene elementos estructurados como el remitente, el título y el cuerpo del texto, es un desafío encontrar el número de personas que han escrito un mensaje de correo electrónico de queja sobre un empleado específico porque existen muchas maneras de referirse a una persona. (Fernandez, R, 2012,Tipos de Datos para un Data Scientist, párr. 3)

El lenguaje natural es un tipo especial de datos no estructurados; es difícil de procesar porque requiere el conocimiento de técnicas específicas de ciencia de datos y lingüística.(Fernandez, R, 2012, Tipos de Datos para un Data Scientist, párr. 4)

El análisis de los datos de las máquinas se basa en herramientas altamente escalables, debido a su gran volumen y velocidad. Ejemplos de datos de máquinas son los registros del servidor web, los registros de detalles de llamadas o los registros de eventos de red.(Fernandez, R, 2012,Tipos de Datos para un Data Scientist, párr. 5)

Las estructuras de los gráficos utilizan nodos, bordes y propiedades para representar y almacenar los datos de los gráficos. Su lista de seguidores en Twitter es un ejemplo de datos basados en gráficos. El poder y la sofisticación proviene de múltiples gráficos superpuestos de los mismos nodos. (Fernandez, R, 2012, Tipos de Datos para un Data Scientist, párr. 7)

Las cámaras de alta velocidad en los estadios capturarán los movimientos de la pelota y del atleta para calcular en tiempo real, por ejemplo, el camino que toma un defensor en relación con dos líneas de base.(Fernandez, R, 2012, Tipos de Datos para un Data Scientist, párr. 8)