Want to create interactive content? It’s easy in Genially!

Reuse this genially

R3 Data Mining

sol pou

Created on February 14, 2024

Start designing with a free template

Discover more than 1500 professional designs like these:

Transcript

R3.DATA MINING

UNIVERSIDAD VIRTUAL DEL ESTADO DE GUANAJUATO.

Magdalena Pou Toledo. 21006033. Análisis de datos v2. Reto 3 data Mining. Tania Lozano Hernández. 14/02/2024.

¿Qué es el Data Mining?

También conocido como minería de datos, es el proceso de descubrir patrones, tendencias y relaciones significativas o información útil dentro de conjuntos de datos grandes y complejos. Este proceso implica utilizar técnicas y algoritmos estadísticos, matemáticos y computacionales para explorar y analizar grandes volúmenes de datos con el fin de encontrar información relevante que pueda ser utilizada para tomar decisiones empresariales, predecir comportamientos futuros, identificar oportunidades o resolver problemas.

Origenes del Data Mining.

1969

2015

1990

Coleccion de datos.

Cambia y sorprende.

Almacen de datos.

2001

1989

Accesos de datos.

Mineria de datos.

Fuentes de origenes de datos.

Base de datos.

Ya sean relacionales o no relacionales, a través de la conexión OLAP u ODBC.

Las fuentes de datos tienen sus orígenes en diversas áreas y contextos. Aquí hay una descripción de algunos de los orígenes comunes de las fuentes de datos: Transacciones comerciales, Sensores y dispositivos IoT, Medios sociales y web, Datos gubernamentales, Investigación científica, Datos de clientes y usuarios.

Archivos

Como pueden ser .txt o .csv, o llamados de texto plano, o bien archivos tipo Excel

Web

Datos de utilización, perfiles de utilización, xml, html, multimedia, enlaces

El método cientifico y el Data Mining.

El método científico y el data mining están relacionados en el sentido de que ambos se centran en la recopilación, análisis y aplicación de datos para descubrir patrones, establecer relaciones y obtener conocimientos. Aunque tienen enfoques diferentes, comparten ciertos principios básicos.

INFORMACION EXTRA EN IMAGEN

Oracle Data Miner

Herramientas de visualizacion

Minero de datos de Oracle permite a las empresas, los analistas de datos y los científicos de datos ver datos y trabajar directamente dentro de la base de datos mediante un editor de flujo de trabajo simple de arrastrar y soltar. documenta y captura los pasos del flujo de trabajo analítico gráfico que los usuarios realizan para explorar los datos. Además, su flujo de trabajo es simple y útil para ejecutar metodologías analíticas y compartir conocimientos.

Qlik

Le brinda visualización de datos y análisis impulsada por IA, colaborativa, accionable y en tiempo real Qlik acelera la ingesta, replicacion de datos y transmisión a través de varias aplicaciones heterogéneas de mainframe, SAP, SaaS y bases de datos. Puede automatizar la generación de código de diseño y ETL junto con las actualizaciones continuas.

Apache Mahout

Mahout apache es un Scala DSL matemáticamente expresivo y un marco de álgebra lineal distribuida especialmente diseñado para que científicos de datos, estadísticos y matemáticos implementen sus algoritmos.

Resultados Esperados: Identificación de las principales causas de los tiempos de ciclo prolongados. Recomendaciones para mejorar la eficiencia y reducir los tiempos de ciclo. Optimización de los procesos de producción y aumento de la productividad de la planta.

Efecto WOW

Caso 1. Tiempos de ciclo productivos

Este caso ilustra cómo el data mining puede ser utilizado para analizar y optimizar los tiempos de ciclo productivos en una planta de manufactura, lo que puede conducir a mejoras significativas en la eficiencia operativa y la rentabilidad.

El análisis de los tiempos de ciclo productivos es un escenario común donde el data mining puede ser aplicado con éxito.

Módulo de evaluación de patronesEl motor de Elastic recopila los datos y los muestra las tendencias obtenidas más significativas

Fuente de datosLos datos provenientes de las máquinas se generan en dos tipos de formato, .txt y .xml

Interfaz gráficaTanto Kafka, NodeRed y Elastic tienen su propia interfaz para manejar el control de los datos com para establecer las vistas

Servidor para el déposito de datosLos datos se recogen a través de FileBeat y son enviados al servidor de Kafka donde se almacenan por medio de topics

Puntos de informacion.

Base de conocimientoLa base de cocimiento es a partir de la medición anterior de los tiempos de ciclo, y el impacto cuando una máquina falla

Motor de minería de datosNode RED se encarga de clasificar, asociar y agrupar los registros de acuerdo a los topics definidos

Caso 2. Fallas comunes en Producción.

El objetivo de este proyecto es identificar los patrones de fallas en los diferentes productos y procesos para establecer el motivo de las fallas, como mantenimientos no hechos, cambios de mateerial u operador, afectaciones propias del modelo, etc. La extracción de la información se hará con el MES existente.

Módulo de evaluación de patronesSe extraen los casos frecuentes y se establecen los patrones de falla

Fuente de datosToda la información acerca de las tarjetas, procesos y estatus son almacenadas en el MES.

Interfaz gráficaLa visualización se hace a través de Qlik para el modelo de fallas y visualización del historial

Servidor para el déposito de datos Los datos son extraidos por medio de ETL a un servidor FTP en donde se hace el procesamiento de la info.

Puntos de informacion.

Base de conocimientoSe relacionan además las bases de datos de otros componentes de la línea para expandir la visión de las fallas y sus tickets de falla de esa tarjeta.

Motor de minería de datosUtilizando técnicas de clasificación y asociación las tarjetas son ubicadas por modelo, area y linea.

Resumen comparativo

Conclusiones

el data mining ofrece un conjunto diverso de herramientas y técnicas que pueden ser aplicadas en una variedad de contextos para descubrir conocimientos valiosos y generar valor para las organizaciones y la sociedad en general. Su capacidad para analizar grandes volúmenes de datos y encontrar patrones significativos lo convierte en una herramienta invaluable en la era de la información.

En conclusión, el data mining es una poderosa herramienta que permite descubrir patrones, tendencias y relaciones significativas en grandes conjuntos de datos. A través de técnicas y algoritmos avanzados, el data mining facilita la extracción de información valiosa que puede utilizarse para tomar decisiones informadas, identificar oportunidades, resolver problemas y mejorar procesos en una amplia variedad de áreas y sectores.

Identificación de Patrones Ocultos, Predicción y Modelado, Optimización y Mejora de Procesos, Toma de Decisiones Informadas, Competitividad y Ventaja Competitiva.

Referencias

Acharya, D. P. (2023). Los 13 mejores software de minería de datos para pequeñas y grandes empresas en 2023. Geekflare. https://geekflare.com/es/best-data-mining-software/ Corporativa, I. (n.d.). Descubre cómo el “data mining” predecirá nuestro comportamiento. Iberdrola. https://www.iberdrola.com/innovacion/data-mining-definicion-ejemplos-y-aplicaciones Cutro, A. C. (2010, February 26). 1.7.1 Evolución Historia de la Minería de Datos. Dataprix. Retrieved May 26, 2023, from https://www.dataprix.com/es/mineria-datos-aplicada-encuesta-permanente-hogares/171-evolucion-historia-mineria-datos De Ceupe, B. (2019). Origen del Data Mining. Ceupe. https://www.ceupe.com/blog/origen-del-data-mining.html EcuRed. (n.d.). Minería de Datos - EcuRed. https://www.ecured.cu/Miner%C3%ADa_de_Datos _ESIC Business & Marketing School. (n.d.). Minería de datos: qué es, cómo es el proceso y a qué áreas se puede aplicar. ESIC. https://www.esic.edu/rethink/tecnologia/mineria-datos-proceso-areas-se-puede-aplica Gutiérrez Cruz, D. G. C., Albarrán Fernández, Y. A. A. F., & Rodríguez Páez, C. L. R. P. (2017). Manual para prácticas del laboratorio de cómputo: Asignatura: Minería de Datos. Centro Universitario Nezahualcóyotl. Retrieved May 26, 2023, from http://ri.uaemex.mx/bitstream/handle/20.500.11799/69981/secme-30553_1.pdf?sequence=1 Minería de Datos. (n.d.). SG Buzz. https://sg.com.mx/content/view/725 Minewiskan. (2022a, September 27). Conceptos de minería de datos. Microsoft Learn. https://learn.microsoft.com/es-es/analysis-services/data-mining/data-mining-concepts?view=asallproducts-allversions Minewiskan. (2023, May 8). Orígenes de datos admitidos en SQL Server Analysis Services modelos tabulares 1200. Microsoft Learn. https://learn.microsoft.com/es-es/analysis-services/tabular-models/data-sources-supported-ssas-tabular?view=asallproducts-allversions ¿Qué es la minería de datos? | IBM. (n.d.). https://www.ibm.com/mx-es/topics/data-mining Timetoast. (1960). Evolución de la Minera de Datos timeline. Timetoast Timelines. https://www.timetoast.com/timelines/evolucion-de-la-minera-de-datos Universidad Católica de Honduras. (2018). Minería de Datos. Retrieved May 26, 2023, from https://www.studocu.com/latam/document/universidad-catolica-de-honduras/sistemas-inteligentes-para-negocios/exposicion-bi-data-mining/6055327

Gracias

¡por su atencion!