Want to create interactive content? It’s easy in Genially!

Get started free

R3 Data Mining

gerardo mellado lopez

Created on October 29, 2023

Start designing with a free template

Discover more than 1500 professional designs like these:

Transcript

R3. Data Mining

UVEG

Estudiante: Gerardo Mellado LópezMateria: Análisis de datos Fecha de elaboracion: 29/10/23

Empezar

¿Qué es el data mining?

Es el proceso de explotacion, busca encontrar significado y conocimiento en grandes cantidades de información.

¿Cuáles son los orígenes del data mining?

*1960- El Data Mining ha venido evolucionando a través del tiempo desde su primera mención. *1980- Se da un salto debido a las bases de datos relacionales *90's- Se impulsa por la consolidación del data warehouse, donde a través del concepto de almacenes de datos adquiere mayor acceso a volúmenes de estos. *Ultimos 20 años- La evolución del Data Mining se integra e iguala para aprovechar el ritmo del Big Data, ampliando sus tecnologías, procedimientos y métodos.

¿Cuáles son las fuentes que pueden ser integradas en el data mining?

-Archivos planos -Bases de datos relacionales -Almacén de datos -Bases de datos transaccionales -Bases de datos multimedia -Bases de datos espaciales -Bases de datos de series temporales -World Wide Web (WWW)

¿Cómo son aplicados los métodos cientificos en el data mining?

Etapas clave en las que se aplican los métodos científicos en el data mining: *Planteamiento del problema. *Diseño del experimento. *Recopilación y preparación de datos. *Análisis y modelado de datos. *Evaluación y validación. *Interpretación y comunicación de resultados. *Iteración y refinamiento. "Al aplicar los métodos científicos en el data mining, se busca asegurar la validez y confiabilidad de los resultados obtenidos, así como fomentar la reproducibilidad de los análisis y promover la transparencia en la toma de decisiones basadas en datos."

Herramientas para visualizar datos de resultados del data mining segun la arquitectura

Weka

Orange

RapidMiner

Es un software de machine learning de código abierto desarrollado en lenguaje Java por la universidad de Waikato, Nueva Zelanda. Uno de sus principales atractivos para los principiantes es su sencilla interfaz gráfica para el entrenamiento de modelos de machine learning.

Orange es un software de minería de datos de #codigoabierto que se utiliza para visualizar, analizar y modelar datos. Orange proporciona una interfaz gráfica de usuario que permite a los usuarios crear flujos de trabajo de minería de datos, arrastrando y soltando widgets en una paleta..

Es un programa informático para el análisis y minería de datos. Permite el desarrollo de procesos de análisis de datos mediante el encadenamiento de operadores a través de un entorno gráfico. Se usa en investigación y en aplicaciones empresariales.

Ejemplos hipotéticos donde se acercan dos clientes solicitando una solución de minería de datos

Primer ejemplo

+info

Segundo ejemplo

+info

En resumen, el cliente A se enfoca en mejorar el sistema de recomendación de productos utilizando datos de transacciones en línea, navegación web y redes sociales. Su solución utiliza técnicas de clasificación y agrupamiento para descubrir patrones y preferencias de los clientes. Por otro lado, el cliente B busca reducir el riesgo de abandono utilizando datos financieros y de riesgo crediticio. Su solución se basa en reglas de asociación y clasificación para identificar patrones de comportamiento y riesgos potenciales.

Conclusión

Ambos clientes presentan desafíos interesantes y tienen diferentes necesidades en cuanto a la minería de datos. Teniendo en cuenta que pueden utilizar ERP's, CRM's, Content Management y contar con un data warehouse, y que también quieren conocer las reacciones en redes sociales, el diseño ideal sería una solución integral que aproveche la infraestructura existente y brinde una visión total de los datos. El mejor diseño sería aquel que aproveche los datos almacenados en el data warehouse y se integre con los sistemas ERP y CRM para obtener una visión completa del ciclo de vida del cliente. Además, se deben implementar técnicas de análisis de sentimientos en las publicaciones de redes sociales para comprender las reacciones y opiniones de los clientes. Una interfaz gráfica de usuario intuitiva y fácil de usar permitirá a los usuarios explorar y visualizar los resultados del análisis de manera efectiva. Realizar esta actividad fue desafiante y enriquecedora. Me permitió aplicar mis conocimientos en minería de datos y arquitectura de soluciones . Los estándares de la industria vistos en la arquitectura de data mining son fundamentales para garantizar la calidad, validez y confiabilidad de los resultados obtenidos. Estos estándares, como la utilización de bases de datos estructuradas, almacenes de datos y técnicas de evaluación de patrones, brindan una base sólida para el análisis de datos y la toma de decisiones basadas en datos. Realizar el cuadro comparativo definitivamente enriqueció mis perspectivas respecto al data mining. Me permitió analizar y sintetizar las diferentes arquitecturas de soluciones de minería de datos, considerando los componentes clave y los requisitos de cada cliente. Esto me ayudó a comprender mejor la variedad de enfoques y consideraciones necesarias al diseñar soluciones de minería de datos para diferentes industrias y necesidades empresariales.

Referencias

Greyrat, R. (2022, 5 julio). Tipos de fuentes de datos en minería de datos – Part 1 – Barcelona Geeks. https://barcelonageeks.com/tipos-de-fuentes-de-datos-en-la-mineria-de-datos/ Equipo editorial de IONOS. (2023). Software de data mining: realiza análisis de datos más efectivos. IONOS Digital Guide. https://www.ionos.mx/digitalguide/online-marketing/analisis-web/software-de-data-mining-las-mejores-herramientas/ Cérquides J.R. (2003) Data Warehouse. [Versión en línea] Barcelona. Disponible en la base oceanoadm [1060106] Software y Soluciones de Analítica [SAS]. (2019). ¿Qué es la minería de datos? Recuperado el 6 de junio de 2020, de https://www.sas.com/es_mx/insights/analytics/data-mining.html#dmusers Universidad de Alcalá. (2018). ¿Sabes lo que es el Data Mining? Recuperado 3 de junio de 2020, de https://www.master-data-scientist.com/que-es-data-mining/ WideSkills. (2020). Data Mining Architecture | Data Mining tutorial. Recuperado 6 de junio de 2020, de https://www.wideskills.com/data-mining-tutorial/data-mining-architecture

¡Gracias!

Cliente B - Compañía de servicios financieros a. Fuentes de datos: Datos de transacciones financieras, información de cuentas de clientes, historial de pagos, datos demográficos y datos de riesgo crediticio. b. Servidor para el depósito de datos: Se utiliza una base de datos relacional para almacenar y gestionar los datos financieros de los clientes. c. Motor de minería de datos: Se utiliza un motor de minería de datos que implementa técnicas de reglas de asociación y clasificación para analizar los datos y descubrir patrones de comportamiento, segmentos de clientes y perfiles de riesgo. d. Módulo de evaluación de patrones: Se utiliza un módulo de evaluación de patrones que examina los resultados del motor de minería de datos y los evalúa para identificar patrones de comportamiento de los clientes, riesgos potenciales y oportunidades de negocio. e. Interfaz gráfica de usuario: Se desarrolla una interfaz gráfica de usuario interactiva que permite a los usuarios explorar los resultados del análisis de minería de datos, realizar análisis ad hoc y generar informes personalizados sobre riesgo crediticio, segmentación de clientes y recomendaciones de productos financieros. f. Base de conocimiento: Se establece una base de conocimiento que almacena los patrones descubiertos, reglas de asociación y perfiles de riesgo, lo que permite la generación de alertas, decisiones basadas en datos y estrategias de mitigación de riesgos.

Cliente A - Empresa de marketing digital a. Fuentes de datos: Datos de transacciones en línea, registros de navegación web, datos de redes sociales y datos demográficos de clientes. b. Servidor para el depósito de datos: Se utiliza un almacén de datos centralizado donde se integran y almacenan los diferentes conjuntos de datos. c. Motor de minería de datos: Se utiliza un motor de minería de datos que implementa algoritmos de clasificación y agrupamiento para analizar los datos y descubrir patrones y segmentos de clientes. d. Módulo de evaluación de patrones: Se emplea un módulo de evaluación de patrones que analiza los resultados del motor de minería de datos y los valida para identificar patrones de comportamiento de los clientes, preferencias de productos y tendencias de compra. e. Interfaz gráfica de usuario: Se desarrolla una interfaz gráfica de usuario intuitiva que permite a los usuarios interactuar con los resultados del análisis de minería de datos, visualizar los patrones descubiertos, realizar consultas y generar informes personalizados. f. Base de conocimiento: Se establece una base de conocimiento donde se almacenan los patrones y conocimientos descubiertos, lo que permite la generación de recomendaciones personalizadas, estrategias de marketing dirigidas y toma de decisiones basadas en los resultados del análisis.