Want to make creations as awesome as this one?

Transcript

start

Nombre: Asgary Nieto TerrazasMatrícula: 22006312Módulo: Análisis de datos v1Fecha: 14 de julio del 2024

R3. Data Mining

+ info

"Data Mining es el proceso de extraer información útil de una acumulación de datos, a menudo de un almacén de datos o de la recopilación de conjuntos de datos vinculados. Las herramientas de minería de datos incluyen potentes capacidades estadísticas, matemáticas y analíticas cuyo propósito principal es examinar grandes conjuntos de datos para identificar tendencias, patrones y relaciones para respaldar la toma de decisiones y la planificación fundamentadas." (SAP, s.f.)

data mining

70's

1970: El señor Edgar Frank "Ted" Codd, define el modelo relacional. 1974: El grupo de IBM desarrolla el lenguaje SEQUEL.1976: SEQUEL es renombrado a SQL.1977: Larry Ellison basado en el trabajo de Edgar Frank Codd creó el Relational Software System que actualmente se conoce como Oracle Corporation.

1943

Descubrimiento de Redes Neuronales

1936

Máquina Universal de Turing

1763

Los inicios estadísticos de la minería de datos fueron puestos en marcha por el Teorema de Bayes

orígenes del data mining

90's

2000 >

1990

1989

1960

La minería de datos se volvió no solo más poderosa, sino también más prolífica en todo tipo de situaciones.

En los ulitmos años, los avances en potencia y velocidad de procesamiento han permitido pasar de prácticas manuales, tediosas y lentas al análisis de datos rápido, sencillo y automatizado. Cuanto más complejos sean los conjuntos de datos recopilados, mayor será el potencial para descubrir información relevante.

Se acuña el termino "Minería de datos" en B.D.

El término Descubrimiento de Conocimiento en Bases de Datos (KDD) empezó a utilizarse en 1989 para referirse al amplio proceso de búsqueda de conocimiento en bases de datos.

Comienzos del almacenamiento y procesamiento de datosLos primeros sistemas de gestión de bases de datos (DBMS) comienzan a ser desarrollados y utilizados.

Referencias

Almacén de datos

Un almacén de datos se define como la recopilación de datos integrados de múltiples fuentes que servirán para realizar consultas y tomar decisiones.Hay tres tipos de datawarehouse: Enterprise datawarehouse, Data Mart y Virtual Warehouse.

Bases de datos transaccionales

Las bases de datos transaccionales son una colección de datos organizados por marcas de tiempo, fecha, etc. para representar transacciones en bases de datos.

World Wide Web (WWW)

WWW se refiere a World wide web es una colección de documentos y recursos como audio, video, texto, etc., que se identifican mediante localizadores uniformes de recursos (URL) a través de navegadores web, vinculados por páginas HTML y accesibles a través de la red de Internet.

Bases de datos de series temporales

Las bases de datos de series temporales contienen datos bursátiles y actividades registradas por el usuario.

Bases de datos espaciales

Almacena datos en forma de coordenadas, topología, líneas, polígonos, etc.

Bases de datos multimedia

Las bases de datos multimedia consisten en medios de audio, video, imágenes y texto.

Archivos planos

Los archivos planos se definen como archivos de datos en formato de texto o binario con una estructura que se puede extraer fácilmente mediante algoritmos de minería de datos. Por ejemplo archivos CSV.

Bases de datos relacionales

Una base de datos relacional se define como la colección de datos organizados en tablas con filas y columnas.

Fuentes en el data mining

En el data mining se sigue un método cientifico para generar nuevo conocimiento o información y aplicarlo para beneficio de los interesados, mediante diversas métodologías para alcanzar un objetivo o resolver una problemática, considerando que el método cientifico "ordena los pasos que conducen la investigación y la exploración de lo desconocido en ciencia." (Fernandes, s.f.), en donde en el data mining, los pasos serán:

5. Implementacióne implantación

4. Evaluación

3. Modelado

1. Comprensión del Negocio

2. Selección y preparación de los datos

métodos científicos en el data mining

+ info

3 herramientas para visualizar datos

Tableau

Tableau es una plataforma de análisis visual, transforma la manera en que se usan los datos para resolver problemas. Además, permite a las personas y las organizaciones sacar el máximo partido de los datos.Características:

  • Fácil acceso desde diferentes fuentes.
  • Sin necesidad de conocimientos técnicos o de programación.
  • Respuesta rápida para hacer un tablero.

Power BI

Es una colección de servicios de software, aplicaciones y conectores que funcionan conjuntamente para convertir orígenes de datos sin relación entre sí en información coherente, interactiva y atractiva visualmente. Características:

  • Cuenta con la capacidad de poder conectarse con muchos orígenes de datos externos.
  • No exige que el usuario cuente con conocimientos sobre lenguajes de programación.
  • La plataforma dispone de herramientas para identificar errores y garantizar la calidad de los datos.
  • Cuenta con visualizaciones integradas, se integra con lenguajes estadísticos R y Python para generar visualizaciones personalizadas.

QlikView

Es una de las principales herramientas de Business Intelligence usada para convertir datos que estén sin procesar en conocimiento. Es utilizada principalmente para consolidar, buscar y analizar visualmente datos y convertirlos en información comercial valiosa.Características:

  • Manipula instantáneamente los conjuntos de datos usando manipulaciones en memoria
  • Los requisitos de hardware son económicos.
  • Tiene capacidades de visualización rápidas y potentes.
  • Los usuarios que no sean técnicos pueden trabajar con facilidad con esta herramienta
  • Respuesta instantánea y es altamente escalable
  • Es muy flexible

2 ejemplos de minería de datos

Banco: Un banco quiere ofrecer un nuevo producto de tarjeta de crédito para jóvenes que han alcanzado la mayoría de edad y están en su primer empleo, buscando empezar a generar historial crediticio. Antes de lanzar el producto, desean realizar un análisis con los clientes que ya tienen una tarjeta de crédito y que se encuentran en un rango de edad similar, para revisar los beneficios, costos, intereses que están dispuestos a cubrir y el crédito a ofrecer.

Base de Conocimiento: Base de datos de conocimiento sobre aquellos beneficios que más valoran los jóvenes, el tipo de compras o servicios que más adquieren, el rango de crédito que suelen utilizar y los interes que aceptan.

Interfaz Gráfica de Usuario: Tableau para los dashboards interactivos, visualizar los resultados del análisis y facilitar la toma de decisiones.

Módulo de evaluación de patrones: SAS Data Mining para descubrir patrones y evaluar modelos predictivos.

Motor de Minería de Datos: SAS Data Mining, herramienta utilizada para realizar el análisis de datos

Servidor para el deposito de datos: Amazon Redshift para almacenar y gestionar todos los datos recopilados de las diferentes fuentes.

Fuentes de datos: Datos demográficos, tipos de servicios y compras realizadas, datos de crédito y tipos de pago al corte, solicitudes directas de usuarios sobre beneficios y/o servicios.

Escuela: Una escuela está preocupada por el abandono escolar de los estudiantes, por lo que quieren verificar si pueden predecirlo para llevar a cabo acciones que eviten dicha situación, esto mediante las calificaciones, asistencia y puntualidad, y la percepción de la escuela que tienen los alumnos.

Base de Conocimiento: Base de datos de conocimiento sobre los estudiantes que están en riesgo de abandono escolar.

Interfaz Gráfica de Usuario: Power BI para visualizar los resultados del análisis y facilitar la toma de decisiones, aprovechando el uso de SQL Server.

Módulo de evaluación de patrones: SQL Server Analysis Services (SSAS) para evaluación y visualización de patrones descubiertos en los datos.

Motor de Minería de Datos: SQL Server Analysis Services (SSAS), herramienta utilizada para realizar el análisis de datos.

Servidor para el deposito de datos: SQL Server utilizado para almacenar y gestionar todos los datos recopilados de las diferentes fuentes.

Fuentes de datos: Calificaciones, asistencia y puntualidad, y evaluación para conocer la percepción que tienen los alumnos sobre la escuela.

Cierre

Al realizar esta actividad, pude darme cuenta de la importancia que tiene el data mining en la actualidad en las diversas empresas o instituciones, aún siendo un campo que no lleva tanto tiempo como muchos otros. Es fundamental que las empresas o instituciones además de gestionar una gran cantidad de información, también puedan a través de ella extraer información valiosa para la toma de decisiones, la personalización de productos y servicios, la optimización de procesos, entre muchos beneficios que pueden obtener de sus propios datos. En esta actividad me sentí muy interesado, ya que me llamo la atención el funcionamiento del data mining y las diversas herramientas que existen, mismas que utilizan las grandes empresas, pero que también las pequeñas e incluso de forma personal pueden ser aprovechadas. Los estandares de la industria en la arquitectura del data mining me parecieron que se encuentran bien desarrollados, puesto que estos son escalables, eficientes y capaces de manejar grandes volúmenes de datos, es decir, son de utilidad para la minería de datos.Además, realizar el cuadro comparativo me permitió visualizar claramente las diferentes opciones disponibles en términos de herramientas y tecnologías para la minería de datos.

  • Barcelona Geeks. (2022, julio 5). Tipos de fuentes de datos en minería de datos. Barcelona Geeks. https://barcelonageeks.com/tipos-de-fuentes-de-datos-en-la-mineria-de-datos/
  • Beltrán Martínez, B. (n.d.). MINERÍA DE DATOS. Benemérita Universidad Autónoma de Puebla. https://www.cs.buap.mx/~bbeltran/NotasMD.pdf
  • Ciberseguridad. (n.d.). ¿Qué es Tableau? Funcionamiento y características. Ciberseguridad. https://ciberseguridad.com/guias/recursos/tableau/
  • Corona Organiche, E., Jiménez Alfaro, A. J., & Cortés Barrera, G. (2020, enero 05). Principales Metodologías en el Desarrollo de Proyectos de Minería de Datos. TecnoCultura. https://tecnocultura.org/index.php/Tecnocultura/article/view/9/9
  • Fernandes, A. Z. (n.d.). Método científico: qué es, objetivos y pasos. Toda Materia. https://www.todamateria.com/metodo-cientifico/
  • Lopez, Y. (2023). ¡La historia completa de las bases de datos SQL! EDteam. https://ed.team/blog/la-historia-completa-de-las-bases-de-datos-sql-o-relacionales
  • Microsoft Learn. (2024, March 22). ¿Qué es Power BI? - Power BI. Microsoft Learn. https://learn.microsoft.com/es-es/power-bi/fundamentals/power-bi-overview
  • MSoftware. (2023, febrero 10). ¿Qué es la Minería de Datos? Una Guía para Principiantes. LinkedIn. https://www.linkedin.com/pulse/qu%C3%A9-es-la-miner%C3%ADa-de-datos-una-gu%C3%ADa-para-principiantes-bmsoluciones/
  • Palma, C., Palma, W., & Pérez, R. (2009). Data Mining. El arte de anticipar. 10 casos reales. RIL editores. https://www.academia.edu/36530728/Data_Mining_El_arte_de_Anticipar
  • SAP. (n.d.). ¿Qué es la minería de datos? | Definición, importancia y tipos. SAP. https://www.sap.com/latinamerica/products/technology-platform/hana/what-is-data-mining.html
  • SAS Institute. (n.d.). Minería de datos: Qué es y por qué es importante. SAS Institute. https://www.sas.com/es_mx/insights/analytics/data-mining.html#dmhistory
  • Universidad Complutense de Madrid. (n.d.). ¿Qué es el Data Mining? Universidad Complutense de Madrid. https://www.masterdatascienceucm.com/que-es-el-data-mining/

Referencias

Obtenido de Universidad Computense de Madrid (s.f.)

  • Beltrán Martínez, B. (s.f.). MINERÍA DE DATOS. Benemérita Universidad Autónoma de Puebla. https://www.cs.buap.mx/~bbeltran/NotasMD.pdf
  • Lopez, Y. (2023). ¡La historia completa de las bases de datos SQL! EDteam. https://ed.team/blog/la-historia-completa-de-las-bases-de-datos-sql-o-relacionales
  • MSoftware. (10 de febrero de 2023). ¿Qué es la Minería de Datos? Una Guía para Principiantes. LinkedIn. https://www.linkedin.com/pulse/qu%C3%A9-es-la-miner%C3%ADa-de-datos-una-gu%C3%ADa-para-principiantes-bmsoluciones/
  • Palma, C., Palma, W., & Pérez, R. (2009). Data Mining. El arte de anticipar. 10 casos reales. RIL editores. https://www.academia.edu/36530728/Data_Mining_El_arte_de_Anticipar
  • SAS Institute. (n.d.). Minería de datos: Qué es y por qué es importante. SAS Institute. https://www.sas.com/es_mx/insights/analytics/data-mining.html

Referencias:

Obtenido de revista TecnoCultura (Corona Organiche et al., 2020)