Want to create interactive content? It’s easy in Genially!
Tipos de tareas de Minería de Datos
Ernesto Esliter
Created on July 14, 2024
Start designing with a free template
Discover more than 1500 professional designs like these:
Transcript
Tipos de tareas de minería de datos
Las tareas de minería de datos se pueden clasificar generalmente en dos tipos según lo que intenta lograr una tarea específica. Esas dos categorías son: tareas descriptivas y tareas predictivas. Las tareas de minería de datos descriptivas caracterizan las propiedades generales de los datos, mientras que las tareas de minería de datos predictivas realizan inferencias sobre el conjunto de datos disponible para predecir cómo se comportará un nuevo conjunto de datos.
Predictivas
Descriptivas
Generalmente encuentran datos que describen patrones y generan información nueva y significativa a partir del conjunto de datos disponible.
Generan un modelo a partir del conjunto de datos disponible que es útil para predecir valores futuros o desconocidos de otro conjunto de datos de interés.
Tareas de Minería de Datos Descriptivas
Identificación de Patrones Secuenciales
Minería de Correlaciones
Asociación
Clustering
Es una técnica de aprendizaje no supervisada que tiene como objetivo identificar similitudes y patrones en un conjunto de datos. Sus algoritmos requieren definir el número de agrupaciones, medidas de similitud y métodos de agrupación. La agrupación debe ser de una manera que maximice la similitud dentro de los grupos y minimice la similitud entre diferentes grupos.
Es un método empleado para identificar relaciones y asociaciones entre variables en grandes conjuntos de datos. La regla de asociación utiliza declaraciones si-entonces para identificar el patrón entre diferentes compras de cualquier producto.
El análisis de correlación es un método estadístico que se utiliza para descubrir si existe una relación entre dos variables/conjuntos de datos y qué tan fuerte puede ser esa relación.
También conocido como minería de secuencias, es una técnica que se utiliza para identificar patrones, tendencias o estructuras recurrentes dentro de una secuencia de puntos de datos. A diferencia de otras formas de reconocimiento de patrones que pueden ignorar el aspecto temporal de los datos, el descubrimiento de secuencias tiene en cuenta el orden en que ocurren los puntos de datos.
Tareas de Minería de Datos Predictivas
Análisis de series temporales (Time Series Analysis)
Clasificación
Regresión
Predicción
Es una técnica de aprendizaje supervisado destinada a predecir valores numéricos en lugar de etiquetas de clases. Utiliza datos históricos para establecer una relación entre variables dependientes e independientes. La regresión lineal, la regresión logística y la regresión polinómica son algoritmos de regresión populares.
Es una técnica de aprendizaje supervisado que se utiliza para categorizar datos en clases o etiquetas predefinidas. Implica entrenar un modelo utilizando un conjunto de datos etiquetados, que luego se utiliza para predecir la clase de datos nuevos sin etiquetar. Los algoritmos comunes utilizados para la clasificación incluyen árboles de decisión, máquinas de vectores de soporte y redes neuronales.
Es la técnica utilizada para la predicción de valores de datos faltantes o futuros. Esto implica desarrollar un modelo basado en los datos disponibles y este modelo se utiliza para predecir valores futuros de un nuevo conjunto de datos de interés.
El análisis de series de tiempo es una forma específica de analizar una secuencia de puntos de datos recopilados durante un intervalo de tiempo. En el análisis de series de tiempo, los analistas registran puntos de datos a intervalos consistentes durante un período de tiempo determinado en lugar de simplemente registrar los puntos de datos de forma intermitente o aleatoria.
Ejemplo de asociación: Un establecimiento Minorista.
En este caso, la función de las reglas de asociación es la de revelar conexiones entre artículos que se compran juntos frecuentemente. Por ejemplo: “Si un cliente compra pan, es probable que también compre leche”. Estas reglas de asociación extraídas ayudan a guiar las decisiones sobre el diseño de la tienda, la colocación de productos y las estrategias de marketing dirigidas.
Ejemplo de Minería de Correlaciones: Marketing
Un ejemplo común se da en los centros comerciales, los propietarios de estos ejecutan ciertas estrategias de promoción, como anuncios en TV, en las redes sociales, etc., para aumentar las ventas. Después de este acto de promoción, se analiza el comportamiento de las ventas, si aumentaron, se demuestra que las campañas de promoción tuvieron un impacto positivo. En función de estos resultados, puede decidir si la campaña de promoción vale la pena o si es mejor invertir en otras estrategias.
Ejemplo de clustering: Segmentación de clientes
Empresas como Amazon han detectado que las personas entre 20 y 40 años tienen un gusto particular en lo que respecta a la industria de la ropa. Este grupo tiene una gama alta de gastos y prefiere ropa de marcas caras. La frecuencia de compra también es alta en comparación con otros grupos, como las personas de 40 a 60 años que prefieren ropa sencilla y no consideran las marcas para comprar ropa. Al conocer estos datos, las marcas se dirigen al primer grupo a través de correos electrónicos y redes sociales y aumentan sus ventas.
Ejemplo de patrones secuenciales: Walmart
Uno de los casos de uso mas comunes es el de la identificación de compras a futuro. Tomemos a la tienda Walmart, al analizar las secuencias de compra de los clientes, pueden predecir compras futuras y optimizar la recomendaciones de productos en su sitio web. Por ejemplo, cuando un cliente adquiere productos prenatales (vitaminas, ropa para mujeres embarazadas, etc.), es capaz de predecir que a mediano plazo, este cliente estará interesado en artículos para bebé; está información es utilizada en campañas de marketing personalizadas.
Ejemplo de Predicción: Bolsa de trabajo
Un ejemplo común se da en sitios como LinkedIn, los cuales cuentan con modelos con los que pueden predecir los ingresos de un empleado en función de su educación, la experiencia laboral y ciertos factores demográficos como el lugar de residencia, el sexo, etc.
Ejemplo de Análisis de Series de Tiempo: El Clima
Un ejemplo de análisis de series de tiempo podría ser el aumento y la caída de la temperatura en el transcurso de un día. Al realizar un seguimiento de la temperatura exterior específica en intervalos de una hora durante 24 horas, se tiene una imagen completa del aumento y la caída de la temperatura en dicha área. Entonces, supongamos que se sabe que el día siguiente será similar en términos de precipitación y humedad. En ese caso, se puede hacer una suposición más fundamentada sobre la temperatura en momentos específicos.
Ejemplo de Regresión: Bienes raices
Uno de los usos de la Regresión es el de predecir el precio de venta de una casa en función de factores como su tamaño, número de dormitorios, ubicación, etc. Se pueden utilizar datos históricos sobre ventas de casas anteriores para entrenar un modelo de regresión para este propósito.
Ejemplo de Clasificación: Detección de Spam
Utilizando un conjunto de datos de correos electrónicos etiquetados como spam o no spam, se puede entrenar un modelo de clasificación para predecir si los correos electrónicos nuevos entrantes son spam o no en función de su contenido y otras características.