Want to create interactive content? It’s easy in Genially!

Get started free

Diapositivas método CRISP-DM

PAOLA GUADALUPE MONTOYA SALAS

Created on February 2, 2024

Start designing with a free template

Discover more than 1500 professional designs like these:

Higher Education Presentation

Psychedelic Presentation

Vaporwave presentation

Geniaflix Presentation

Vintage Mosaic Presentation

Modern Zen Presentation

Newspaper Presentation

Transcript

Metodología CRISP-DM

Alumnas:

Paola Gpe Montoya Salas

1. Introducción

¿Qué es ?

Crisp-DM, por sus siglas en inglés Cross-Industry Standard Process for Data Mining, es una metodología ampliamente reconocida y utilizada en el campo del análisis de datos y la minería de datos. Desarrollada por un consorcio de empresas líderes en tecnología y consultoría, Crisp-DM ofrece un marco estructurado y paso a paso para guiar a los profesionales a lo largo de todo el ciclo de vida de un proyecto de minería de datos, desde la comprensión del negocio hasta la implementación de soluciones. Esta metodología se caracteriza por su enfoque iterativo y flexible, lo que la hace adaptable a una variedad de contextos y proyectos de análisis de datos.

‘Tus contenidos gustan, pero enganchan mucho más si son interactivos’

Fases

Fases

2. Entendimiento de los datos

1. Entendimiento del negocio

Comprende la recolección inicial de los datos con el objetivo de establecer un primer contacto con el problema, familiarizarse con ellos, identificar su calidad y establecer las relaciones más evidentes que permitan definir las primeras hipótesis.

Esta fase es necesaria para que los miembros del equipo de desarrollo puedan entender el contexto del proyecto y resolver las dudas sobre el negocio que se pudieran tener. Agrupa las tareas de comprensión de los objetivos y requisitos del proyecto desde una perspectiva de negocio, con el fin de convertirlos en objetivos técnicos y en un plan de proyecto.

Fases

4. Modelado

3. Preparación de los datos

El primer paso es seleccionar los algoritmos de modelado más apropiados al problema. Posteriormente se genera un plan de prueba, donde configuramos los valores de los parámetros que se usarán para los algoritmos de aprendizaje automático (conocido como el Machine Learning), ya que muchos de estos pueden ser configurados para determinar las características del modelo que se generará.

Es la fase intermedia para seleccionar, limpiar y generar conjuntos de datos correctos, organizados y prepararlos para la fase de modelado. Es la fase crítica del proyecto de minería de datos, los errores en los datos que se pasan por alto y que no son resueltos en esta fase, evidentemente se trasladarían hasta la fase de modelado, y por consecuente generaría una reducción en la exactitud de los modelos o incluso, sería imposible entregar al cliente resultados basados en datos que aún contienen errores no detectados.

+ info

Fases

6. Despliegue

5. Evaluación

Aquí, el modelo debe ser colocado en producción, de modo a agregar valor para el negocio. La forma como eso es hecho varía mucho, dependiendo del tipo de modelo y proyecto. Ese modelo debe estar expuesto para acceso, normalmente almacenado en la nube o en servidores locales de la propia empresa.

se evalúa el modelo, teniendo en cuenta el cumplimiento de los criterios de éxito del problema, debe considerarse que la fiabilidad calculada para el modelo se aplica solamente para los datos sobre los que se realizó el análisis. Es preciso revisar el proceso, teniendo en cuenta los resultados obtenidos, para poder repetir algún paso anterior, en el que se pueda haber cometido algún error. Si los modelos obtenidos cumplen con las expectativas de negocio, se continua con la explotación del modelo, si no, se evalúa en esta fase si se vuelve a iterar nuevamente sobre los pasos anteriores con el objetivo de encontrar nuevos resultados.

+ info

Caso de estudio (ejemplo)

  • Evaluar: Medir la precisión del modelo y ajustarlo si es necesario.
  • Implementar soluciones: Usar el modelo para retener clientes.

Mejorar la retención de clientes en una empresa de telecomunicaciones

  • Entender el problema: Identificar la cancelación como un desafío clave.
  • Recopilar datos: Obtener registros de llamadas y otros datos relevantes.
  • Preparar datos: Limpiar y organizar los datos para el análisis.
  • Modelar: Desarrollar un modelo predictivo de cancelación.

Resultados

Reducción exitosa en la tasa de cancelación de clientes.

Bibliografía

Referencias

  • https://www.iic.uam.es/innovacion/metodologia-crisp-dm-ciencia-de-datos/
  • https://ipmoguide.com/crisp-dm-metodologia-de-datos/
  • https://blog.mbauspesalq.com/es/2022/05/31/crisp-dm-las-6-etapas-de-la-metodologia-del-futuro/#:~:text=Crisp%2DDM%20es%20una%20metodolog%C3%ADa,debe%20estar%20siempre%20en%20funcionamiento.

Conclusión

Conclusión

La metodología CRISP-DM proporciona un marco estructurado y sistemático para abordar proyectos de minería de datos, desde la comprensión del negocio hasta la implementación de soluciones, lo que facilita la toma de decisiones informadas y la obtención de resultados efectivos.

‘Tus contenidos gustan, pero enganchan mucho más si son interactivos’

4. Modelado

Luego se construyen los modelos, ejecutando los algoritmos seleccionados sobre los datos preparados con el fin de generar uno o más modelos y calcular las métricas. Para finalizar se evaluan los resultados, donde se analizan las métricas de evaluación obtenidas con el fin de conocer la bondad de los modelos generados y garantizar que cumplan con los criterios de éxito definidos al inicio del proyecto.

5. Evauación

Para llevar a cabo esto, se debe realiza una evaluación formal de los resultados obtenidos en las fases anteriores del proyecto, teniendo en cuenta los criterios de éxito de negocio y explicando las causas que provocaron los grados de éxito alcanzados y revisando todo el proceso llevado a cabo con el fin de encontrar errores que puedan afectar al éxito