Want to make creations as awesome as this one?

Modelo de originación para crédito hipotecario

Transcript

Crédito HipotecarioPropuesta Modelo de Originación

Ariadna Elisa Lara Chávez

Proyecto - Modulo 2

Julio 2024

Diplomado Ciencia de Datos

Antecedentes

Dentro de Grupo Financiero Coppel se ha propuesto una estrategia de originación para créditos hipotecarios en 3 etapas:1. Etapa inicial: Uso del BC Score como determinante de rechazo.2. Etapa intermedia: 12 meses después de la apertura al mercado, uso de scores y/o modelos genéricos externos.3. Etapa final: 2 años después, creación de un score de originación interno.

El área de Riesgos cuenta con la información crediticia de los solicitantes y tiene las facultades para explorarla y proponer estrategias innovadoras

Desarrollo de un modelo de ML utilizando la información de las hipotecas externas disponibles en el expediente crediticio de los solicitantes.

Objetivo

Problemática

  • Línea de tiempo tradicional a largo plazo.
  • Uso de técnicas y herramientas más sofisticadas en la competencia.
  • Crecimiento en la oferta y demanda del producto.

Fuentes de datos

Información de enero a marzo 2023 de:

  • Solicitudes: Variables demográficas
  • Información interna
  • TL: Cuentas y créditos reportados del expediente crediticio
  • IQ: Consultas al expediente crediticio
  • PA: Información de domicilios reporatdos en el expediente crediticio

Tratamiento inicial

Reglas duras: Excluyen personas sin infromación crediticia y clientes con mal comportamiento. Hipotecas seleccionadas: Cuentas hipotecarios o de pagos fijos, diferente a contratos de arrendamiento, montos mayores a 100,000 pesos

Ingenieria de variables

Se crearon 39 variables: 33 numéricas y 6 categóricas.

Demográficas

Reagrupación de categorías para tener al menos 3% de población por categoría

TL

Número de cuentas.Linea de crédito promedioPorcentaje de pagos vencidosMOP actualAtraso histórico más grave más reciente

IQ y PA

Días desde consultaNumero de consultasNúmero de direccionesAntigüedad en los domicilios

  • Malos
  • Buenos

92.7%

7.3%

Número de pagos vencidos registrado en la información crediticia y se categoriza como:• Malo (1): Si un cliente tiene 3 o más pagos vencidos en el histórico de pagos de su crédito hipotecario.• Bueno (0): Si un cliente tiene a lo más 2 pagos vencidos en el histórico de pagos de su crédito hipotecario

Variable objetivo

Análisis exploratorio

Selección de variables

Se eligieron 9 variables para el modelo de acuerdo al siguiente procedimiento:

SelectKBest con f_classif, de donde se toman las 8 con score más alto.

Creación de 19 clusters, de donde se eligió al representante tomando la mayor correlación con la variable objetivo.

Filtro de alta correlación para eliminar multicolinealidad entre las 25 variables resultantes de los dos métodos anteriores.

Modelación supervisada

Para el entrenamiento de los modelos se tomó la información disponible de enero 2023 a febrero 2023, haciendo una partición de 80 % train y 20 % test y se hizo un escalamiento de los datos utilizando MinMaxScaler.

Reporte de estabilidad

  • Pérdida en la fuerza predictiva del modelo y falta de estabilidad.
  • Cambios severos en la distribución de la población, PSI de 9.25%
  • Cambio en el ordenamiento del bad rate de los rangos intermedios.
  • KS 55.6 entrenamiento vs 53.75 en OOT.

78 %

0.5014

Tasa de malos

Clientes aprobados

3.6 %

Punto de corte

4. Monitoreo

3. Sistemas

2. Aprobación

1. Validación

10

Implementación y estrategia

Gracias