CDD_G24_M2_Proyecto_AriadnaElisa_Lara_Chávez
Ariadna Lara
Created on July 12, 2024
Modelo de originación para crédito hipotecario
Over 30 million people build interactive content in Genially.
Check out what others have designed:
THE EUKARYOTIC CELL WITH REVIEW
Presentation
INTRO INNOVATE
Presentation
FALL ZINE 2018
Presentation
BRANCHES OF U.S. GOVERNMENT
Presentation
QUOTE OF THE WEEK ACTIVITY - 10 WEEKS
Presentation
MASTER'S THESIS ENGLISH
Presentation
SPANISH: PARTES DE LA CASA WITH REVIEW
Presentation
Transcript
Crédito HipotecarioPropuesta Modelo de Originación
Ariadna Elisa Lara Chávez
Proyecto - Modulo 2
Julio 2024
Diplomado Ciencia de Datos
Antecedentes
Dentro de Grupo Financiero Coppel se ha propuesto una estrategia de originación para créditos hipotecarios en 3 etapas:1. Etapa inicial: Uso del BC Score como determinante de rechazo.2. Etapa intermedia: 12 meses después de la apertura al mercado, uso de scores y/o modelos genéricos externos.3. Etapa final: 2 años después, creación de un score de originación interno.
El área de Riesgos cuenta con la información crediticia de los solicitantes y tiene las facultades para explorarla y proponer estrategias innovadoras
Desarrollo de un modelo de ML utilizando la información de las hipotecas externas disponibles en el expediente crediticio de los solicitantes.
Objetivo
Problemática
- Línea de tiempo tradicional a largo plazo.
- Uso de técnicas y herramientas más sofisticadas en la competencia.
- Crecimiento en la oferta y demanda del producto.
Fuentes de datos
Información de enero a marzo 2023 de:
- Solicitudes: Variables demográficas
- Información interna
- TL: Cuentas y créditos reportados del expediente crediticio
- IQ: Consultas al expediente crediticio
- PA: Información de domicilios reporatdos en el expediente crediticio
Tratamiento inicial
Reglas duras: Excluyen personas sin infromación crediticia y clientes con mal comportamiento. Hipotecas seleccionadas: Cuentas hipotecarios o de pagos fijos, diferente a contratos de arrendamiento, montos mayores a 100,000 pesos
Ingenieria de variables
Se crearon 39 variables: 33 numéricas y 6 categóricas.
Demográficas
Reagrupación de categorías para tener al menos 3% de población por categoría
TL
Número de cuentas.Linea de crédito promedioPorcentaje de pagos vencidosMOP actualAtraso histórico más grave más reciente
IQ y PA
Días desde consultaNumero de consultasNúmero de direccionesAntigüedad en los domicilios
- Malos
- Buenos
92.7%
7.3%
Número de pagos vencidos registrado en la información crediticia y se categoriza como:• Malo (1): Si un cliente tiene 3 o más pagos vencidos en el histórico de pagos de su crédito hipotecario.• Bueno (0): Si un cliente tiene a lo más 2 pagos vencidos en el histórico de pagos de su crédito hipotecario
Variable objetivo
Análisis exploratorio
Selección de variables
Se eligieron 9 variables para el modelo de acuerdo al siguiente procedimiento:
SelectKBest con f_classif, de donde se toman las 8 con score más alto.
Creación de 19 clusters, de donde se eligió al representante tomando la mayor correlación con la variable objetivo.
Filtro de alta correlación para eliminar multicolinealidad entre las 25 variables resultantes de los dos métodos anteriores.
Modelación supervisada
Para el entrenamiento de los modelos se tomó la información disponible de enero 2023 a febrero 2023, haciendo una partición de 80 % train y 20 % test y se hizo un escalamiento de los datos utilizando MinMaxScaler.
Reporte de estabilidad
- Pérdida en la fuerza predictiva del modelo y falta de estabilidad.
- Cambios severos en la distribución de la población, PSI de 9.25%
- Cambio en el ordenamiento del bad rate de los rangos intermedios.
- KS 55.6 entrenamiento vs 53.75 en OOT.
78 %
0.5014
Tasa de malos
Clientes aprobados
3.6 %
Punto de corte