Modelización del Riesgo Crédito en R y Python
Objetivos de los Cursos
Los objetivos del curso son: mostrar al participante metodologías que permitan identificar, medir y gestionar el riesgo de crédito en tiempos de crisis financieras. Específicamente el participante:
-
Aprender técnicas de vanguardia para estimar, calibrar y validar modelos y parámetros de riesgo como PD, LGD y EAD.
-
Desarrollar modelos de capital económico, correlación de activos y stress testing de riesgo crédito.
-
Desarrollar modelos de credit scoring y score de comportamiento usando novedosas técnicas de machine learning.
-
Los ejercicios del cursos se entregan en el lenguaje de programación R y Python, mismos, que están listos para aplicar directamente en el trabajo. R y Python han crecido de forma importante en los recientes años, ambos son software libre y de código abierto que ofrecen al usuario un entorno amigable, estadístico y gráfico muy potente.
-
Se aprovecha R para desarrollar modelos estadísticos y de Machine Learning y Python para realizar potentes simulaciones de riesgo crédito.
-
El curso ofrece al participante una importante cantidad de modelos econométricos avanzados para gestionar el riesgo de crédito.
-
Se exponen metodologías de validación de modelos y parámetros.
-
Se explica desde como instalar R y Python hasta realizar algunas funciones importantes de programación, además de mostrar librerías útiles para la medición del riesgo crédito.
¿A quién esta dirigido ?
El Curso esta dirigido a profesionistas de riesgo de crédito de entidades financieras. Para la mejor comprensión de los temas es recomendable que el participante tenga conocimientos de estadística inferencial y Excel. No es necesario dominar el lenguaje R y Python.
42 minutos del Curso Credit Scoring
Credit Scoring, Machine Learning y Validación de Modelos en R
Horarios:
-
Santiago de Chile, Sao Paulo, Buenos Aires, Santo Domingo: L a V: 18-21h
-
España, Portugal: L a V 19-22 h
-
Ciudad de México, Quito, Bogotá, San José: L a V 19-22 h
Precio: 4.900 €
Nivel: Intermedio
Duración: 30 h
Material:
Presentaciones PDF, Ejercicios: Python, R, SAS, Excel y JupyterLab.
Credit Scoring
Módulo 0: Programación en Pyhton
-
¿Que es Python?
-
Crecimiento exponencial del uso de Python
-
Pyhton en el sector bancario
-
Instalación de Python
-
Importación de archivos
-
Tratatamiento de datos
-
Variables y programación
-
Construcción de funciones
-
Principales sentencias de programación
-
Datos fuentes de internet
-
Numpy, Scipy, Scikit-lern,panda y Matplotlib
-
Instalación y uso de Anaconda
-
Instalación de Jupyter Notebook
-
Ejercicio a1: Cálculadora financiera
-
Ejercicio a2: Importación y modelos de series temporales
-
Ejercicio a3: Simulación de Monte Carlo en Python
Módulo 1: Programación en R
-
Introducción de R
-
¿Porque usar R en la Banca?
-
Instalación y Actualización de R
-
R con Windows
-
R con Linux y Unix
-
Programación en R
-
Principales Sentencias
-
Operadores
-
Dataframes
-
Arrays
-
Matrices
-
Principales funciones
-
-
Librerias, Paquetes y CRAN
-
Importar Bases de datos en R
-
Manipulación y gestión de bases de datos en R
-
Gestión de Outputs
-
Procedimientos Estadísticos
-
Estadística Descriptiva
-
Análisis Exploratorio
-
-
Machine Learning en R
-
Ejercicio 1: Ejercicios de programación en R
-
Ejercicio 2:Fusión,Unión e Intersección de Bases de Datos R/SQL
-
Ejercicio 3:Tratamiento de Base de Datos de Credit Scoring
-
Ejercicio 4:Eliminación de duplicados
-
Ejercicio 5:Imputación de valores Missing
-
Ejercicio 6:Estadísticos y tablas de contigencia en R
-
Ejercicio 7:Gráficos Estadísticos en R
Módulo 2: Análisis Univariante
-
Definición de variable objetivo
-
Tratamiento de datos
-
Muestra y Segmentación
-
Horizonte temporal
-
Punto de observación y desempeño
-
Análisis del Análisis Univariante
-
Ejercicio 8: Análisis univariante percentiles en R
-
Ejercicio 9: Análisis univariante óptimo en Excel
-
Ejercicio 10: Estimación del KS, Gini e IV por variable en Excel y R
-
Ejercicio 11: Estimación Curva ROC en R
-
Ejercicio 12: Estimación Weight of Evidence WOE en Python y R
Módulo 3: Segmentación, Clustering y Análisis de Componentes Principales
-
Clusters Jerárquicos
-
Dendrograma
-
Model Based Clustering
-
Density Based Clustering
-
Comparativo de Clusters
-
Distancia Interclusters
-
Distancia Intraclusters
-
-
Gráfico de disimilitud
-
Validación de Clusters
-
Análisis de Componentes principales (PCA)
-
Visualización avanzada de PCA
-
Ejercicio 14: Componentes principales en R y Python
-
Ejercicio 15: Visualización de componentes principales en R
Módulo 4: Algoritmos de Clasificación
-
Árboles de Decisión
-
Modelización
-
Ventajas e inconvenientes
-
Procesos de Recursión y Particionamiento
-
Recursive partitioning tree
-
Pruning Decision tree
-
Conditional inference tree
-
Visualización de árboles
-
Medición de la predicción de árboles de decisión
-
Modelo CHAID
-
Modelo C5.0
-
-
K-Nearest Neighbors
-
Modelización
-
Ventajas e inconvenientes
-
Distancia Euclidiana
-
Distancia Manhattan
-
Selección del valor K
-
-
Modelo Probabilístico: Naive Bayes
-
Teorema de Bayes
-
Estimador de Laplace
-
Clasificación con Naive Bayes
-
Ventajas e inconvenientes
-
-
Ejercicio 16: Árbol de decisición Chaid en R
-
Ejercicio 17: K means Clustering en R
-
Ejercicio 18: Naive Bayes en R
Módulo 5: Algoritmos Avanzados NN y SVM
-
Support Vector Machine
-
Hiperplano óptimo
-
Support Vectors
-
Añadir costes
-
Ventajas e Inconvenientes
-
Visualiización del SVM
-
Tuning SVM
-
Truco de Kernel
-
-
Redes Neuronales (Neural Networks NN)
-
Entrenamiento de Perceptron
-
Perceptrón Multicapa
-
Algoritmo de backpropagation
-
Procedimientos de entrenamiento
-
Tuning NN
-
Visualización de NN
-
Ventajas e inconvenientes
-
-
Ejercicio 19: Support Vector Machine en Python y R
-
Ejercicio 20: Redes Neuronales: perceptron en Python y R
Módulo 6: Ensemble Learning
-
Modelos de conjuntos
-
Bagging
-
Random Forest
-
Boosting
-
Adaboost
-
Boosting y Bagging para modelos de regresión
-
Ventajas e inconvenientes
-
Ejercicio 21: Random Forest en Python y R
-
Ejercicio 22: Adaboost en R
Módulo 7: Desarrollo de Scorecards
-
Asignación de puntuación
-
Clasificación del Scorecard
-
Scorecard WOE
-
Scorecard Binario
-
Scorecard Continuo
-
-
Reescalamiento del Scorecard
-
Análisis del Factor y Offset
-
Scorecard WOE
-
Scorecard Binario
-
-
Técnicas de Reject Inference
-
Cut-Off
-
Parcelling
-
Fuzzy Augmentation
-
-
Técnicas Avanzadas de punto de corte
-
Ejercicio 23: Scorecard WOE en Excel y R
-
Ejercicio 24: Selección del Punto de Corte en Excel y SAS
Módulo 8: Validación de Modelos
-
Confusion Matrix
-
Poder Discriminante:
-
Indice Gini
-
ROC
-
KS
-
Brier Score
-
Kullback- Leibler
-
CIER
-
-
Técnica de Bootstrapping
-
Indice de estabilidad
-
Estadístico Kappa
-
K-Fold Cross Validation
-
Ejercicio 25:Estimación de: KS, ROC y Gini del Modelo en R
-
Ejercicio 26:Bootstrapping e intervalos de confianza en R
-
Ejercicio 27: K-Fold Cross Validation en R
Módulo 9: Behaviour Score I
-
Fuentes de datos
-
Tipología de variables en el scoring de comportamiento
-
Horizonte temporal
-
Segmentación
-
Definición del Default
-
Score de Comportamiento usando Regresión Logística
-
Score Proactivo
-
Transactional Scoring
-
Ejercicio 28: Behaviour Score con Regresión Logística con dataos de panel en stata y tramado univariante de variables en R
-
Ejercicio 29: Behaviour Score con Regresión Cox para panel data en R
Módulo 10: Behaviour Score Avanzado II
-
Modelos Multivariantes
-
Datos de Panel
-
Variables Macroeconómicas
-
Score de Comportamiento con Cox Regressión
-
Score de Comportamiento con machine learning
-
Ejercicio 30: Árbol de decisición Chaid en R
-
Ejercicio 31: Behavior Score Support Vector Machine en R
-
Ejercicio 32: Behavior Score Redes Neuronales en R
-
Ejercicio 33: Random Forest en R
-
Ejercicio 34: Adaboost en R
-
Ejercicio 35: comparativo de resultados en Excel