Quali sono le applicazioni dei modelli di machine learning e deep learning nel mercato del credito? I modelli di machine learning (ML) e deep learning sono noti per la previsione dei risultati utilizzando i big data. L'applicazione più frequentemente discussa dei modelli ML/DL nel mercato del credito è quella di prevedere le probabilità di insolvenza utilizzando più informazioni rispetto alla tradizionale modellazione del punteggio di credito. Le applicazioni possono essere utilizzate in mutui, prestazioni di pagamento delle utenze al consumo, prestiti al consumo, prestiti alle piccole imprese, ecc. I modelli di partenza includono LASSO, macchine a vettori di supporto (SVM) e un algoritmo di foresta casuale. Tuttavia, l'algoritmo della foresta casuale ha dimostrato di funzionare meglio di LASSO e SVM in termini di precisione ed è quindi attualmente più comunemente utilizzato. Per questo motivo, permettetemi di spiegare in dettaglio come l'algoritmo della foresta casuale preveda le probabilità predefinite. [adottato dalla Tabella 4 in Davuluri, Sruthi, et al. (2019)] L'approccio della foresta casuale è un tipo di modello basato su alberi. Può essere meglio compreso in due parti. Per fissare le idee, supponiamo che ci sia un'unica covariata in esame, vale a dire il prestito/valore (LTV). Nella prima fase, viene stimato un semplice albero decisionale cercando il singolo valore LTV che meglio separa gli inadempienti dai non inadempienti. cioè, massimizza un criterio come l'entropia incrociata o il coefficiente di Gini nella variabile di risultato tra i due contenitori risultanti (o "foglia" dell'albero) su entrambi i lati del valore selezionato. [Nota a piè di pagina: Se applicato a un ampio insieme di covariate, il processo consente la possibilità che i contenitori in ciascuna covariata siano interamente guidati dai dati.] Nella seconda fase, implementiamo tecniche di (b)ootstrap (ag)gregation o "bagging". Questo passaggio serve ad affrontare il problema dell'overfitting. Cioè, il modello dell'albero decisionale semplice si adatta molto bene ai dati nel campione (cioè, bassa distorsione). Tuttavia, non è in grado di prevedere l'out-of-sample (cioè un'elevata varianza). La tecnica di "bagging" si adatta a molti (ad esempio, 500) alberi decisionali invece di un singolo albero, ognuno dei quali si adatta a un campione bootstrap dal set di dati originale. Inoltre, quando è necessaria una nuova divisione su una covariata, la covariata viene selezionata da un sottoinsieme casuale di covariate. Quando si stima il modello di foresta casuale, è necessario scegliere diversi parametri, come il numero massimo di foglie che il modello può avere e il numero minimo di punti dati necessari affinché una foglia proceda con un'altra divisione. Per garantire il miglior adattamento possibile, un approccio comune consiste nel suddividere casualmente il campione di addestramento in K pieghe (cioè sottocampioni), dove il ricercatore/modellatore sceglie K. Infine, in molti casi del mondo reale, come la valutazione del credito, abbiamo bisogno della probabilità di appartenere a una classe (cioè la probabilità di default). Tuttavia, il modello Random Forest ci fornisce una classificazione binaria, ovvero il modello produrrà se si prevede o meno che il mutuatario sia inadempiente. Per apportare questa modifica, è possibile utilizzare una regressione logistica (chiamata anche "calibrazione sigmoide") o cercare nello spazio delle funzioni monotone (nota anche come "calibrazione della regressione isotonica") per trovare un collegamento tra i risultati predefiniti noti del set di dati di addestramento e i risultati predefiniti previsti. [Nota: le probabilità predefinite trovate contando il numero di predefiniti previsti nel set di dati di addestramento sono spesso molto rumorose perché non ci sono molte osservazioni in ogni foglia.] I modelli ad albero hanno diversi vantaggi e sono popolari nelle applicazioni. Tuttavia, questi modelli presentano anche alcune limitazioni: scarsa gestione delle relazioni lineari, instabilità in modo che piccole modifiche nel set di dati di addestramento possano generare un albero diverso e tendenza all'overfitting dei dati di addestramento. Oltre ai modelli ad albero, è possibile utilizzare la Deep Neural Network (DNN) per effettuare la previsione. In pratica, alle persone piace un modello di ensemble ibrido. I modelli d'insieme combinano più algoritmi di apprendimento per generare prestazioni predittive superiori che potrebbero essere ottenute da qualsiasi algoritmo di apprendimento costituente da solo. Ad esempio, è possibile sostituire il livello finale della rete neurale con un modello ad albero. È anche popolare utilizzare entrambi i modelli separatamente e quindi calcolare la media delle probabilità finali previste dei due modelli. Il metodo da adottare si basa sulle prestazioni dell'applicazione specifica. Oltre a prevedere le probabilità di insolvenza, è possibile utilizzare le stesse tecniche ML/DL per prevedere le propensioni al pagamento anticipato. Oltre a utilizzare le variabili nella storia creditizia, i ricercatori dimostrano anche che le informazioni nelle foto del mutuatario e gli elementi nei video e nell'audio possono anche essere informative, che possono essere esplorate in futuro. Riferimento Albanesi, Stefania e Domonkos F. Vamossy. Prevedere l'insolvenza dei consumatori: un approccio di deep learning. N. w26165. Ufficio nazionale di ricerca economica, 2019. Davuluri, Sruthi, et al. Apprendimento automatico per l'accessibilità solare: implicazioni per l'espansione e la redditività del solare a basso reddito. n. w26178. Ufficio nazionale di ricerca economica, 2019.
Iscriviti a:
Commenti sul post (Atom)
Mediaset non è stata solo televisione, ma una leva di potere capace di trasformare la visibilità in fiducia, le aziende in marchi e il lavoro invisibile dietro le quinte in un’influenza che ha segnato un’epoca.
Mediaset: il grande potere televisivo che ha plasmato l’immaginario collettivo e il mercato Per decenni Mediaset non è stata soltanto una ...
-
Manuale per il Benessere Mentale: Aumentare la Salute con le Passeggiate, la Natura e la Fisica Quantistica Introduzione L'importanz...
-
I dazi possono essere una lama a doppio taglio per l'Italia. Nel breve termine, potrebbero offrire alcuni vantaggi, come la protezion...
-
Genny Coppola – Make-up Artist Napoletano Trucco sposa ed eventi tra tecnica, creatività ed emozione ✨ Chi sono Mi chiamo Genny Coppol...
Nessun commento:
Posta un commento