La qualità dei dati
Uno dei problemi principali nell’analisi del rischio di credito è la mancanza di dati su quali basare la valutazione della controparte.
Sembra curiosa come affermazione in un mondo dominato dai dati; e infatti il problema non è tanto la quantità, ma la qualità. La maggior parte dei sistemi di valutazione del rischio si basano sui dati pubblici (primo fra tutti i bilanci aziendali), trascurando la maggiore fonte di dati e informazioni: l’azienda stessa.
I dati interni (dalle abitudini di pagamento dei propri clienti, alle informazioni contenute in documenti privati, come ad esempio la Centrale Rischi) sono una fonte esclusiva e aggiornata di informazioni e il loro utilizzo consente di anticipare tendenze non ancora evidenziate dai mercati, individuando in anticipo potenziali fattori di rischio.
Tuttavia, per poterli sfruttare è necessario dotarsi di un modello di analisi adeguato, in grado di integrare dati provenienti da fonti diverse.
Il dataset
L’individuazione e l’acquisizione di un appropriato insieme di dati (dataset) è il primo passo da affrontare. La scelta delle fonti di dati deve essere fatta tenendo a mente alcune considerazioni:
- il modello deve avere un’alta capacità discriminante ed essere in grado distinguere tra aziende sane e aziende fallite;
- l’insieme di dati deve consentire una valutazione del profilo di rischio di ogni società, senza distinzioni di settore o Paese;
- il modello deve dimostrare buone capacità predittive ed essere in grado di identificare le aziende a rischio di default.
Per la loro capacità di fornire grandi quantità di dati pubblici sulle aziende, i data provider sono i primi fornitori di Big Data e permettono di costituire un buon dataset di partenza.
Ma i Big Data sono sufficienti per realizzare un modello di valutazione del merito di credito che rispetti i requisiti appena elencati? Purtroppo, no.
Per quanto vasti questi database, non sono in grado di coprire uniformemente tutti gli Stati. Ad esempio, in Italia le società di persone non sono tenute a depositare pubblicamente i bilanci, mentre in altri paesi, tra cui l’Olanda, le aziende sono obbligate a fornire solamente alcuni dati specifici.
La discrepanza di informazioni disponibili rende quindi impossibile creare un modello di valutazione universalmente valido basato sull'utilizzo dei soli Big Data.
Alternative Data
Ecco perché è fondamentale integrare nel modello di analisi anche gli Alternative Data.
Con Alternative Data possiamo definire tutti i dati provenienti da fonti – per così dire – non tradizionali.
Tra questi rientrano i dati sulle attività che ciascuno di noi compie online, come gli insights e gli analytics dei social network e dei motori di ricerca, i dati forniti dai sensori, (es. i dati di geolocalizzazione), e dei dati derivanti dai processi di business, come i dati sulle transazioni finanziarie o quelli forniti da software e database interni.
Ma, a differenza dei dati già “digeriti” dai data provider, gli Alternative Data non sempre si presentano in forma strutturata.
Per poterli sfruttare a proprio vantaggio è quindi necessario:
- dotarsi di un modello in grado di analizzare sia dati strutturati che non;
- sviluppare un ambiente in grado di integrare i dati provenienti da diverse fonti, sia tradizionali che “alternative”.
Il modello di valutazione
Con dati non strutturati si intendono i dati che si presentano non in forma numerica, ma sotto forma di testo, immagini, ecc.
Proprio per questa caratteristica, non possono essere elaborati con gli strumenti di analisi tradizionali, ma solamente attraverso l’Intelligenza Artificiale e l’utilizzo delle reti neurali.
Questo approccio è alla base del modello di valutazione del rischio di credito MORE (Multi-Objective Rating Evaluation); i dati di input, strutturati e non, sono elaborati attraverso mappe non-lineari e processati in modelli multivariati di Game Theory, una teoria matematica che studia le decisioni che un soggetto prende quando si trova ad interagire con altri per ottenere il massimo guadagno possibile.
L’algoritmo MORE si applica allo studio delle aree economico-finanziarie di un’azienda (solvibilità, liquidità, redditività, ecc.) e adotta il modello paretiano, che mira al conseguimento della condizione di maggior efficienza (l’ottimo paretiano), intesa come la condizione in cui non è possibile migliorare ulteriormente la situazione di un soggetto (in questo caso di una specifica area economica) senza peggiorare quella di un altro.La valutazione più alta è assegnata alle aziende che raggiungono l’ottimo paretiano e presentano l’equilibrio migliore tra le diverse aree.
La struttura
Dotarsi di un modello di analisi adeguato è solo il primo passo; serve anche una struttura in grado di integrare diverse fonti di dati. Intorno all’algoritmo MORE abbiamo realizzato la piattaforma di risk management oplon Risk Platform.
oplon fornisce gli strumenti di analisi alla base del rating (score, probabilità di default, analisi della Centrale Rischi, sensitivity e cash flow analysis, ecc.), per consentire a chiunque – corporate, fondi di investimento, società di gestione del risparmio, società finanziarie e non – la valutazione dell’affidabilità creditizia della propria azienda o della controparte.
Grazie all’integrazione con MORE, oplon è in grado di includere nel processo di valutazione non solo i dati pubblici forniti dai data provider, ma anche i privati, strutturati e non strutturati, forniti dall’azienda stessa.
Il processo di valutazione all’interno di oplon è costruito per step di analisi. Una volta scelta la tipologia di analisi, oplon calcola automaticamente il MORE Score e la probabilità di default della società sulla base dei dati riportati in bilancio, scaricabile dalla Camera di Commercio direttamente dal portale. Nei successivi step è possibile affinare il risultato integrando nell’analisi i dati alternativi aziendali nei seguenti modi:
- compilando i questionari qualitativi: alcuni step di analisi prevedono questionari qualitativi volti ad integrare nella valutazione informazioni interne aziendali (ad esempio, le abitudini di pagamento dei clienti);
- caricando file e documenti interni: grazie ad algoritmi di Natural Language Processing oplon è in grado di leggere e integrare nelle analisi file di testo o immagini. Un esempio è dato dall’analisi della Centrale Rischi: caricando il prospetto in pdf della Banca d’Italia, oplon estrapola automaticamente i dati significativi, riportando le informazioni in grafici e fornendo una descrizione sintetica dei risultati dell’analisi;
- integrando modelli di analisi personalizzati: oplon permette l’integrazione di modelli di analisi personalizzati, sviluppati in autonomia o su richiesta. In questo modo è possibile realizzare modelli di analisi ad hoc, che consentono di includere nell’analisi i dati rilevanti per l’azienda. Ad esempio, è possibile richiedere modelli di pricing personalizzati, o includere nel processo di valutazione i dati forniti dai sensori delle tecnologie produttive dell’industria 4.0.
Tutti i dati sono integrati all’interno dell’algoritmo MORE che rileva potenziali fattori di rischio e aggiorna automaticamente la valutazione del merito di credito dell’azienda in esame.