Quali sono le componenti funzionali di un sistema informatico per la data governance? Governare i dati di una organizzazione vuol dire esercitare una serie di processi specifici, che come tutti i processi consumano e producono informazioni (in questo caso metadati) e spesso sono supportati da indicatori. Il cuore di tutto è un sistema di gestione di metadati. In esso sono contenute tutte le informazioni relative ai dati dell’organizzazione sotto forma di entità, relativi attributi, mutue relazioni. Secondo la tassonomia più classica possiamo classificare questi metadati in tre tipologie distinte ma interconnesse:
- metadati di business (raccolti in un business glossary – es. business term, semantica ownership, processi connessi, regole),
- metadati tecnici (metadata dictionary – es. campi fisici, lunghezze e formati, applicazioni informatiche, controlli automatici),
- metadati operativi (es. pervenimento di flussi, completamento di processi di trasformazione, esiti dei controlli in un determinato periodo). L’interconnessione tra queste tre aree di governo è un punto essenziale.
Tutte le informazioni necessarie all’esecuzione dei processi di data governance e più generalmente di data management sono registrate in questo componente funzionale. Che caratteristiche deve avere un sistema di metadata management? Un suo requisito importante è quello di essere aperto alla connessione lungo due dimensioni e in due direzioni. La prima dimensione è quella “orizzontale” con altri repository che censiscono informazioni relative ad entità che hanno relazioni con i dati (quali processi, applicazioni, organigrammi) spesso gestite in applicazioni dedicate. La seconda è quella “verticale” con il mondo fisico o, più precisamente, con gli strumenti operativi di data management: data integration, data quality, data profiling, data discovery, data masking. Con entrambe le tipologie di strumenti il sistema di metadata management deve avere un colloquio bidirezionale:
- raccogliendo, ad esempio i metadati relativi ad un processo (nome, descrizione, owner, …), in modo da poterlo integrare con informazioni relative ai dati in input, output o interni al processo;
- fornendo le regole di ricerca di un business term al motore di data discovery, il quale, se la discovery avrà successo, ritornerà il nome dei campi fisici che rappresentano quel business term nei sistemi IT. E così via.
Sempre, uno sguardo al futuro.. Un’altra caratteristica sempre più importante di questo componente è la capacità di adattarsi alle evoluzioni del modello di data governance. Le frequenti revisioni dei processi aziendali, l’introduzione di nuovi requisiti regolamentari (sempre più data intensive) la necessità di sostenere iniziative interne quali, a solo titolo di esempio, quelle finalizzate alla digital transformation dell’impresa, impongono di variare non solo il contenuto, ma anche la struttura del sistema di gestione dei metadati: aggiungere nuove entità, attributi, relazioni al metamodello. Quali sono gli elementi utili per offrire servizi di valore all’azienda? Come accennato sopra, il medadata management system è solo una componente di una architettura strumentale per la data governance. Sono molto utili, e in alcuni casi necessari altri moduli funzionali: un sistema per il calcolo, la rappresentazione, la distribuzione di indicatori di performance (KPI) di governo (copertura, maturity, program management) e di prospettiva (quality, ma non solo); un sistema di workflow management in grado di orchestrare attività automatiche e human task nell’esecuzione di processi di data governance. Ma è l’interazione fluida tra questi moduli a fare la vera differenza; la possibilità di costruire blocchi funzionali combinando primitive di metadata management, process orchestration, performance analysis consente di automatizzare e supportare processi di data governance “service oriented” improntati al paradigma “declarative”, che espongono cioè servizi specializzati in grado di gestire in modo trasparente operazioni articolate e complesse.