La Data Governance by Design è la modalità di gestione e manutenzione dei processi e delle applicazioni informatiche di un’azienda che garantisce un presidio dei dati coinvolti lungo tutto il loro ciclo di vita, ad iniziare dalla definizione dei requisiti alla gestione in esercizio.
Procediamo con ordine, partendo dalla Data Governance.
Il suo obiettivo è garantire l’esercizio dell’autorità e del controllo nella gestione degli asset aziendali. Si tratta in pratica di stabilire le modalità con cui opera una “data pipeline” e definire le caratteristiche tecniche e di business delle informazioni gestite: è necessario stabilire la semantica dei dati, le relazioni mutue tra i dati e quelle con i processi che li trattano, le funzioni coinvolte a vario titolo nella loro gestione. Parliamo quindi di Data Catalog, di Business Glossary (vai al white paper Irion), di Data Lineage, di ownership, cioè di fenomeni rappresentabili convenientemente attraverso un modello strutturato di metadati.
Qualità dei dati: dalla semantica all’ownership
Se l’oggetto della rappresentazione è un ambito informativo, un processo, una data pipeline già presenti nella nostra organizzazione, è necessario ricostruire i metadati che ne descrivono le caratteristiche di governance. Spesso occorre intervenire attivamente su di esse per irrobustire, ad esempio, la determinazione delle ownership, le definizioni, i presidi di qualità. E in effetti la qualità dei dati, non solo in termini di verifica, ma anche di articolazione e responsabilità dei processi di controllo, esercizio, remediation è uno degli aspetti che più frequentemente richiedono interventi di consolidamento degli impianti di controllo e revisione delle modalità operative.
Le moderne tecnologie permettono di agevolare questo processo di ricostruzione e irrobustimento. La completezza e la manutenibilità dei risultati ottenuti possono tuttavia presentare in molti casi difetti, legati non solo e non tanto alla potenza dei tool di metadata capture, ma anche e soprattutto alle tecnologie e alle modalità di implementazione e deployment dei processi e delle applicazioni informatiche oggetto di inclusione nel perimetro di governo.
La Data Governance by Design tende a superare questi gap, per quegli ambiti informativi e quei processi data intensive che lo consentono perché devono ancora essere realizzati e messi in opera.
Processi data-intensive: i presidi della Governance
Occorre garantire lungo tutte le fasi del ciclo di vita di un processo, o di una soluzione software, la definizione, la formalizzazione, l’implementazione e l’attivazione dei relativi presidi di Data Governance:
- semantica e ontologia – qual è il significato “ufficiale” dei dati trattati e quali sono le loro mutue relazioni e le relazioni con le altre entità?
- data architecture – con quali dati dell’enterprise information model si relazionano quelli gestiti in questo processo / applicazione?
- Data Lineage – qual è il percorso dei dati lungo il processo? Quali sono i percorsi attraversati dai dati gestiti dall’applicazione?
- Data Quality – quali sono le regole di qualità che garantiscono l’impiegabilità dei dati per le varie destinazioni d’uso?
- responsabilità – chi sono gli stakeholder coinvolti a vario titolo nella partecipazione al processo, nell’utilizzo dell’applicazione?
- orchestrazione – come si articola il processo, a quali processi partecipa l’applicazione? Sono da prevedere passi automatici da sincronizzare per garantire una corretta gestione complessiva dei dati lungo questi processi?
Queste prospettive, queste domande sono le stesse da considerare quando dobbiamo governare i dati coinvolti in un processo o in un’applicazione esistente. Ma risulta enormemente più semplice ed efficiente considerare questi aspetti (e gestirli in un modello strutturato di metadati) “by design” in fase di realizzazione e volendo anche “by default” lungo l’intero ciclo di vita.
Quali sono le modalità di applicazione e i benefici della Data Governance by Design?
Il paradigma by design si applica in concreto in tutte le fasi del ciclo di vita di una soluzione data intensive.
- Fin dalle sessioni di analisi per la raccolta dei requisiti attraverso interviste, esame di documentazione già presente o di altri input (spesso non disponibili in forma strutturata), le caratteristiche della soluzione attesa vengono rilevate tenendo conto delle prospettive di governo sopra elencate. Il modello di metadati nel quale queste caratteristiche vengono registrate può essere impiegato come check list, garantendo la disponibilità e la gestione ordinata di tutti gli elementi utili a disporre di una descrizione completa e accurata della soluzione da realizzare ed una sua collocazione “nativa” nella visione d’insieme dei processi e dei sistemi aziendali.
- In fase di realizzazione della soluzione questi metadati vengono arricchiti, perfezionati, calibrati tenendo conto anche di aspetti (vincoli, opportunità) tecnici. Nelle piattaforme di Enterprise Data Management metadata based, i metadati descrittivi dei requisiti sono collegati a quelli “attivi” che pilotano il funzionamento dei motori di Data Management (Quality, Integration, Preparation, Analytics, Delivery, …). Rappresentano senza soluzione di continuità la relazione tra il Business Glossary e il Data Dictionary, tra l’articolazione del processo e il workflow che la gestisce, ma soprattutto tra la descrizione delle caratteristiche della soluzione e il suo reale comportamento.
- In fase di manutenzione ogni intervento correttivo o evolutivo viene attivato considerando preventivamente eventuali variazioni dei metadati che descrivono i requisiti e le specifiche; l’esplorazione preliminare di questi metadati consente di avere un quadro preciso dei possibili impatti sia tecnici che “di business” dell’intervento, supportando nella ricerca dell’opzione più conveniente.
Irion EDM: la piattaforma per la Data Governance by Design e non solo.
Irion EDM è un sistema di Enterprise Data Management completamente metadata driven.
I metadati hanno un ruolo fondamentale nelle soluzioni di Data Management realizzati con Irion:
- descrivono le caratteristiche tecniche e di business dei dati e le relazioni con le altre entità ad essi connesse (asset IT, unità organizzative, processi, regole, …);
- sono flessibili – in grado di adattarsi a rappresentare le entità, gli eventi e i fenomeni rilevanti per ogni singola azienda;
- sono dinamici – possono variare nel tempo adattandosi alle evoluzioni del business e degli ambiti di applicazione;
- alcuni di essi sono attuativi – pilotano cioè i motori di Data Management della piattaforma (connessione alle fonti, Data Integration, applicazioni di regole di controllo, arricchimento, classificazione, analytics, orchestrazione, …);
- sono integrabili – metadati di business, tecnici, attuativi possono essere messi in relazione gli uni con gli altri e rappresentati ed esplorati in un unico modello in grado di supportare il lavoro di data engineer, business analyst, data owner, data scientist, e di tutti i ruoli impegnati nella gestione dei dati aziendali.
Queste caratteristiche, combinate con una dotazione funzionale completa ed evoluta, con componenti specifiche per l’applicazione di tecniche di AI/ML e con l’innovativo paradigma “Declarative”, fanno di Irion uno strumento in grado di sostenere i più innovativi modelli di gestione e governo dei data asset: Data Fabric, Data Governance by Design, Augmented Data Management, Data Governance Service Oriented.
Vuoi saperne di più?
Ti illustreremo con esempi pratici come le altre realtà
hanno già avviato la loro trasformazione.
Potrebbe interessarti anche:
No settings found for the grid #25.