Paradigmi e design concept di Data Management, metodologie di sviluppo e gestione di soluzioni data intensive, stili operativi di Data Governance attualmente in uso o indicati dagli analisti come modelli di riferimento a cui tendere necessitano di metadati e generano metadati.

Passiamone rapidamente in rassegna qualcuno.

Data Governance service oriented

E’ un paradigma di gestione della Data Governance finalizzata a valorizzare in modo percepibile in azienda il contributo che essa può dare alle attività e agli obiettivi del maggior numero possibile di attori aziendali. Questo concetto si concretizza nell’esposizione di un catalogo di servizi di Data Governance che comprende servizi informativi, modelli di analisi, monitoraggio e controllo impiegabili ad esempio:

  • nella formulazione e nell’attuazione di una digital strategy, fornendo informazioni utili a valutare la sostenibilità degli interventi individuati, la disponibilità e la qualificazione del patrimonio informativo necessario per una messa a terra degli obiettivi strategici;
  • nella progettazione di un impianto di controlli da applicare ad una determinata area informativa per monitorare il grado di copertura delle finalità di impiego dei dati da parte dei controlli stessi;
  • nell’individuazione della golden copy, della fonte informatica che contiene la versione ufficiale di una determinata informazione da utilizzare in una analisi o in un report.

Tutti questi servizi e altri, la cui esigenza può nascere nel tempo, sono abilitati dalla presenza di metadati e di tecniche ad essi applicate: Data Lineage, copertura degli impianti di controllo, mapping dei concetti di business nei sistemi informatici e così via…

La Data Governance service oriented utilizza metadati.

Data Governance by design

E’ una pratica da applicare in tutte le attività progettuali o gestionali che interessano i dati aziendali. Consiste nel considerare in queste attività tutti gli adempimenti in grado di garantire il governo dei dati aziendali: ownership, lineage, semantica, qualità, sicurezza, e così via…  Ad esempio, il team di progetto di un nuovo sistema informatico tiene conto dei concetti standardizzati nel business glossary aziendale, si riferiscono ad essi nel disegno delle strutture informative impiegate; nuovi concetti specifici del sistema da realizzare vengono qualificati in termini di ownership, di definizione/significato, di regole di validazione.

La Data Governance by design utilizza e produce metadati.

Adaptive Data Governance

L’Adaptive Data Governance è un modello di Data Governance che si può esprimere attraverso differenti stili, in funzione delle finalità, delle caratteristiche, del grado di maturità di un’organizzazione e del singolo contesto a cui si applica.

Un esempio pratico può chiarire meglio questo concetto. Le pratiche di Data Governance necessarie per garantire nel settore bancario l’assolvimento ai requisiti regolamentari si sono concentrate inizialmente sulla qualità dei dati; l’evoluzione nel tempo di questi requisiti ha portato le banche a dover coprire anche altre prospettive di governo, ad esempio il Data Lineage. Ma questo è stato solo l’inizio di un percorso: la compliance regolamentare non è più ormai la sola finalità per cui è necessario presidiare i data asset; l’obiettivo diventa sempre più qualificarli e presidiarli per far sì che essi esprimano tutto il loro valore potenziale. Inoltre, i dati utilizzati per il reporting e la rendicontazione agli organi di vigilanza non sono più i soli a dover essere gestiti nel perimetro di governo: cambiano i volumi, la latenza, la natura e le tipologie dei dati da governare. Per queste ragioni lo stile di Data Governance deve adattarsi a queste nuove finalità e tipologie di informazioni. Conseguentemente nuove entità, attributi, relazioni entrano nel metamodello che sostiene la Data Governance. Un semplice esempio è stata l’introduzione deli metadati necessari a gestire la conformità al Regolamento europeo per la protezione die dati personali, che ha introdotto il concetto di Categoria di dati personali; ma la sfida dell’Adaptive si spinge ad altri stadi evolutivi di un’azienda: l’IoT, i big data, gli ambienti cloud e hybrid i sistemi di Data Management metadata driven portano all’introduzione di nuove tipologie di metadati: active metadata, latenze, canali, architetture.

Nell’Adaptive Data Governance differenti stili di Data Governance richiedono la disponibilità di differenti metadati.

Data Fabric

Gartner definisce il Data Fabric un design concept a cui tendere per sostenere le sfide che le organizzazioni si troveranno, o già si trovano, ad affrontare per garantire una gestione efficace e sostenibile di un patrimonio informativo che si sta sviluppando esponenzialmente lungo più dimensioni.

  • I dati disponibili crescono in volume, provengono da fonti sempre più numerose e diversificate, hanno velocità dei cicli di vita e nature eterogenee;
  • Cresce la domanda di informazioni da parte di categorie di data consumer umani e “tecnologici” sempre più numerose (business analyst, data scientist, data engineer, modelli “autonomi” di analytics, Ai, ML, …)

In conseguenza di queste considerazioni, Gartner ha razionalizzato nel concetto di Data Fabric una serie di capability, organizzate in pilastri. Si tratta di un modello ideale, ancora non completamente implementato nella pratica, ma che si sta affermando come riferimento per le aziende e per i vendor del settore. Almeno tre dei pillar identificati da Gartner, strettamente interconnessi, si riferiscono direttamente ai metadati:

  • Augmented Data Catalog: un catalogo delle informazioni disponibili con caratteristiche distintive finalizzate a sostenere ad un impiego attivo di metadati in grado di garantire la massima efficienza dei processi di Data Management;
  • Semantic Knowledge Graph: una rappresentazione grafica della semantica e delle ontologie di tutte le entità in gioco nella gestione dei data asset; ovviamente le componenti di base rappresentate in questo modello sono metadati;
  • Active metadata: metadati utili ad essere analizzati per identificare opportunità di trattamento e impiego più agevoli e ottimizzati dei data asset: log file, transazioni, user login, query optimization plan.

I metadati sono le fondamenta si cui si basa il concetto di Data Fabric, che secondo Gartner è il concetto di riferimento per il futuro del Data Management.

Data Valuation

Sempre maggiore interesse raccoglie la Data Valuation, la disciplina per la determinazione del valore dei data asset dell’azienda, con l’obiettivo. Gli obiettivi della Data Valuation sono:

  • aiutare a supportare la valutazione di priorità e budget da destinare a interventi sui dati e processi intensive;
  • stabilire un valore commerciale del dato verso partner/concorrenti (data monetization);
  • rendere evidente il contributo del presidio di data governance al valore di impresa.

Le metriche di Data Valuation possono essere calcolate, misurando i vari contributi al costo e al valore dei dati lungo una filiera di produzione del dato rappresentabile in forma strutturata, attraverso un modello di metadati. Una volta calcolate, queste metriche possono arricchire nel modello, che le raccoglie come attributi delle informazioni in esso catalogate.

La Data Valuation utilizza e produce metadati.

Come e perché prepararsi

I concetti, le pratiche, i metodi sopra illustrati sono in grado, già ora o in prospettiva, di sostenere in modo virtuoso ad una serie di sfide tecnologiche, organizzativa, culturali. A nostra conoscenza non esistono oggi aziende in grado di applicarli concretamente, esistono tecnologie capaci di sostenerle completamente. È però sicuro che ognuno di essi non può essere gestito in assenza dei rispettivi metadati utilizzati e prodotti. 

Le aziende che sono interessate a valutare o ad adottare uno o più di questi modelli possono però iniziare fin d’ora a prepararsi operando su tre piani: 

Metodi

Iniziare a strutturare e modellare le caratteristiche delle soluzioni applicative e dei processi data intensive.

  • Avviare esperienze concrete di rappresentazione di requisiti, specifiche funzionali e tecniche, in fase di implementazione e manutenzione di soluzioni data intensive, attraverso un insieme di metadati strutturati interconnessi in un modello semantico.

Strumenti

Verificare la presenza nella propria architettura ed eventualmente integrarla con:

  • componenti / piattaforme di data management metadata driven;
  • tool di modellazione dei metadati in grado di definire e gestire modelli semantici altamente configurabili e adattabili nel tempo nelle entità, negli attributi e nelle relazioni.

Competenze, cultura 

  • Verificare la disponibilità, eventualmente consolidandole o sviluppandole, di competenze specifiche nella gestione dei metadati, nella modellazione concettuale e logica dei dati, nelle metodologie di gestione agile dei progetti;
  • promuovere, ad esempio nel contesto di più ampi programmi di data literacy, iniziative di alfabetizzazione sui principi di impiego dei metadati, sulla lettura di modelli dati, sulla comprensione e l’espressione di requisiti in forma strutturata.