In inglese si utilizza il termine Metadata, plurale, costruito con il prefisso meta (dalla preposizione greca μετὰ, “al di sopra”) e il plurale neutro latino data, “i dati”. In italiano parliamo di Metadati, al singolare Metadato.
Ma che cosa sono?
L’Accademia della Crusca li definisce come dei marcatori, una sorta di post-it, collegati a un oggetto informatico (immagine, documento, pagina web, ecc.), o a una serie di oggetti informatici con lo scopo di descriverne il contenuto e/o gli attributi.
Cercando invece “Metadata” nel glossario di Gartner si riesce subito ad intuire l’importanza di ciò che questo termine rappresenta:
I metadati sono informazioni che descrivono vari aspetti di un asset informativo, per migliorarne l’usabilità durante il suo ciclo di vita. Sono i metadati che trasformano l’informazione in un asset. In generale, più è prezioso l’asset informativo, più è critico gestire i metadati che lo riguardano, perché è la loro definizione che fornisce la comprensione che sblocca il valore dei dati.
In letteratura si distingue tra metadati di struttura, che definiscono l’architettura dei dati e la loro interrelazione, e metadati di contenuto, che invece classificano e descrivono l’informazione.
Secondo la tassonomia più classica possiamo invece classificare questi metadati in tre tipologie distinte ma interconnesse:
- metadati di business (raccolti in un business glossary – es. business term, semantica ownership, processi connessi, regole)
- metadati tecnici (inseriti in un metadata dictionary – es. campi fisici, lunghezze e formati, applicazioni informatiche, controlli automatici)
- metadati operativi (es. pervenimento di flussi, completamento di processi di trasformazione, esiti dei controlli in un determinato periodo)
Queste differenti categorie di metadati si parlano tra loro attraverso relazioni, ad esempio di Lineage verticale, la mappatura di un termine di business con i campi lo rappresentano nei sistemi informatici. L’interconnessione tra queste tre aree di governo è un punto essenziale per la gestione del patrimonio informativo.
A cosa servono? Perché utilizzarli conviene?
I metadati contribuiscono alla capacità di elaborare, mantenere, integrare, proteggere, controllare e governare altri dati. Aiutano, in sintesi, un’organizzazione a comprendere i suoi dati, i suoi sistemi e i suoi flussi di lavoro.
Per meglio capire l’essenzialità dei metadati nella gestione dei dati, immaginiamo un grande magazzino, con centinaia di migliaia di merci, ma senza un inventario. Senza un inventario che riporta non solo le caratteristiche del prodotto, ma anche l’ubicazione, gli operatori impiegherebbero moltissimo tempo a trovare uno specifico pezzo; se appena assunti potrebbero anche non sapere come iniziare a cercare gli articoli che servono. L’inventario non solo fornisce le informazioni necessarie (quali materiali sono stati immagazzinati e dove sono collocati), ma permette anche a chi ne ha bisogno di trovare i contenuti utilizzando diversi punti di partenza (tipologia, nomenclatura, dimensione, disponibilità). Un’organizzazione senza metadati è come un magazzino senza un inventario. I dati di un’azienda sono moltissimi e in costante crescita: senza metadati, un’organizzazione non può gestirli come una risorsa o meglio non riuscirebbe a gestire i propri dati in modo efficiente ed efficace.
I metadati vengono utilizzati regolarmente nel funzionamento delle discipline di data management. Ad esempio:
- nella pratica della data privacy per garantire che un’organizzazione possa identificare velocemente dati privati o sensibili
- nella Data Quality per individuare celermente tipologie di dati ridondanti e di scarsa qualità o per identificare i controlli più opportuni
- nella Data Governance per classificare chi può vedere determinati dati (sfruttando gli attributi dei metadati che riportano le classificazioni legate ai dati di confidenzialità, alla gestione della titolarità e delle autorizzazioni stesse) o per realizzare il Data Lineage
- nella data discovery per ricercare i dati che hanno determinate caratteristiche
- nella data orchestration e in moltissime discipline emergenti come la Data Valuation, l’Adaptive Data Governance, la strutturazione di un’architettura di Data Fabric o nell’utilizzo del DataOps che usufruisce dei metadati per migliorare l’usabilità e il valore dei dati in un ambiente dinamico
Cos’è il Metadata Management? Cosa sono gli active metadata?
Ma come gestisco i metadati? La disciplina del Metadata Management nasce proprio per illustrare le modalità più idonee al fine di sfruttare al meglio le potenzialità dei metadati.
Ma negli ultimi tempi si è affermato in questo campo un concetto evolutivo: sono nate piattaforme di data management in grado di trasformare i metadati, tradizionalmente solo raccolti e quindi passivi, in metadati attivi, in grado cioè di abilitare automaticamente alcune funzionalità, riducendo di molto l’impegno richiesto ai Data Specialist.
Gli active metadata sono, in sintesi, metadati utili ad essere analizzati per identificare opportunità di trattamento e impiego più agevoli e ottimizzati dei data asset: log file, transazioni, user login, query optimization plan.
È possibile, ad esempio, basandosi sulle caratteristiche di un preciso metadato:
- suggerire al Data Steward eventuali regole di qualità del dato
- consigliare un’eventuale categorizzazione come dato sensibile per la tutela della privacy
- pilotare le esecuzioni delle data pipeline
- utilizzare ad esempio il metadato “user logins”1 per avvisare automaticamente gruppi di utenti della nuova disponibilità di data asset simili a quelli da loro già visualizzabili e tanto altro ancora
- e molto altro…
Con Irion EDM puoi gestire agevolmente e valorizzare i metadati della tua azienda
- puoi attivare i tuoi metadati e sfruttare il tempo risparmiato per attività di maggior valore
- puoi quindi pilotare le funzionalità del sistema di Enterprise Information Management, grazie alle funzionalità di active metadata (preparation, quality, transformation, masking, discovery…)
- puoi definire un modello di metadati libero, completamente configurabile. Senza avere la preoccupazione di stabilire subito una struttura definitiva o avere a disposizione metamodelli già predisposti per realizzare il tuo Business Glossary aziendale accelerando la sua realizzazione
- puoi predisporre ed erogare servizi informativi basati sui metadati disponibili per rispondere a domande ricorrenti del management, degli analisti di business, dell’IT, dei data scientist, del DPO sugli asset informativi dell’azienda o per ottemperare ai requisiti normativi del tuo settore
- puoi rispondere velocemente a richieste estemporanee dei colleghi e di organi ispettivi interni ed esterni (impact analysis, qualità dei dati, …)
- accedere a moltissime fonti, grazie ai connettori di Irion EDM
- gestire tutte le informazioni tecniche e di business relative al patrimonio informativo dell’azienda in un Data Catalog e le relative interconnessioni senza problemi di performance dovuti al numero di metadati
- puoi automatizzare il reporting di Data Governance (Business Glossary, Enterprise Data Catalog) e non solo (documentazione impianti di controllo, Registro dei Trattamenti, …)
- organizzare il lavoro, anche in concomitanza, di più team che operano sulla struttura e sul contenuto del modello, utilizzando un esclusivo sistema di change management di classe Enterprise