Osservatorio Polimi: Data Governance raddoppiata in due anni nelle grandi aziende, ma il 62% non ha adottato metriche di efficacia. Data Marketplace, linee guida Irion in 6 step

Data Marketplace

Irion ha partecipato al convegno finale dell’Osservatorio Big Data & Business Analitycs del Politecnico di Milano, di cui è Partner da anni per confrontarsi costantemente con la data community, professionale e accademica, sull’evoluzione di queste tematiche.

Dal 2021 a oggi sono quasi raddoppiate le grandi organizzazioni che hanno adottato ruoli e responsabilità di Data Governance, ma per la maggior parte le aziende sono ancora all’inizio del loro percorso. Nelle aziende da almeno 250 dipendenti, questi aspetti sono stati formalizzati nel 41% dei casi (erano 25% lo scorso anno): in particolare, il 27% ha creato ruoli centralizzati per fornire linee guida, mentre il 14% ha coinvolto più figure professionali nelle diverse linee di business, senza un coordinamento centrale.  

Tra le soluzioni specifiche adottate per il governo dei dati, una crescita importante riguarda gli strumenti per il Data Catalog, passati dal 15% del 2022 al 27% di quest’anno. Nel complesso, la spesa delle aziende italiane e quindi il valore del mercato (per quanto riguarda infrastrutture, software e servizi di gestione dati e analytics) registra una crescita del 18% toccando quota 2,85 miliardi di euro. L’83% riguarda grandi imprese, il resto PMI e micro.  

Sono le principali tendenze emerse dall’indagine 2023 dell’Osservatorio Big Data & Business Analytics del Politecnico di Milano. Il convegno di presentazione della ricerca ha messo in luce anche i trend d’uso delle intelligenze artificiali generative, che nei processi di gestione dei dati, ad esempio, possono essere rilevanti nelle fasi di data labeling, categorization e classification. “Aumenta anche il cloud, ma non al tasso di crescita che mi sarei atteso: è il sintomo di una certa resistenza delle imprese a migrare lì le proprie attività” sottolinea Carlo Vercellis, professore ordinario di Machine Learning e direttore dell’Osservatorio. 

Data Strategy Index: dove sono le aziende oggi

Sopra la media la crescita del manifatturiero (+25%) e di telco e media (+20%). Secondo il “Data Strategy Index” calcolato dall’Osservatorio per le grandi aziende, proprio il comparto delle telecomunicazioni, assieme ai servizi finanziari (banche e assicurazioni) è il più rappresentativo nel cluster delle organizzazioni “Avanzate”, quelle con elevata maturità sia nella Data Science che nel Data Management, oltre alla Business Intelligence. Si tratta di un quinto del campione. Mettendo in relazione queste tre variabili, i ricercatori hanno classificato le altre aziende come “Immature” (16%; stessa cifra per quelle “Ai primi passi” che sono riuscite a fare cambiamento culturale, ma ancora agli inizi sul resto) seguite da “Intraprendenti” (13%; faticano spesso a internalizzare le competenze), “Prudenti” (23%, spesso partono da scarso coinvolgimento aziendale, oggi sono più attente alla governance) e “Focalizzate” (12%; prediligono sviluppi interni). 

“Stiamo passando dal progetto basato sui dati al concetto di data product” ha spiegato Irene Di Deo, ricercatrice senior dell’Osservatorio, ricordando che per DJ Patil e Simon Regan l’aspetto centrale è che i dati come “prodotto” devono essere focalizzati su un obiettivo. La ricerca odierna evidenzia come solo nel 19% delle organizzazioni intervistate sia percepita un’alta o altissima qualità e fruibilità dei dati, mentre il 43% del campione ammette “alcune difficoltà” (nonostante i dati siano ritenuti generalmente utilizzabili) e il 30% dichiara che sta lavorando per introdurre “nuove linee guida”. L’aspetto più macroscopico è che quasi due aziende su tre (62% delle risposte) non hanno ancora definito le metriche per misurare l’efficacia delle attività di Data Management. Attualmente, solo il 13% dichiara di adottare un approccio “data as a product”.

Il valore aggiunto del Data Product 

“La difficoltà nel valutare ostacola l’industrializzazione e la volontà di continuare a sperimentare” aggiunge Di Deo. In metà dei casi, inoltre, non c’è un processo strutturato per raccogliere i feedback degli utenti interni. Si tratta quindi di un’attività non consolidata, anche se è pur vero che “non tutti i progetti di Data Science possono diventare dei Data Product, magari per la brevità di tempi e scopi”. Quanto invece alla diffusione dell’architettura Data Mesh, il 44% delle organizzazioni afferma che è un tema attualmente discusso in azienda. “Ma a prescindere da questa architettura, anche nelle organizzazioni meno complesse e strutturate l’approccio Data Product sarà fondamentale per far sì che tutte le attività sui dati siano efficaci, valutabili, misurabili e apprezzate dagli utenti interni” ha concluso la ricercatrice.  

Mario Vellella, Domain Advisory Manager di Irion

Le basi: architettura reattiva e metadati 

“Non ci sono più soltanto persone, tecnologia, processi e capitali: per diventare aziende realmente data-driven l’aspetto centrale oggi è il dato come fattore produttivo” evidenzia Mario Vellella, Domain Advisory Leader di Irion, nel suo intervento al convegno del Polimi. “Ma il dato acquisisce valore solo se condiviso. E per farlo serve un’architettura flessibile e reattiva. Come prima cosa, dobbiamo creare legami tra chi ha l’esigenza informativa e chi dovrà poi costruire il Data Product”.  

Cosa serve per fare comunicare questi due attori in azienda? “Un primo livello semantico standardizzato: tutto ciò che sta intorno i dati come prodotto si basa sui metadati, non solo descrittivi, anche attuativi. Lo snodo dei requisiti deve passare dalla semantica: i metadati rendono possibile l’utilizzo concreto del Data Product. Dobbiamo correre il rischio di abbassare un po’ l’asticella: è inutile progettare massimi sistemi e poi non viene usato nulla. Meglio avere un buon risultato su una ‘fetta’ di conoscenza, purché non sia troppo piccola” ha spiegato l’esperto.  

I metadati sono quindi un driver di cambiamento e flessibilità, in un’architettura reattiva che deve ottenere risultati semi-automatici: “Servono anche a far parlare tra loro le macchine. Oggi la vera piattaforma sono i dati del cliente: noi dobbiamo cercare di trovare tutti i servizi, ovunque essi siano e fare in modo di collegarli tramite API, su uno strato di metadati che garantisce l’interoperabilità delle informazioni all’interno. L’architettura si costruisce e ricostruisce – come afferma Gartner, “business composable architecture” – anche sulla base dei ruoli (tecnici o di business) che ci chiedono risposte tempestive”.

Mauro Tuvo, Irion Principal Advisor

Data Marketplace: sei step per il successo 

“Irion è stata pioniera nel parlare di gestione dei dati rule-based, 20 anni fa”, ricorda il Principal Advisor Mauro Tuvo, “poi si è evoluta sul Data Management end-to-end, ascoltando il mercato. Ma come è possibile rendere visibile il valore di business dell’immenso lavoro sottostante, sotto la punta dell’iceberg? Innanzi tutto, rivolgendosi ai decisori che devono stanziare budget, per questo è stato creato il modello Value Based Data Governance, sviluppato da Irion in collaborazione con Credem e con il docente universitario Franco Francia.   

Per gli utenti finali, il Data Marketplace è la risposta alle esigenze di utilizzo dei dati nelle organizzazioni. Nella visione di Irion, ha spiegato Tuvo nel corso dell’evento, il Data Journey si compone di sei fasi: Publish (creare e pubblicare un Data Product), seguita dall’esperienza Shop (la possibilità di cercare e scegliere tra i prodotti disponibili) e dal Checkout, per poi passare agli step di Tracking (quarta fase) fondamentali per sapere chi sta utilizzando i dati disponibili e come.  

Questa metrica è utile anche per capire il “livello di data quality” che è possibile erogare e mantenere in modo continuativo, in funzione dell’interesse degli utenti interni; infine, il Fulfillment ovvero la nostra capacità di erogare il dato, in seguito all’approvazione del relativo Data Owner; e la fase finale Monitor, che ci consente di utilizzare i KPI prodotti dal nostro marketplace per tenere sotto controllo la distribuzione e il consumo dei dati. “Il marketplace presuppone però alcuni prerequisiti – sottolinea Tuvo – bisogna aver lavorato prima con gli opportuni standard di Data Governance, per renderne possibile la realizzazione” 

Per approfondire:

Torna in alto