Data Fabric: hype o realtà? Qual è la differenza tra augmentation e automation?

Data Fabric hype o realtà
Uno dei termini più usati, ricercati e forse abusati oggi nel modo dei data & analytics è “augmented”. E’ richiesto che tutto sia “augmented” spesso prima ancora di esistere: una contraddizione in termini perché per definizione posso aumentare qualcosa di cui già dispongo. E così si parla di augmented data quality… quando ancora non si fa data quality, di augmented data catalog… quando non so cos’è un data catalog o non l’ho ancora implementato e così via.

Peggio talvolta si definisce augmented qualcosa che semplicemente fa parte di ciò che abitualmente uno strumento, un software, un processo è in grado di fare da sempre…anche se non lo chiamavamo così.

Ma cosa vuol dire allora “aumentare” un processo? Che differenza c’è tra augmentation e automation? Quali sono le possibilità reali di applicazione? Da dove partire?

Sarebbe utile forse fare un po’ di ordine, confrontarsi nel concreto e provare a capirsi un po’ perché l’innovazione non resti negli slogan ma porti del valore.

Simile il discorso se parliamo di #DataFabric. Sappiamo cos’è?

E’ interessante notare che il concetto di Data Fabric copre e riassume in sé una decina dei “top trends” identificati da Gartner® per il data management (cfr. Gartner 2020 Planning Guide for Data Management). Riporto allora un breve stralcio della definizione che Gartner dà di Data Fabric:

The data fabric takes data from a source to a destination in the most optimal manner, it constantly monitors the data pipelines to suggest and eventually take alternative routes if they are faster or less expensive — just like an autonomous car. Initially the data fabric will be semiautonomous where human intervention is required, but eventually the idea is to make the data fabric fully autonomous. Data consumers will browse a data catalog, not knowing where data resides, pick the data they need and the data fabric will provide the data for them in the most optimal way in terms of performance, effort and cost

Gartner® – Demystifying the Data Fabric – Published 17 September 2020 – By Analysts Jacob Orup Lund

Traduco perché aiuta a comprendere meglio la portata…

“Il data fabric porta i dati da una sorgente ad una destinazione nella maniera più ottimale, controlla le filiere, suggerisce e sceglie strade alternative se sono più veloci o meno costose – proprio come un veicolo autonomo. Inizialmente il data fabric sarà semiautonomo e richiederà l’intervento dell’uomo, ma l’idea è che il data fabric diventi completamente autonomo. I fruitori del dato navigheranno in un catalogo di dati, senza sapere dove i dati risiedono, sceglieranno i dati di cui hanno bisogno e il data fabric li procurerà per loro nel modo ottimale in termini di performance, efficienza ed efficacia”

Letto bene?

Penso che il grosso pregio e l’utilità di società come Gartner che fanno analisi di mercato e che lavorano come ponte fra la domanda e l’offerta sia proprio quello di cogliere trend, offrire spunti, stimolare i players, favorire l’innovazione andando spesso oltre quello che oggi può sembrare ragionevole, perché domani potrebbe non esserlo più.

Il nostro compito è quello di accettare la sfida, fare innovazione, ma così che le cose pur guardando al futuro accadano nella realtà oggi!

Torna in alto