I Data Scientist sono concordi: verificare la qualità dei dati di cui si dispone è la sfida più complicata

A06AFA1E[1]

Verificare la qualità dei dati di cui si dispone è la principale sfida che si trovano ad affrontare gli “scienziati del dato”. A rimarcarlo ancora una volta, l’edizione 2017 dello studio The State of Data Science & Machine Learning, presentato da Kaggle, la più nota community di Data Scientist al mondo. La ricerca, condotta quest’anno per la prima volta, fornisce una panoramica omnicomprensiva sullo stato attuale della Data Science e del Machine Learning, e ha coinvolto, a livello globale, oltre 16.000 professionisti.

Sono diversi gli insight interessanti che emergono dal report. Alcune sono semplici curiosità: ad esempio, letà media di chi svolge questa professione è di circa 30 anni, che sale però a 34 considerando solo i rispondenti italiani; di questi, la maggior parte ha conseguito un master dopo gli studi universitari; la retribuzione annua, invece, si attesta intorno ai 55.000 dollari (pari a circa 46.000 euro, che scendono però a 38.000 euro nel nostro Paese).

Guardando al lato pratico e al lavoro quotidiano di chi si occupa di estrapolare informazioni a partire dai dati, un risultato ci colpisce e interessa particolarmente. Quasi un rispondente su due – il 49,4% per la precisione – cita infatti i dirty data tra le principali problematiche che si trova ad affrontare nello svolgimento del proprio lavoro. E guardando verticalmente, specificando quindi l’industry di interesse, la percentuale cresce ulteriormente – fino al 57,5% – se si considerano esclusivamente i professionisti che operano nel settore assicurativo. La qualità dei dati, dunque il loro controllo e certificazione, è insomma universalmente riconosciuta come priorità, ma nella percezione degli addetti ai lavori lo è, ancora di più, per le compagnie di assicurazione.

Irion è da sempre consapevole della fondamentale importanza della data quality: è infatti essenziale determinare l’affidabilità dei dati di cui si dispone, per poterli trasformare in informazioni certificate e utili. Le caratteristiche della nostra piattaforma e dei suoi Add-On specifici per il Data Quality Management, consentono di strutturare ed ingegnerizzare il processo di elaborazione dei dati aziendali, permettendo il monitoraggio e il controllo nel continuo della qualità degli stessi: grazie al supporto della nostra piattaforma per l’enterprise data management, aiutiamo i nostri clienti a prendere decisioni di business realmente data-driven.