Qué es la clasificación de datos

La clasificación de datos es el proceso de organizar los activos de datos. Supone establecer una categorización y definir una o varias taxonomías para toda la empresa.

Un sistema de clasificación ayuda a determinar eficazmente las prioridades y la intensidad de las acciones sobre los datos. Se basa en criterios como la criticidad, la seguridad, el acceso y el uso, la privacidad, la ética, la calidad de los datos y los requisitos de almacenamiento.

La necesidad de desarrollar una «cultura de los datos» ha ido creciendo desde que las empresas comprendieron el valor real de los datos para el negocio. En la práctica, significa seguir estos pasos:

  • identificar los datos relevantes y críticos para la empresa
  • establecer definiciones para toda la empresa
  • especificar su función en los procesos empresariales
  • identificar los vínculos con los datos físicos que los representan en los sistemas informáticos.

Sólo un sistema de metadatos que gestione todo lo anterior permite diseñar y construir sistemas de control automatizados que puedan determinar de forma eficiente y sostenible la calidad de los datos críticos para los procesos empresariales.

Una clasificación específica, combinada con otras funciones de gestión de datos, tiene como objetivo un uso más consciente y fluido de los datos como elemento clave. Los ámbitos de aplicación pueden ser:

  • el proceso de evaluación del riesgo empresarial,
  • la valoración de los datos para determinar varios niveles de seguridad, calidad, confidencialidad,
  • las respuesta a diversas necesidades empresariales emergentes.

¿Cómo funciona?

La clasificación de los datos suele conducir a la creación de un repositorio de metadatos. Entonces se pueden tomar decisiones o «etiquetar» los objetos de datos para facilitar su uso y gobernarlos a lo largo del ciclo de vida. Este repositorio permite centrar los esfuerzos analíticos principalmente en los conjuntos de datos más importantes y críticos. Es esencial diferenciar los datos de bajo valor de los de alto valor. Para ello, hay que definir los controles de seguridad adecuados para cada tipo de datos. Por ejemplo, los datos más relevantes requieren mecanismos de protección más fuertes. La clasificación de los datos es un proceso que requiere mucho tiempo y que se realiza paso a paso. Tiene ciertas implicaciones legales y empresariales.

Todo comienza con la definición de la política de gobierno de los datos. Los procesos empresariales y el inventario de software y hardware en el que residen los datos deben estar debidamente mapeados. A continuación, hay que establecer y ejercer procesos claramente definidos que regulen las etapas de propuesta, aprobación y publicación, así como la semántica de los términos de negocio, entre otros. Lo mismo ocurre con los procesos que determinan las funciones y responsabilidades.

Una vez definidas las «reglas guía», es importante empezar cuanto antes a:

  • buscar los primeros ámbitos de aplicación. Con la ayuda de los especialistas en datos (por ejemplo, el propietario de los datos, el propietario del sistema o el administrador de los datos, en función de las políticas de la empresa), identifique los datos implicados y los procesos que rigen. Además, defina la clasificación y relevancia de los datos, el perfil de riesgo, los dominios y las relaciones, los procesos anteriores y posteriores, etc.
  • mapear quién tiene acceso a los datos. Definir los roles de los usuarios que pueden acceder a determinados datos.
  • aprobar una política de retención. En función del sector industrial al que pertenezca la empresa, determina cuánto tiempo hay que almacenar los datos y cómo (y con qué herramientas) destruirlos.
  • identificar la visibilidad de los datos. Especifica los datos de uso interno (amplio o seleccionado), los datos que deben hacerse públicos y los datos que deben enmascararse según las indicaciones del propietario de los datos. Esto se hace para proteger la propiedad intelectual o para cumplir la normativa vigente.
  • Definir un proceso de actualización y enriquecimiento continuo. Sin esta supervisión constante, los contenidos y la estructura del glosario pronto se vuelven inútiles. No se adaptan a la evolución de las exigencias internas ni siguen el ritmo de los cambios en la empresa.

Por último, es esencial asignar el papel de un supervisor que sea consciente de la importancia de los datos y de su valor en la empresa. Sus tareas están reguladas en la política de Gobierno de Datos, en primer lugar el Chief Data Officer y los Data Owners.

La plataforma Irion EDM facilita la regulación del acceso a los datos, la representación y la navegación de los activos de datos. Dispone de funcionalidades avanzadas de investigación para explorar los datos y descubrir las conexiones entre ellos para encontrar el valor oculto para el negocio, interceptar y minimizar los riesgos y tomar decisiones de gestión más rápidas.

Irion EDM: la plataforma para la clasificación de datos y mucho más.

Irion EDM es un sistema de gestión de datos empresariales completamente basado en metadatos.

Utiliza herramientas de clasificación integradas con las tecnologías más innovadoras de Irion EDM para:

  • encontrar activos de datos, independientemente de dónde residan, utilizando los numerosos conectores y las técnicas avanzadas de descubrimiento de datos de IrionEDM. Esto acelera su proyecto;
  • crear un Catálogo de Datos compartido que contenga los datos relevantes del negocio;
  • establecer la propiedad, las reglas de protección, la segregación y la calidad, las políticas de retención y todo lo que sea relevante para el negocio. Todo ello cumpliendo con la normativa vigente, tanto externa como de la empresa;
  • mejorar la comprensión de los procesos de negocio. Hay que ver la calidad y el origen de los datos, si están bajo estrictas normas reguladoras (por ejemplo, las de privacidad), y si otras oficinas los reutilizan. También es importante conocer el valor y la importancia de los datos gestionados para optimizar su uso;
  • detectar las relaciones de linaje de los datos. Así podrá rastrear las transformaciones de los datos a lo largo del tiempo, quién los utiliza y para qué proceso empresarial.
Scroll al inicio