Irion, invitada a intervenir en la conferencia «Annual Data Driven Banking in the next normal banking» en la sesión TO BE del día dedicada a los Datos, organizada por ABI Servizi, ilustró cómo los metadatos están en el centro de las mejores prácticas y del hype relacionado con la gestión de datos.
Paradigmas y conceptos de diseño de la Gestión de Datos, metodologías para el desarrollo y la gestión de soluciones intensivas en datos, estilos operativos de Gobernanza de Datos actualmente en uso o indicados por los analistas como modelos de referencia para procurar requerir metadatos y generar metadatos.
Repasemos rápidamente algunos de ellos.
Data Governance service oriented
Se trata de un paradigma de gestión de la Gobernanza de los Datos destinado a potenciar de forma perceptible en la empresa la contribución que ésta puede dar a las actividades y objetivos del mayor número posible de actores de la misma. Este concepto se plasma en la exposición de un catálogo de servicios de Gobernanza de Datos que incluye servicios de información, análisis, seguimiento y modelos de control que pueden utilizarse, por ejemplo:
- en la formulación y aplicación de una estrategia digital, proporcionando información útil para evaluar la sostenibilidad de las intervenciones identificadas, la disponibilidad y la cualificación de los activos de información necesarios para fundamentar los objetivos estratégicos;
- en el diseño de un sistema de controles que se aplique a un área de información determinada para supervisar el grado de cobertura de los fines para los que los controles utilizan los datos
- en la identificación de la Golden Copy, la fuente que contiene la versión oficial de una determinada información que se utilizará en un análisis o informe.
Todos estos servicios y otros, cuya necesidad puede surgir a lo largo del tiempo, están habilitados por la presencia de metadatos y técnicas aplicadas a ellos: Linaje de datos, cobertura de los sistemas de control, mapeo de los conceptos empresariales en los sistemas de información, etc.
La gobernanza de datos orientada al servicio utiliza metadatos.
Data Governance by design
Es una práctica que debe aplicarse en todos los proyectos o actividades de gestión que impliquen datos corporativos. Consiste en considerar en estas actividades todos los requisitos capaces de garantizar la gobernanza de los datos corporativos: propiedad, linaje, semántica, calidad, seguridad, etc. Por ejemplo, el equipo de proyecto de un nuevo sistema de información tiene en cuenta los conceptos normalizados en el glosario empresarial corporativo, refiriéndose a ellos en el diseño de las estructuras de información utilizadas; los nuevos conceptos específicos del sistema que se va a implantar se califican en términos de propiedad, definición/significación, reglas de validación.
La gobernanza de los datos por diseño utiliza y produce metadatos.
Adaptive Data Governance
El Gobierno de Datos Adaptativo es un modelo de Gobierno de Datos que puede expresarse a través de diferentes estilos, dependiendo de los propósitos, las características, el grado de madurez de una organización y el contexto individual al que se aplica.
Un ejemplo práctico puede aclarar mejor este concepto. Las prácticas de gobernanza de datos necesarias para garantizar el cumplimiento de los requisitos normativos en el sector bancario se centraron inicialmente en la calidad de los datos; la evolución de estos requisitos a lo largo del tiempo llevó a los bancos a tener que cubrir también otras perspectivas de gobernanza, por ejemplo, el linaje de datos. Pero esto era sólo el principio de un viaje: el cumplimiento de la normativa ya no es el único propósito para el que es necesario proteger los activos de datos; el objetivo es cada vez más calificarlos y protegerlos para que expresen todo su valor potencial. Además, los datos utilizados para informar y rendir cuentas a los organismos de supervisión ya no son los únicos que deben gestionarse dentro del perímetro de gobernanza: los volúmenes, la latencia, la naturaleza y los tipos de datos que deben gobernarse están cambiando. Por estas razones, el estilo de Gobierno de Datos debe adaptarse a estos nuevos propósitos y tipos de información. En consecuencia, nuevas entidades, atributos y relaciones entran en el metamodelo que soporta la Gobernanza de Datos. Un ejemplo sencillo fue la introducción de los metadatos necesarios para gestionar el cumplimiento del Reglamento Europeo de protección de datos personales, que introdujo el concepto de Categoría de Datos Personales; pero el reto Adaptativo se traslada a otras etapas evolutivas de una empresa: IoT, big data, entornos cloud y sistemas híbridos de Gestión de Datos basados en metadatos llevan a la introducción de nuevos tipos de metadatos: metadatos activos, latencias, canales, arquitecturas.
En la Gobernanza de Datos Adaptativa los diferentes estilos de Gobernanza de Datos requieren la disponibilidad de diferentes metadatos.
Data Fabric
Gartner define el Data Fabric como un concepto de diseño al que hay que aspirar para dar soporte a los retos a los que las organizaciones se enfrentarán, o ya se están enfrentando, para garantizar una gestión eficaz y sostenible de los activos de información que crecen exponencialmente a lo largo de múltiples dimensiones.
- Los datos disponibles son cada vez más voluminosos, proceden de fuentes cada vez más numerosas y diversificadas y tienen ciclos de vida y naturalezas heterogéneas;
- Existe una creciente demanda de información por parte de cada vez más categorías de consumidores de datos humanos y «tecnológicos» (analistas de negocio, científicos de datos, ingenieros de datos, modelos «autónomos» de analítica, Ai, ML, …)
Como resultado de estas consideraciones, Gartner ha racionalizado una serie de capacidades, organizadas en pilares, en el concepto de Data Fabric. Se trata de un modelo ideal, que aún no se ha implantado del todo en la práctica, pero que se está convirtiendo en una referencia para las empresas y proveedores del sector. Al menos tres de los pilares identificados por Gartner, estrechamente interconectados, se refieren directamente a los metadatos:
- Catálogo de Datos Aumentado: un catálogo de información disponible con características distintivas destinadas a apoyar un uso activo de los metadatos que pueda garantizar la máxima eficiencia de los procesos de Gestión de Datos;
- Gráfico de conocimiento semántico: representación gráfica de la semántica y las ontologías de todas las entidades implicadas en la gestión de los activos de datos; obviamente, los componentes básicos representados en este modelo son los metadatos;
- Metadatos activos: metadatos útiles para ser analizados con el fin de identificar oportunidades para un tratamiento y uso más fácil y optimizado de los activos de datos: archivos de registro, transacciones, inicio de sesión del usuario, plan de optimización de consultas.
Los metadatos son la base sobre la que se asienta el concepto de Data Fabric, que según Gartner es el concepto de referencia para el futuro de la gestión de datos.
Data Valuation
Cada vez es mayor el interés por la valoración de datos, la disciplina que consiste en determinar el valor de los activos de datos de una empresa, con el objetivo. Los objetivos de la valoración de datos son:
- para ayudar a evaluar las prioridades y los presupuestos que deben asignarse a las intervenciones intensivas en datos y procesos;
- Establecer un valor comercial de los datos hacia los socios/competidores (monetización de los datos);
- Hacer evidente la contribución del gobierno de los datos al valor de la empresa.
Se pueden calcular métricas de valoración de datos que midan las distintas contribuciones al coste y al valor de los datos a lo largo de una cadena de producción de datos que puede representarse de forma estructurada, a través de un modelo de metadatos. Una vez calculadas, estas métricas pueden enriquecer el modelo, que las recoge como atributos de la información catalogada en él.
La valoración de datos utiliza y produce metadatos.
Cómo y por qué prepararse
Los conceptos, las prácticas y los métodos ilustrados anteriormente son capaces, ya ahora o en el futuro, de soportar de forma virtuosa una serie de retos tecnológicos, organizativos y culturales. Que sepamos, no hay empresas capaces de aplicarlos concretamente hoy en día, ni tampoco tecnologías capaces de soportarlos completamente. Sin embargo, es cierto que cada uno de ellos no puede ser gestionado sin los respectivos metadatos utilizados y producidos.
Sin embargo, las empresas que estén interesadas en evaluar o adoptar uno o varios de estos modelos pueden empezar a prepararse ahora trabajando en tres niveles:
Metodos
Empezar a estructurar y modelar las características de las soluciones y procesos de las aplicaciones intensivas en datos.
- Iniciar experiencias concretas de representación de requisitos, especificaciones funcionales y técnicas, durante la implementación y mantenimiento de soluciones intensivas en datos, a través de un conjunto de metadatos estructurados interconectados en un modelo semántico.
Herramientas
Verificar la presencia de metadatos en la arquitectura y eventualmente integrarlos con:
- componentes/plataformas de gestión de datos basados en metadatos;
- herramientas de modelado de metadatos capaces de definir y gestionar modelos semánticos altamente configurables y adaptables en el tiempo en las entidades, atributos y relaciones.
- Habilidades, cultura
Verificar la disponibilidad, posiblemente consolidándola o desarrollándola, de competencias específicas en gestión de metadatos, en modelización conceptual y lógica de datos, en metodologías ágiles de gestión de proyectos; - Promover, por ejemplo, en el contexto de programas más amplios de alfabetización de datos, iniciativas de alfabetización sobre los principios de uso de los metadatos, sobre la lectura de modelos de datos, sobre la comprensión y la expresión de los requisitos de forma estructurada.