¿Qué es la Data Governance by Design?

La gobernanza de datos por diseño es la forma de gestionar y mantener las aplicaciones y procesos de una empresa y garantizar la supervisión de los datos implicados a lo largo de todo su ciclo de vida, desde la definición de los requisitos hasta la gestión de la ejecución.

Pero lo primero es lo primero, así que empecemos por la Data Governance.

Su objetivo es garantizar la autoridad y el control en la gestión de los activos de datos. En efecto, se trata de establecer los modos de funcionamiento de un pipeline de datos y de definir las características técnicas y de negocio de los datos gestionados. Es necesario establecer la semántica de los datos, las relaciones entre los datos y sus procesos de elaboración, así como las funciones de tal o cual manera que intervienen en su gestión. Nos referimos, pues, al catálogo de datos, al Business Glossary (glosario empresarial), al linaje de datos y a la propiedad. Todos estos fenómenos pueden representarse convenientemente con un modelo de metadatos estructurado.

Calidad de los datos: de la semántica a la propiedad

Si el objeto representado -un campo de datos, un proceso, un conducto de datos- ya está presente en la organización, es necesario reconstruir los metadatos que describen las características de gobernanza relacionadas. A menudo es necesaria una intervención activa para impulsar, por ejemplo, la determinación de las titularidades, las definiciones o la supervisión de la calidad. De hecho, la calidad de los datos es uno de los aspectos que más a menudo requieren una intervención para reforzar los sistemas de control y la revisión de los modos de funcionamiento. Esto ocurre no sólo en términos de verificación, sino también de elaboración y responsabilidad de los procesos de control, ejecución y remediación.

Las tecnologías modernas permiten facilitar el proceso de reconstrucción y refuerzo. Sin embargo, en muchos casos el hecho de que los resultados sean completos y se mantengan presenta desventajas. Esto tiene que ver no sólo con la potencia de las herramientas de captura de metadatos, sino también y sobre todo con las tecnologías y las formas de implantación y despliegue de las aplicaciones y procesos incluidos en el perímetro de gobernanza.

El objetivo de Data Governance by Design es superar estas lagunas para aquellos ámbitos de datos y procesos intensivos en datos que lo permitan, ya que aún están por realizar e implementar.

Procesos intensivos en datos: los principios de la gobernanza

A lo largo de todo el ciclo de vida de un proceso o de una solución de software, es necesario garantizar los principios de Gobernanza de Datos pertinentes, es decir, asegurarse de que están definidos, formalizados, implementados y activados. Estos principios son:

  • semántica y ontología – ¿cuál es el significado «oficial» de los datos procesados? ¿cuáles son sus relaciones mutuas y con otras entidades?
  • arquitectura de datos – ¿qué datos del modelo de información de la empresa se relacionan con los gestionados en este proceso / aplicación?
  • Linaje de los datos – ¿qué camino siguen los datos a lo largo del proceso? ¿Cuáles son las trayectorias de los datos gestionados por la aplicación?
    Calidad de los datos – ¿cuáles son las normas de calidad que garantizan que los datos puedan emplearse para diversos usos?
  • responsabilidad – ¿quiénes son las partes interesadas que participan de distintas maneras en el proceso, en el uso de la aplicación?
  • orquestación – ¿cómo se elabora el proceso? ¿En qué procesos participa la aplicación? ¿Debemos prever la sincronización de los pasos automatizados para garantizar la correcta gestión global de los datos a lo largo de estos procesos?

Estas perspectivas, estas cuestiones, también deben tenerse en cuenta cuando gobernamos los datos implicados en un proceso o una aplicación existente. Sin embargo, es mucho más sencillo y eficiente considerar (y gestionar en un modelo de metadatos estructurados) estos aspectos «por diseño» en la fase de implementación. Y, si es necesario, también «por defecto» a lo largo de todo el ciclo de vida.

¿Cuáles son los modos de aplicación y las ventajas de la Gobernanza de Datos por Diseño?

El paradigma del «by design» tiene una aplicación práctica en todas las fases del ciclo de vida de una solución con uso intensivo de datos.

  • A partir de las sesiones de análisis en las que se recogen los requisitos mediante entrevistas, el examen de la documentación existente u otras aportaciones (a menudo no disponibles en forma estructurada), las características de la solución esperada toman forma teniendo en cuenta las perspectivas de gobernanza mencionadas anteriormente. El modelo de metadatos con estas características registradas puede utilizarse como lista de comprobación. Es decir, garantiza la disponibilidad y la gestión ordenada de todos los elementos útiles para la descripción completa y precisa de la solución esperada, así como su colocación «nativa» en la visión global de los procesos y sistemas empresariales.
  • Durante la fase de implementación de la solución, estos metadatos se enriquecen, se refinan y se calibran teniendo en cuenta también los aspectos técnicos (limitaciones, oportunidades). En las plataformas de gestión de datos empresariales basadas en metadatos, los metadatos que describen los requisitos están vinculados a los «activos» que impulsan los motores de gestión de datos (calidad de datos, integración de datos, preparación, análisis, entrega, etc.). Representan a la perfección la relación entre el Glosario de Negocio y el Diccionario de Datos, entre la elaboración del proceso y el flujo de trabajo que lo gestiona y, sobre todo, entre la descripción de las características de la solución y su comportamiento real.
  • Durante la fase de mantenimiento, toda acción encaminada a la corrección o la evolución debe llevarse a cabo sólo después de considerar los posibles cambios en los metadatos que describen los requisitos y las especificaciones. Un examen preliminar de estos metadatos permite tener una idea exacta de los posibles impactos de una intervención, tanto técnicos como de negocio, y así buscar la opción más conveniente.

Irion EDM: la plataforma para la Gobernanza de Datos por Diseño y más.

Irion EDM es un sistema de gestión de datos empresariales completamente basado en metadatos.

Los metadatos juegan un papel fundamental en las soluciones de gestión de datos construidas con Irion:

  • describen las características técnicas y empresariales de los datos y sus relaciones con otras entidades (activos informáticos, unidades de negocio, procesos, reglas y otros)
  • son flexibles, es decir, pueden adaptarse para representar las entidades, eventos y fenómenos relevantes para una empresa concreta
  • son dinámicos, es decir, pueden variar a lo largo del tiempo adaptándose a los cambios en el ámbito de la empresa y de las aplicaciones
  • algunos de ellos son actuantes, es decir, impulsan los motores de gestión de datos de la plataforma (conexión con fuentes, integración de datos, aplicación de reglas de control, enriquecimiento de datos, clasificación de datos, análisis, orquestación, etc.)
  • son integrables, es decir, los metadatos empresariales, técnicos y de actuación pueden relacionarse entre sí y representarse y explorarse en un modelo. Un modelo de este tipo apoya el trabajo de todos los roles que participan en la gestión de datos empresariales, como los ingenieros de datos, los analistas de negocio, los propietarios de datos, los científicos de datos.

Gracias a estas características, combinadas con una funcionalidad completa y evolucionada, con componentes específicos para la aplicación de IA/ML y con el innovador paradigma Declarativo, Irion EDM puede soportar los modelos más innovadores de gestión y gobierno de activos de datos. Entre ellos, Data Fabric, Data Governance by Design, Augmented Data Management, Service Oriented Data Governance.

Scroll al inicio