En una publicación de 2023 habíamos repasado algunas características de un artefacto cada vez más presente entre las tendencias del momento para los profesionales del data management: el Data Product. La publicación, retomando una serie de conceptos de la literatura (en particular el texto de referencia sobre Data Mesh de Zhamak Dehghani), intentaba proponer un enfoque concreto para su posicionamiento dentro de las arquitecturas de datos modernas. En el mundo de los datos, hemos pasado de gestionar datos generados por procesos, productos y aplicaciones a tener que gestionarlos como productos: “data as a product”.
No se trata solo de una nueva palabra de moda, sino de un verdadero cambio de paradigma: los datos ya no son solo activos que deben custodiarse y reutilizarse, sino productos que deben diseñarse, gobernarse, valorizarse y, en algunos casos, también intercambiarse o venderse.
Datos y product management: una mentalidad necesaria
Al diseñar datos o aplicaciones, se necesita una nueva mentalidad: la del producto. Significa pensar en términos de experiencia de uso, sostenibilidad, valor a lo largo del tiempo y gobernanza.
Los Data Products no son simples tablas, informes o dashboards, sino que, gracias a un adecuado conjunto de metadatos y otros elementos que apoyan su uso (código, capacidades de la plataforma de datos que los gestiona), se convierten en objetos útiles para la toma de decisiones empresariales. Por lo tanto, deben ser buscables, descritos en términos de semántica, fiabilidad, ownership, origen; en otras palabras, deben estar listos para satisfacer la principal necesidad del consumidor: “estar listos para usar”. En poco tiempo, el data product ha consolidado, en la visión y en las prácticas de muchas organizaciones, un valor intrínseco propio, independiente del paradigma completo del Data Mesh.
El lugar natural donde encontrar, publicar y gestionar Data Products es el Data Marketplace.
Data Marketplace: finalidad y beneficios
Internamente a la empresa, es un portal controlado donde los equipos pueden compartir y acceder a productos de datos, con lógicas similares a las de un e-commerce, y habilita el Data Sharing. Externamente, puede convertirse en una vitrina para vender o intercambiar Data Products con socios o clientes, respetando las políticas y la normativa de compliance recogidas en un Data Contract que regula las modalidades de consumo del propio producto (basta pensar en los casos de uso en los sectores asegurador, financiero o retail). La evolución más reciente de los Data Marketplace también contempla la gestión de Data & AI Products, con la posibilidad de versionar modelos, asociar notebooks, pipelines de entrenamiento o incluso servicios API listos para usar.
Son muchos los fines de uso de este objeto:
- Intercambios informativos de datos certificados entre actores pertenecientes a diferentes “dominios”
- Integraciones entre sistemas informáticos
- Entrenamiento, prueba y validación de aplicaciones de Inteligencia Artificial
- Gobernanza del Shadow IT
- Monetización mediante la venta de datos a terceros
- Capitalización de las inversiones en iniciativas de Data Governance.
Data Product y valor de los datos: cómo estimarlo
La versatilidad de uso es uno de los factores que más contribuyen al valor de un data product entendido en este sentido. Un valor que también puede estimarse económicamente recurriendo a modelos basados en distintos enfoques. Veamos algunos, partiendo de las preguntas en las que se fundamentan.
- ¿Cuáles son los destinos de uso de un data product y cuánto contribuyen estos destinos de uso al resultado económico de la organización? Este modelo es útil para determinar el valor agregado del data product en todos sus componentes.
- ¿Cuánto se amplifica el valor de un dataset, de un informe o de un modelo analítico si se pone a disposición en forma de Data Product?
Este modelo tiene como objetivo estimar el valor añadido del data product respecto al de los datos “en bruto”, gracias al conjunto de metadatos, código y dependencias de la plataforma.
- ¿Cuál es el coste de realización del Data Product? Los modelos basados en lógicas de Activity Based Costing permiten determinar el coste del producto en función de la parte proporcional del uso de recursos humanos y tecnológicos, tanto internos como externos, empleados en su creación; en este caso, el coste no representa el valor, ya que no tiene en cuenta los efectos económicos derivados de su consumo, pero puede ser un elemento útil para evaluar la conveniencia de su producción.
Estos métodos de evaluación pueden tenerse en cuenta para la determinación del precio de un Data Product, en caso de que se desee ofrecerlo para su venta al exterior o, en cualquier caso, definir un modelo de pricing también para el mercado “interno”.
El Data Product, interpretado desde esta perspectiva, es un objeto con una identidad de negocio bien definida, adquirible a través de un entorno que no requiere competencias técnicas particulares (el Data Marketplace), que amplifica el valor de los datos, constituyéndose así en un componente fundamental para una organización data-driven.