Hibridación de datos y datos poco estructurados en la Industria 4.0
Llamamos “hibridación de datos” a los procesos que permiten generar un conjunto de datos único y listo para ser utilizados, desde herramientas informáticas, a partir de fuentes de datos heterogéneas y con distintos grados de estructuración. En nuestra experiencia la “hibridación de datos” suele requerir al menos cuatro pasos: estructuración, homogenización, armonización y enriquecimiento.
Actualmente, la hibridación de datos en el sector industrial está mucho menos presente que en otros sectores como servicios o retail. Siendo la predicción de la demanda el caso más habitual, en el mundo industrial, dónde se realiza una “hibridación” previa de los datos internos de ventas con otros datos (ej. meteorología, geodemografía, trafico, festivos, etc). Salvando el caso de previsión de demanda, dentro de las plantas industriales suele ser mucho menos habitual encontrar casos “potentes” de hibridación de datos, pero esto no quiere decir que no sea necesario. Así es habitual, en muchas empresas industriales, que los sistemas de información no estén integrados con las máquinas y cuando lo están, suele ser una integración encaminada a un propósito operativo (ej. trazabilidad) y no a la obtención de unos datos de calidad que permitan su uso por sistemas de inteligencia.
Sistemas Productivos e Hibridación de Datos
Cualquier intento de desplegar sistemas de inteligencia para la mejora de la producción en plantas industriales debe haber sido precedido por un análisis de la disponibilidad de datos para alimentar el sistema y del coste asociado de obtención. Así, por ejemplo, tiene poco sentido implantar un sistema inteligente de planificación de operaciones (scheduling) en un taller si no tenemos automatizado la captura de datos necesario para actualizar el sistema de planificación. Pues muy pronto las planificaciones quedarán obsoletas o se requerirá una importante dedicación de recursos humanos para mantener el sistema actualizado.
En general, en los sistemas de producción, los datos serán internos, pero su hibridación presenta retos similares a los que se encuentran con datos externos. A continuación, vamos a describir un caso basado en nuestra experiencia.
En el taller en cuestión, que trabaja bajo pedido, la primera necesidad planteada era disponer de un sistema que les permitiese tener un seguimiento de tiempos y costes de
cada trabajo en planta, para posteriormente poder generar inteligencia encaminada a ayudar a:
1. La confección de presupuestos (ej. aprendizaje de unidades de repercusión y los factores que les afectan)
2. La detección de desviaciones anómalas (ej. tiempos de procesamientos que los modelos de inteligencia no sean capaz de explicar)
3. La detección de patrones de interés (ej. trabajadores con productividad alta)
El taller disponía de un ERP con información de los pedidos y materiales, un sistema CAD para el diseño de las piezas, partes manuales (papel) de producción y controles periódicos de calidad que eran volcados manualmente al ERP. Toda esta información no estaba integrada por lo que la implementación de cualquier sistema de inteligencia era imposible. Se partió de un análisis de disponibilidad de datos y a partir de dicho análisis se elaboró un plan de acción con las siguientes acciones:
1. Nuevas fuentes de datos. Se detectaron falta de datos imprescindibles para cubrir las necesidades planteadas. Para ello, se incorporaron nuevos sensores desarrollados ad-hoc para algunas máquinas así como la introducción de tablets con aplicaciones específicas como alternativa a los partes manuales y el desarrollo de un extractor para obtener del ERP aquellos datos de interés para el sistema de inteligencia.
2. Desarrollo de un sistema de hibridación de datos que partiendo de las distintas fuentes de datos fuese capaz de hibridarlas y volcar a un repositorio único los datos. Este sistema no podía ser totalmente automático ya que necesitaría cierta supervisión de la oficina técnica.
3. Estructuración de datos. Información muy importante para el proceso de producción y generación de inteligencia se encontraba en formato de planos CAD. Estos son datos poco estructurados que no pueden ser utilizados directamente, pero que una vez estructurados pueden generar datos de gran interés para el proyecto. Se decide abordar mediante un proyecto de I+D la generación de modelos de inteligencia que permitan estructurar los datos de los sistemas CAD.
Jaime Martel Romero-Valdespino es CTO en Intelligent Information Technologies SL
LinkedIn
Twitter