Los modelos de inteligencia artificial (IA) basados en redes neuronales profundas (Deep Learning) han revolucionado la visión artificial, convirtiéndose en piezas clave para la automatización y el análisis avanzado de imágenes en múltiples sectores industriales. Su aplicación en el mundo real no acaba con la puesta en producción de estos modelos, la gestión eficiente de su ciclo de vida es esencial para responder a las demandas de adaptabilidad y precisión que permitan a los modelos ajustarse en todo momento a las condiciones de producción. Este artículo explora el ciclo de vida de estos modelos, analizando el aprendizaje continuo y destacando el papel del experto, asimismo, se presentan técnicas en el estado del arte que hacen posible su gestión.
El concepto de inteligencia artificial aparece en los años 50, haciendo referencia a la posibilidad de que existan máquinas capaces de simular la inteligencia humana. En el campo de la imagen, la implantación de la inteligencia artificial ha ido de la mano de las redes neuronales convolucionales (CNNs) que surgen en los años 80, permitiendo una extracción de características automática, en lugar de la identificación y extracción de características manual llevada a cabo principalmente por algoritmos ad-hoc convencionales basados en características de color, forma o textura.
La implantación de los modelos de inteligencia artificial basados en CNNs comienza a popularizarse en la década de los 2000, cuando se desarrolla el hardware necesario para la creación y entrenamiento de redes neuronales profundas. El gran auge se produce a partir del modelo AlexNet presentado en 2012 en la competición ImageNet. Desde entonces, las técnicas de Deep Learning aplicadas a imagen han evolucionado de manera vertiginosa con la aparición de nuevas arquitecturas basadas en CNNs cada vez más complejas, como VGG, ResNet o EfficientNet, y la aparición de otras más nuevas basadas en Transformers, ofreciendo nuevas posibilidades, que, entre otras cosas, han permitido la aparición de Large Vision Models (LVMs) como el comúnmente utilizado DINOv2.
A pesar de la diversidad de arquitecturas, todos estos modelos comparten un nexo común: la necesidad de su entrenamiento para las tareas específicas y una gestión adecuada de su ciclo de vida.
Para el desarrollo de un proyecto de visión artificial basado en algoritmos de inteligencia artificial, se debe de tener en cuenta el ciclo de vida de los modelos. Este tiene como principales etapas las siguientes:
Una vez se realiza el despliegue, se dispone de un modelo en producción funcionando correctamente para las condiciones representadas en el dataset con el que fue entrenado. Pese a ello, esto no se debe quedar aquí, ya que existe la creencia errónea de que los modelos una vez entrenados pueden funcionar indefinidamente sin necesidad de actualizaciones. Esta visión ignora las características cambiantes de los entornos de producción, lo cual puede llevar a graves problemas debido a diferentes tipos de derivas.
Por ello, es importante no finalizar el ciclo con la puesta en producción de un modelo estático, sino que se debe de prestar especial atención durante el proceso de monitorización en búsqueda de posibles degradaciones de rendimiento, que han de ser solventadas mediante el concepto de aprendizaje continuo.
La aplicación del aprendizaje continuo para la gestión del ciclo de vida de un modelo de IA implica la monitorización activa del rendimiento del sistema, la identificación de nuevos patrones, el curado de nuevas imágenes relevantes y el reentrenamiento de una nueva versión del modelo con la información actualizada. De esta forma, se transforma el ciclo de vida del modelo en un proceso iterativo que permite generar nuevas versiones del modelo que lo ajustan a las nuevas condiciones de producción.
En la actualidad, existen numerosas técnicas que ayudan en la automatización de determinadas tareas del aprendizaje continuo, pero en el proceso de implantación surgen dudas como ¿Quién lleva a cabo la monitorización de los modelos en producción? ¿Cómo se realiza el curado de los datos? ¿En qué momento se debe llevar a cabo un reentrenamiento para garantizar la eficiencia del modelo? ¿Cuándo se sustituye la versión del modelo en producción?
Pese a no existir una respuesta universal, existe una figura común en la mayoría de las respuestas: el humano. La presencia de expertos en el dominio sigue siendo crucial en varias etapas del ciclo de vida. Son responsables de la línea o máquina, quienes supervisan el rendimiento del modelo, detectando en base a su experiencia anomalías en las predicciones. Además, se encargan de la selección y curado de las imágenes más relevantes garantizando junto con tecnologías de evaluación y selección de datos, como core-set o detección de outliers, su calidad para ser utilizadas en el reentrenamiento del modelo. A su vez, el proceso de anotación de las imágenes puede ser realizado tanto por los propios expertos del dominio, como por algoritmos con supervisión del operario o un ingeniero responsable del sistema.
Por otro lado, la figura humana sigue siendo relevante para tomar la decisión de cuándo se debe reentrenar el sistema, ajustándolo a las condiciones actuales de producción sin caer en ineficiencias.
Todo ello resulta en que la presencia humana en la gestión de los modelos sea una parte activa, en la que apalancar una correcta estrategia de mantenimiento de los modelos en entornos de producción industriales.
Para llevar a cabo la gestión del ciclo de vida, se hacen necesarias una serie de herramientas software encargadas de realizar tareas específicas. Algunas de ellas son:
Además, existen plataformas integrales, que permiten gestionar todo el ciclo de vida de modelos de imagen desde un único entorno. Gracias a sus interfaces, estas plataformas consiguen la abstracción del operario del complejo uso e integración de las herramientas anteriormente mencionadas, brindando autonomía tanto a las empresas, como a sus operarios y permitiendo una gestión eficiente de los proyectos de visión artificial y sus modelos de Deep Learning asociados. Algunos ejemplos son:
Pese a los exponenciales avances tecnológicos experimentados en el campo de la visión por computador, es imprescindible no dejar de lado una estrategia basada en los datos que permita la adaptación de los modelos a las condiciones cambiantes de los entornos reales. Por ello, resulta fundamental implementar aprendizaje continuo, situando a los expertos en el centro de la estrategia de gestión del ciclo de vida de los modelos de Deep Learning, lo que permite prolongar su vida útil al mantener la confianza en sus predicciones.
Pablo Galán Saiz
Investigador en IA y visión artificial en Tecnalia
----
Este artículo aparece publicado en el nº 565 de Automática e Instrumentación págs 88 a 90.
La empresa familiar apuesta por un concepto de interfaz flexible, basado en KERN Universal Ports (KUP) o KERN Universal Modules (KUM)
Permiten una visualización avanzada de procesos, control remoto en tiempo real y una mejora sustancial en la eficiencia operativa
Comentarios