De modelos estáticos al aprendizaje continuo

El fin del terraplanismo de la IA en tareas de visión por computador

Pablo Galán Saiz, investigador en IA y visión artificial en Tecnalia | martes, 7 de octubre de 2025, 17:24

Los modelos de inteligencia artificial (IA) basados en redes neuronales profundas (Deep Learning) han revolucionado la visión artificial, convirtiéndose en piezas clave para la automatización y el análisis avanzado de imágenes en múltiples sectores industriales. Su aplicación en el mundo real no acaba con la puesta en producción de estos modelos, la gestión eficiente de su ciclo de vida es esencial para responder a las demandas de adaptabilidad y precisión que permitan a los modelos ajustarse en todo momento a las condiciones de producción. Este artículo explora el ciclo de vida de estos modelos, analizando el aprendizaje continuo y destacando el papel del experto, asimismo, se presentan técnicas en el estado del arte que hacen posible su gestión.

El auge del Deep Learning en imagen

El concepto de inteligencia artificial aparece en los años 50, haciendo referencia a la posibilidad de que existan máquinas capaces de simular la inteligencia humana. En el campo de la imagen, la implantación de la inteligencia artificial ha ido de la mano de las redes neuronales convolucionales (CNNs) que surgen en los años 80, permitiendo una extracción de características automática, en lugar de la identificación y extracción de características manual llevada a cabo principalmente por algoritmos ad-hoc convencionales basados en características de color, forma o textura.

La implantación de los modelos de inteligencia artificial basados en CNNs comienza a popularizarse en la década de los 2000, cuando se desarrolla el hardware necesario para la creación y entrenamiento de redes neuronales profundas. El gran auge se produce a partir del modelo AlexNet presentado en 2012 en la competición ImageNet. Desde entonces, las técnicas de Deep Learning aplicadas a imagen han evolucionado de manera vertiginosa con la aparición de nuevas arquitecturas basadas en CNNs cada vez más complejas, como VGG, ResNet o EfficientNet, y la aparición de otras más nuevas basadas en Transformers, ofreciendo nuevas posibilidades, que, entre otras cosas, han permitido la aparición de Large Vision Models (LVMs) como el comúnmente utilizado DINOv2.

A pesar de la diversidad de arquitecturas, todos estos modelos comparten un nexo común: la necesidad de su entrenamiento para las tareas específicas y una gestión adecuada de su ciclo de vida.

El ciclo de vida de los modelos de Deep Learning en imagen

Para el desarrollo de un proyecto de visión artificial basado en algoritmos de inteligencia artificial, se debe de tener en cuenta el ciclo de vida de los modelos. Este tiene como principales etapas las siguientes:

Definición del problema: Consiste en el entendimiento del problema, y establecimiento de objetivos, requisitos y métricas de éxito en base al problema a resolver.
Gestión de imágenes: Obtención de datos relevantes, su curado y revisión de calidad para lograr bases de datos representativas del problema que permitan un correcto entrenamiento del modelo.
Desarrollo del modelo: Selección de la arquitectura y configuración más adecuadas para el problema, implementación y entrenamiento del modelo utilizando la base de datos existente.
Evaluación: Testeo del modelo sobre un conjunto de datos desconocido, reportando su rendimiento y capacidad de generalización.
Despliegue: Integración del modelo en el entorno de producción.
Monitorización: Supervisión del rendimiento del modelo en producción detectando posibles degradaciones o cambios en los datos de producción.

Del terraplanismo de la IA al aprendizaje continuo

Una vez se realiza el despliegue, se dispone de un modelo en producción funcionando correctamente para las condiciones representadas en el dataset con el que fue entrenado. Pese a ello, esto no se debe quedar aquí, ya que existe la creencia errónea de que los modelos una vez entrenados pueden funcionar indefinidamente sin necesidad de actualizaciones. Esta visión ignora las características cambiantes de los entornos de producción, lo cual puede llevar a graves problemas debido a diferentes tipos de derivas.

Por ello, es importante no finalizar el ciclo con la puesta en producción de un modelo estático, sino que se debe de prestar especial atención durante el proceso de monitorización en búsqueda de posibles degradaciones de rendimiento, que han de ser solventadas mediante el concepto de aprendizaje continuo.

La aplicación del aprendizaje continuo para la gestión del ciclo de vida de un modelo de IA implica la monitorización activa del rendimiento del sistema, la identificación de nuevos patrones, el curado de nuevas imágenes relevantes y el reentrenamiento de una nueva versión del modelo con la información actualizada. De esta forma, se transforma el ciclo de vida del modelo en un proceso iterativo que permite generar nuevas versiones del modelo que lo ajustan a las nuevas condiciones de producción.

Ciclovida1 — **Esquema ciclo de vida modelos Deep Learning**

La importancia del experto: Human in the loop

En la actualidad, existen numerosas técnicas que ayudan en la automatización de determinadas tareas del aprendizaje continuo, pero en el proceso de implantación surgen dudas como ¿Quién lleva a cabo la monitorización de los modelos en producción? ¿Cómo se realiza el curado de los datos? ¿En qué momento se debe llevar a cabo un reentrenamiento para garantizar la eficiencia del modelo? ¿Cuándo se sustituye la versión del modelo en producción?

Pese a no existir una respuesta universal, existe una figura común en la mayoría de las respuestas: el humano. La presencia de expertos en el dominio sigue siendo crucial en varias etapas del ciclo de vida. Son responsables de la línea o máquina, quienes supervisan el rendimiento del modelo, detectando en base a su experiencia anomalías en las predicciones. Además, se encargan de la selección y curado de las imágenes más relevantes garantizando junto con tecnologías de evaluación y selección de datos, como core-set o detección de outliers, su calidad para ser utilizadas en el reentrenamiento del modelo. A su vez, el proceso de anotación de las imágenes puede ser realizado tanto por los propios expertos del dominio, como por algoritmos con supervisión del operario o un ingeniero responsable del sistema.

Por otro lado, la figura humana sigue siendo relevante para tomar la decisión de cuándo se debe reentrenar el sistema, ajustándolo a las condiciones actuales de producción sin caer en ineficiencias.

Todo ello resulta en que la presencia humana en la gestión de los modelos sea una parte activa, en la que apalancar una correcta estrategia de mantenimiento de los modelos en entornos de producción industriales.

Herramientas para la gestión del ciclo de vida de los modelos

Para llevar a cabo la gestión del ciclo de vida, se hacen necesarias una serie de herramientas software encargadas de realizar tareas específicas. Algunas de ellas son:

CleanLab y FiftyOne: Para exploración visual, gestión y curado de bases de datos (imágenes y anotaciones).
CVAT o LabelStudio: Herramienta de anotación de datos principalmente centrada en imagen y vídeo.
DVC (Data Version Control): Sistema para versionado de datasets y modelos.
ClearML: Plataforma para la gestión de experimentos, bases de datos y modelos.

Además, existen plataformas integrales, que permiten gestionar todo el ciclo de vida de modelos de imagen desde un único entorno. Gracias a sus interfaces, estas plataformas consiguen la abstracción del operario del complejo uso e integración de las herramientas anteriormente mencionadas, brindando autonomía tanto a las empresas, como a sus operarios y permitiendo una gestión eficiente de los proyectos de visión artificial y sus modelos de Deep Learning asociados. Algunos ejemplos son:

LandingLens (Landing AI) - Plataforma para gestión colaborativa de modelos de visión artificial.
VisualMLOps (Tecnalia e Ideable) - Gestión integral del ciclo de vida de los modelos e integración directa con sistemas de monitorización de la producción.

Fifityonev2 — **Ejemplo exploración base de datos - FiftyOne**

Debemos dejar atrás el terraplanismo de la IA

Pese a los exponenciales avances tecnológicos experimentados en el campo de la visión por computador, es imprescindible no dejar de lado una estrategia basada en los datos que permita la adaptación de los modelos a las condiciones cambiantes de los entornos reales. Por ello, resulta fundamental implementar aprendizaje continuo, situando a los expertos en el centro de la estrategia de gestión del ciclo de vida de los modelos de Deep Learning, lo que permite prolongar su vida útil al mantener la confianza en sus predicciones.

Pablo Galán Saiz

Investigador en IA y visión artificial en Tecnalia

----

Este artículo aparece publicado en el nº 565 de Automática e Instrumentación págs 88 a 90.

• Luis Payá Castelló (CEA): Visión por Computador y modelos de IA multimodales en sectores industriales

• Tecnalia redefine su visión estratégica para transformar la industria y afrontar los desafíos del futuro

Tecnología Tecnalia