Las empresas que buscan aprovechar todos los beneficios comerciales de la Inteligencia Artificial están recurriendo a Machine Learning Operations (MLOps), un conjunto emergente de mejores prácticas y herramientas destinadas a poner en funcionamiento la IA.
Cuando las empresas comienzan a implementar Inteligencia Artificial (IA) y a construir proyectos de aprendizaje automático, el enfoque tiende a estar en la teorÃa. ¿Existe algún modelo que pueda proporcionar los resultados necesarios? ¿Cómo se puede construir? ¿Cómo se puede entrenar?
Pero las herramientas que usan los cientÃficos de datos para crear estas pruebas de concepto a menudo no se traducen bien en los sistemas de producción. Como resultado, puede tomar más de nueve meses en promedio implementar una solución de IA o ML, según datos de IDC.
“A esto lo llamamos ‘velocidad del modelo’, cuánto tiempo lleva de principio a finâ€, explica el analista de IDC Sriram Subramanian.
Aquà es donde entra en juego MLOps (Machine Learning Operations), un conjunto de mejores prácticas, marcos y herramientas que ayudan a las empresas a administrar datos, modelos, implementación, monitoreo y otros aspectos de tomar un sistema de IA de prueba de concepto teórico. y ponerlo a trabajar.
“MLOps reduce la velocidad del modelo a semanas, a veces a dÃasâ€, afirma Subramanian. “Al igual que el tiempo promedio para crear una aplicación se acelera con DevOps, esta es la razón por la que necesita MLOpsâ€.
Al adoptar MLOps, las empresas pueden construir más modelos, innovar más rápido y abordar más casos de uso. “La propuesta de valor es claraâ€, agrega.
IDC predice que para 2024, el 60 % de las empresas habrán operacionalizado sus flujos de trabajo de ML mediante el uso de MLOps. Y cuando se encuestó a las empresas sobre los desafÃos de la adopción de IA y ML, la falta de MLOps fue un obstáculo importante para la adopción de IA y ML, solo superado por el costo, dice Subramanian.
Aquà examinamos qué es MLOP, cómo ha evolucionado y qué deben lograr y tener en cuenta las organizaciones para aprovechar al máximo esta metodologÃa emergente para hacer operativa la IA.
La evolución de MLOps
Cuando Eugenio Zuccarelli comenzó a crear proyectos de aprendizaje automático hace varios años, MLOps era solo un conjunto de mejores prácticas. Desde entonces, Zuccarelli ha trabajado en proyectos de IA en varias empresas, incluidas las de atención médica y servicios financieros, y ha visto cómo los MLOps evolucionan con el tiempo para incluir herramientas y plataformas.
Hoy en dÃa, MLOps ofrece un marco bastante sólido para hacer operativa la IA, dice Zuccarelli, quien ahora es cientÃfico de datos de innovación en CVS Health. A modo de ejemplo, Zuccarelli señala un proyecto en el que trabajó anteriormente para crear una aplicación que predijera resultados adversos, como la readmisión al hospital o la progresión de la enfermedad.
“Estábamos explorando conjuntos de datos y modelos y hablando con médicos para descubrir las caracterÃsticas de los mejores modelosâ€, señala. “Pero para que estos modelos fueran realmente útiles, necesitábamos ponerlos frente a los usuarios realesâ€.
Eso significaba crear una aplicación móvil que fuera confiable, rápida y estable, con un sistema de aprendizaje automático en el back-end conectado a través de una API. “Sin MLOps no hubiéramos podido asegurar esoâ€, dice.
Su equipo usó la plataforma H2O MLOps y otras herramientas para crear un tablero de salud para el modelo. “No quieres que el modelo cambie sustancialmenteâ€, señala. “Y no quieres introducir prejuicios. El panel de salud nos permite saber si el sistema ha cambiadoâ€.
El uso de una plataforma MLOps también permitió actualizaciones en los sistemas de producción. “Es muy difÃcil intercambiar un archivo sin que la aplicación deje de funcionarâ€, advierte Zuccarelli. “Las herramientas de MLOps pueden intercambiar un sistema aunque esté en producción con una interrupción mÃnima del sistema en sÃâ€.
A medida que maduran las plataformas MLOps, aceleran todo el proceso de desarrollo del modelo porque las empresas no tienen que reinventar la rueda con cada proyecto, dice. Y la funcionalidad de gestión de canalización de datos también es fundamental para hacer operativa la IA.
“Si tenemos múltiples fuentes de datos que necesitan comunicarse entre sÃ, ahà es donde pueden entrar los MLOpsâ€, agrega. “Desea que todos los datos que fluyen hacia los modelos ML sean consistentes y de alta calidad. Como dicen, basura adentro, basura afuera. Si el modelo tiene información deficiente, entonces la predicción en sà misma será deficienteâ€.
Fundamentos de MLOps: un objetivo en movimiento
Pero no crea que sólo porque las plataformas y las herramientas están disponibles puede ignorar los principios básicos de MLOps. Las empresas que recién comienzan a pasar a esta disciplina deben tener en cuenta que, en esencia, MLOps se trata de crear conexiones sólidas entre la ciencia de datos y la ingenierÃa de datos.
“Para garantizar el éxito de un proyecto MLOps, necesita ingenieros de datos y cientÃficos de datos en el mismo equipoâ€, dice Zuccarelli.
Además, las herramientas necesarias para protegerse contra el sesgo, garantizar la transparencia, brindar explicabilidad y respaldar las plataformas de ética, aún se están construyendo, dice. “Definitivamente todavÃa necesita mucho trabajo porque es un campo muy nuevo”.
Por lo tanto, sin una solución llave en mano completa para adoptar, las empresas deben estar versadas en todas las facetas que hacen que MLOps sea tan efectivo para poner en funcionamiento la IA. Y esto significa desarrollar experiencia en una amplia gama de actividades, dice Meagan Gentry, gerente de práctica nacional para el equipo de IA en Insight, una empresa de consultorÃa tecnológica con sede en Tempe.
MLOps cubre toda la gama, desde la recopilación, la verificación y el análisis de datos, hasta la gestión de los recursos de la máquina y el seguimiento del rendimiento del modelo. Y las herramientas disponibles para ayudar a las empresas se pueden implementar en las instalaciones, en la nube o en el perÃmetro. Pueden ser de código abierto o propietarios.
Pero dominar los aspectos técnicos es sólo una parte de la ecuación. MLOps también toma prestada una metodologÃa ágil de DevOps y el principio de desarrollo iterativo, dice Gentry. Además, como ocurre con cualquier disciplina relacionada con la metodologÃa ágil, la comunicación es crucial.
“La comunicación en todos los roles es fundamentalâ€, dice ella. “Comunicación entre el cientÃfico de datos y el ingeniero de datos. Comunicación con DevOps y con el equipo de TI más grandeâ€.
Para las empresas que recién comienzan, MLOps puede ser confuso. Hay principios generales, docenas de proveedores e incluso más conjuntos de herramientas de código abierto.
“Aquà es donde entran las trampasâ€, dice Helen Ristov, gerente sénior de arquitectura empresarial de Capgemini Americas. “Mucho de esto está en desarrollo. No hay un conjunto formal de pautas como las que verÃa con DevOps. Es una tecnologÃa incipiente y se necesita tiempo para que las pautas y las polÃticas se pongan al dÃaâ€.
Ristov recomienda que las empresas comiencen sus viajes de MLOps con sus plataformas de datos. “Tal vez tengan conjuntos de datos pero viven en diferentes lugares, pero no tienen un entorno cohesivoâ€, afirma.
Las empresas no necesitan mover todos los datos a una sola plataforma, pero sà es necesario que haya una manera de traer datos de fuentes de datos dispares, dice, y esto puede variar según la aplicación. Los lagos de datos funcionan bien para las empresas que realizan muchos análisis a altas frecuencias y buscan almacenamiento de bajo costo, por ejemplo.
Las plataformas MLOps generalmente vienen con herramientas para construir y administrar canalizaciones de datos y realizar un seguimiento de las diferentes versiones de los datos de entrenamiento, pero no se trata de presionar y listo, señala.
Luego está la creación de modelos, el control de versiones, el registro, la ponderación de los conjuntos de caracterÃsticas y otros aspectos de la gestión de los propios modelos.
“Hay una cantidad sustancial de codificación involucrada en estoâ€, dice Ristov, y agrega que configurar una plataforma MLOps puede llevar meses y que los proveedores de plataformas aún tienen mucho trabajo por hacer en lo que respecta a la integración.
“Hay mucho desarrollo que va en diferentes direccionesâ€, añade. “Se están desarrollando muchas herramientas, y el ecosistema es muy grande y las personas simplemente eligen lo que necesitan. MLOps está en una etapa adolescente. La mayorÃa de las organizaciones aún están buscando configuraciones óptimasâ€.
Dar sentido al panorama de MLOps
Se espera que el mercado de MLOps crezca a alrededor de 700 millones de dólares para 2025, frente a los 185 millones de dólare en 2020, afirma Subramanian de IDC. Pero ese es probablemente un recuento insuficiente, dice, porque los productos MLOps a menudo se agrupan con plataformas más grandes. El verdadero tamaño del mercado, dice, podrÃa ser de más de 2 mil millones de dólares para 2025.
Los proveedores de MLOps tienden a clasificarse en tres categorÃas, comenzando con los grandes proveedores de la nube, incluidos AWS, Azure y la nube de Google, que brindan capacidades de MLOps como servicio, dice Subramanian.
Luego están los proveedores de plataformas ML como DataRobot, Dataiku e Iguazio.
“La tercera categorÃa es lo que solÃan llamar proveedores de gestión de datosâ€, dice. “Los gustos de Cloudera, SAS y DataBricks. Su punto fuerte eran las capacidades de gestión de datos y las operaciones de datos, y se expandieron a capacidades de ML y, finalmente, a capacidades de MLOpsâ€.
Las tres áreas están explotando, dice Subramanian, y agrega que lo que hace que un proveedor de MLOps se destaque es si puede admitir modelos de implementación locales y en la nube, si puede implementar una IA confiable y responsable, si es plug-and-play. y con qué facilidad pueden escalar. “Ahà es donde entra la diferenciaciónâ€.
Según una encuesta reciente de IDC, la falta de métodos para implementar IA responsable fue uno de los tres obstáculos principales para la adopción de IA y ML, empatado en segundo lugar con la falta de MLOps en sÃ.
Esto se debe en gran parte a que no hay alternativas para adoptar MLOps, resalta Sumit Agarwal, analista de investigación de inteligencia artificial y aprendizaje automático de Gartner.
“Los otros enfoques son manualesâ€, dice. “Entonces, realmente, no hay otra opción. Si desea escalar, necesita automatización. Necesita trazabilidad de su código, datos y modelosâ€.
Según una encuesta reciente de Gartner, el tiempo promedio que lleva llevar un modelo desde la prueba de concepto hasta la producción se redujo de nueve a 7.3 meses. “Pero 7.3 meses sigue siendo altoâ€, afirma Agarwal. “Hay muchas oportunidades para que las organizaciones aprovechen MLOpsâ€.
Hacer el cambio cultural a MLOps
MLOps también requiere un cambio cultural por parte del equipo de inteligencia artificial de una empresa, argumenta Amaresh Tripathy, lÃder global de análisis en Genpact.
“La imagen popular de un cientÃfico de datos es la de un cientÃfico loco que intenta encontrar una aguja en un pajarâ€, ​​dice. “El cientÃfico de datos es un descubridor y un explorador, no una fábrica que produce widgets. Pero eso es lo que necesitas hacer para escalarlo realmenteâ€.
Y las empresas a menudo subestiman la cantidad de esfuerzo que requerirá.
“La gente aprecia mejor la ingenierÃa de softwareâ€, señala. “Hay mucha disciplina sobre la experiencia del usuario, los requisitos. Pero de alguna manera la gente no piensa que si implemento un modelo tengo que pasar por el mismo proceso. Luego está el error de suponer que todos los cientÃficos de datos que son buenos en un entorno de prueba irán naturalmente y podrán implementarlo, o pueden incluir a un par de colegas de TI y poder hacerlo. Hay una falta de aprecio por lo que se necesitaâ€.
Las empresas tampoco entienden que los MLOps pueden causar efectos dominó en otras partes de la empresa, lo que a menudo conduce a cambios drásticos.
“Puede poner MLOps en un centro de llamadas y el tiempo de respuesta promedio en realidad aumentará porque la máquina, la IA, se encarga de las cosas fáciles, y las cosas que llegan al ser humano en realidad toman más tiempo porque son más complejas. Entonces, debe repensar cuál será el trabajo, qué personas necesita y cuáles deberÃan ser los conjuntos de habilidadesâ€.
Hoy, dice, menos del 5% de las decisiones en una organización están impulsadas por algoritmos, pero eso está cambiando rápidamente. “Anticipamos que del 20 al 25 % de las decisiones serán impulsadas por algoritmos en los próximos cinco años. Cada estadÃstica que miramos, estamos en un punto de inflexión de rápida ampliación para la IA”.
Y MLOps es la pieza fundamental.
“Cien por cientoâ€, asevera. “Sin eso, no podrá hacer IA de manera consistente. MLOps es el catalizador de escalamiento de la IA en la empresaâ€.
Maria Korolov, CIO.com
