Es evidente que un mejor uso de los datos ofrece enormes beneficios potenciales para las empresas. De hecho, su gestión estratégica es fundamental para muchos proyectos de transformación digital. Sin embargo, la realidad es que convertir la analítica de los datos en valor empresarial de forma efectiva es complicado.
En este sentido, el reto se centra en el hecho de que el proceso de desarrollo de técnicas de analítica avanzada es distinto al de los ciclos de vida de desarrollo estándar.
El proceso consta de dos partes: en la primera se entrena un modelo algorítmico que englobe la lógica empresarial de forma que cree valor, mientras que, en la segunda, el modelo se escala y adapta para que pueda utilizarse en el mundo real, asegurando que cuenta con todos los controles (check and balances o mecanismos correctores) para que funcione según lo previsto.
Cada una de estas dos partes las llevan a cabo diferentes especialistas. La primera es, en gran medida, responsabilidad del data scientist, mientras que de la segunda se encargan ingenieros y desarrolladores. Por tanto, para desplegar correctamente los modelos de analítica avanzada, es necesario aunar las disciplinas de ingeniería y ciencia de los datos.
Parte 1 de la analítica avanzada: formación del modelo
La analítica avanzada utiliza técnicas basadas en algoritmos que suelen sustentarse en el aprendizaje automático (machine learning). Para sacar el máximo partido a estas técnicas se necesitan conocimientos estadísticos especializados, algo que, a menudo, es competencia del data scientist. De hecho, el data scientist es también el responsable del pensamiento matemático encargado de crear algoritmos que aporten valor al negocio.
La metodología más común que se utiliza para crear modelos es la CRISP-DM (Cross-Industry Standard Process for Data Mining). Este sistema desglosa el proceso en un ciclo de vida que consta de seis pasos, donde los cinco primeros forman parte de la etapa de formación, y el último a la de explotación.
Estas etapas son:
Análisis del negocio: se establecen los resultados del proyecto deseados y se fijan las metas y objetivos que se quieren alcanzar.
Análisis de los datos: se recopilan, comprenden y organizan los datos disponibles.
Preparación de los datos: se clasifican los datos para utilizarlos en el modelo, de forma que se comprueba su calidad y se excluyen aquellos que no sirven.
Modelado: se selecciona la técnica de modelado adecuada y se crea un diseño de prueba antes de construir el modelo propiamente dicho. A continuación se evalúa la calidad de los resultados del modelo.
Evaluación: el modelo se evalúa en función de los objetivos empresariales establecidos en el primer paso. Si no funciona según lo previsto, se repiten las etapas anteriores; en caso contrario, se pasa a la etapa 6.
Despliegue: por último, se elabora una estrategia de despliegue. Se realizan tareas de supervisión y mantenimiento de forma continua para garantizar el correcto funcionamiento del modelo.
El ciclo de vida de explotación, que comienza en el paso 6, es una parte esencial de la implantación del modelo. La supervisión continua ayuda a identificar el deterioro de los modelos, indicando cuándo es necesario volver a la fase de entrenamiento para que siga teniendo un buen rendimiento.
Parte 2 de la analítica avanzada: metodología de desarrollo
La metodología de desarrollo completa la primera parte. Para crear un modelo, es necesario recopilar y clasificar los datos para preparar el entrenamiento del algoritmo. Una vez se ha creado el modelo, hay que probarlo y desplegarlo en un entorno de producción.
Los datos sobre los que se entrena el modelo suelen dividirse en tres. En primer lugar, está el conjunto de datos de entrenamiento del modelo, que representa alrededor del 70-80% de los datos. En segundo lugar se encuentra un conjunto de datos de validación, que representa alrededor del 10-15% del total. Y, por último, el conjunto de datos de prueba, que representa otro 10-15 % de los datos.
Una vez se ha demostrado que el modelo es preciso y muestra las características deseadas, el equipo de ingeniería pasa a la etapa de implantación. Es en este momento cuando se utilizan las técnicas estándar de gestión del cambio para validar y probar el modelo antes de su despliegue.
Cómo implantar técnicas de analítica avanzada para generar valor
Hay cuatro pilares clave que garantizan el correcto desarrollo, implantación y adopción de la tecnología de analítica avanzada:
- Gobierno del dato
Este sistema ayuda a orquestar y controlar el ecosistema en torno a los datos, puesto que establece quién tiene la responsabilidad y la custodia de los mismos dentro de una empresa.
También se regula la calidad y el contenido de los datos. La calidad de los modelos es equivalente a la de los datos en los que se basan, por lo que resulta vital que estos controles sean exhaustivos.
- Arquitectura
El uso de analítica avanzada requiere una arquitectura adecuada. Resulta imprescindible disponer de marcos y estructuras para apoyar el procesamiento de datos y la IA. Es crucial que estas estructuras soporten el escalado de la tecnología
- Metodología
Para adoptar técnicas de analítica avanzada y ampliar su uso dentro de una organización, es preciso estandarizar los procesos. Asimismo, es necesario contar con los controles de calidad adecuados para garantizar que las soluciones de analítica avanzada funcionan correctamente.
- Toma de decisiones
La analítica avanzada proporciona a las empresas la capacidad de tomar decisiones basadas en datos. Las organizaciones necesitan contar con los procesos y la experiencia necesarios para garantizar que la información que proporciona esta tecnología avanzada se aprovecha al máximo.
Conclusión
Los procesos necesarios para el despliegue de la tecnología que utiliza IA y aprendizaje automático (ML) son más complejos que los requeridos para otras tecnologías. Como consecuencia, para implementar soluciones de analítica avanzada de forma eficaz deben confluir varias disciplinas y combinarse varios procesos.
Asegurarse de contar con los cuatro pilares clave (gobernanza de datos, arquitectura, metodología y toma de decisiones) proporcionará una base sólida sobre la que implementar la tecnología de analítica avanzada.
________________
El autor de este artículo, Germán Rodríguez, es Head of Data Driven Banking en everis.