Es evidente que un mejor uso de los datos ofrece enormes beneficios potenciales para las empresas. De hecho, su gestión estratégica es fundamental para muchos proyectos de transformación digital. Sin embargo, la realidad es que convertir la analÃtica de los datos en valor empresarial de forma efectiva es complicado.
En este sentido, el reto se centra en el hecho de que el proceso de desarrollo de técnicas de analÃtica avanzada es distinto al de los ciclos de vida de desarrollo estándar.
El proceso consta de dos partes: en la primera se entrena un modelo algorÃtmico que englobe la lógica empresarial de forma que cree valor, mientras que, en la segunda, el modelo se escala y adapta para que pueda utilizarse en el mundo real, asegurando que cuenta con todos los controles (check and balances o mecanismos correctores) para que funcione según lo previsto.
Cada una de estas dos partes las llevan a cabo diferentes especialistas. La primera es, en gran medida, responsabilidad del data scientist, mientras que de la segunda se encargan ingenieros y desarrolladores. Por tanto, para desplegar correctamente los modelos de analÃtica avanzada, es necesario aunar las disciplinas de ingenierÃa y ciencia de los datos.
Parte 1 de la analÃtica avanzada: formación del modelo
La analÃtica avanzada utiliza técnicas basadas en algoritmos que suelen sustentarse en el aprendizaje automático (machine learning). Para sacar el máximo partido a estas técnicas se necesitan conocimientos estadÃsticos especializados, algo que, a menudo, es competencia del data scientist. De hecho, el data scientist es también el responsable del pensamiento matemático encargado de crear algoritmos que aporten valor al negocio.
La metodologÃa más común que se utiliza para crear modelos es la CRISP-DM (Cross-Industry Standard Process for Data Mining). Este sistema desglosa el proceso en un ciclo de vida que consta de seis pasos, donde los cinco primeros forman parte de la etapa de formación, y el último a la de explotación.
Estas etapas son:
Análisis del negocio: se establecen los resultados del proyecto deseados y se fijan las metas y objetivos que se quieren alcanzar.
Análisis de los datos: se recopilan, comprenden y organizan los datos disponibles.
Preparación de los datos: se clasifican los datos para utilizarlos en el modelo, de forma que se comprueba su calidad y se excluyen aquellos que no sirven.
Modelado: se selecciona la técnica de modelado adecuada y se crea un diseño de prueba antes de construir el modelo propiamente dicho. A continuación se evalúa la calidad de los resultados del modelo.
Evaluación: el modelo se evalúa en función de los objetivos empresariales establecidos en el primer paso. Si no funciona según lo previsto, se repiten las etapas anteriores; en caso contrario, se pasa a la etapa 6.
Despliegue: por último, se elabora una estrategia de despliegue. Se realizan tareas de supervisión y mantenimiento de forma continua para garantizar el correcto funcionamiento del modelo.
El ciclo de vida de explotación, que comienza en el paso 6, es una parte esencial de la implantación del modelo. La supervisión continua ayuda a identificar el deterioro de los modelos, indicando cuándo es necesario volver a la fase de entrenamiento para que siga teniendo un buen rendimiento.
Parte 2 de la analÃtica avanzada: metodologÃa de desarrollo
La metodologÃa de desarrollo completa la primera parte. Para crear un modelo, es necesario recopilar y clasificar los datos para preparar el entrenamiento del algoritmo. Una vez se ha creado el modelo, hay que probarlo y desplegarlo en un entorno de producción.
Los datos sobre los que se entrena el modelo suelen dividirse en tres. En primer lugar, está el conjunto de datos de entrenamiento del modelo, que representa alrededor del 70-80% de los datos. En segundo lugar se encuentra un conjunto de datos de validación, que representa alrededor del 10-15% del total. Y, por último, el conjunto de datos de prueba, que representa otro 10-15 % de los datos.
Una vez se ha demostrado que el modelo es preciso y muestra las caracterÃsticas deseadas, el equipo de ingenierÃa pasa a la etapa de implantación. Es en este momento cuando se utilizan las técnicas estándar de gestión del cambio para validar y probar el modelo antes de su despliegue.
Cómo implantar técnicas de analÃtica avanzada para generar valor
Hay cuatro pilares clave que garantizan el correcto desarrollo, implantación y adopción de la tecnologÃa de analÃtica avanzada:
- Gobierno del dato
Este sistema ayuda a orquestar y controlar el ecosistema en torno a los datos, puesto que establece quién tiene la responsabilidad y la custodia de los mismos dentro de una empresa.
También se regula la calidad y el contenido de los datos. La calidad de los modelos es equivalente a la de los datos en los que se basan, por lo que resulta vital que estos controles sean exhaustivos.
- Arquitectura
El uso de analÃtica avanzada requiere una arquitectura adecuada. Resulta imprescindible disponer de marcos y estructuras para apoyar el procesamiento de datos y la IA. Es crucial que estas estructuras soporten el escalado de la tecnologÃa
- MetodologÃa
Para adoptar técnicas de analÃtica avanzada y ampliar su uso dentro de una organización, es preciso estandarizar los procesos. Asimismo, es necesario contar con los controles de calidad adecuados para garantizar que las soluciones de analÃtica avanzada funcionan correctamente.
- Toma de decisiones
La analÃtica avanzada proporciona a las empresas la capacidad de tomar decisiones basadas en datos. Las organizaciones necesitan contar con los procesos y la experiencia necesarios para garantizar que la información que proporciona esta tecnologÃa avanzada se aprovecha al máximo.
Conclusión
Los procesos necesarios para el despliegue de la tecnologÃa que utiliza IA y aprendizaje automático (ML) son más complejos que los requeridos para otras tecnologÃas. Como consecuencia, para implementar soluciones de analÃtica avanzada de forma eficaz deben confluir varias disciplinas y combinarse varios procesos.
Asegurarse de contar con los cuatro pilares clave (gobernanza de datos, arquitectura, metodologÃa y toma de decisiones) proporcionará una base sólida sobre la que implementar la tecnologÃa de analÃtica avanzada.
________________

El autor de este artÃculo, Germán RodrÃguez, es Head of Data Driven Banking en everis.
