Aumentar el ROI de su negocio requiere una comprensión estratégica de dónde y cómo las organizaciones ganan con los datos.
La innovación está impulsada por la facilidad y la agilidad de trabajar con datos. Aumentar el retorno de la inversión (ROI) para el negocio requiere una comprensión estratégica del mismo, y la capacidad de identificar claramente, dónde y cómo las organizaciones ganan con los datos.
Es la única forma de impulsar una estrategia para ejecutar a un alto nivel, con velocidad y escala, y difundir ese éxito a otras partes de la organización. Aquí, resaltaré el dónde y el por qué de estos importantes “puntos de integración de datos” que son determinantes clave del éxito en la estrategia de análisis y datos de una organización.
Un mar de complejidad
Durante años, los ecosistemas de datos se han vuelto más complejos debido a decisiones de plataforma de datos discretas (y no necesariamente estratégicas) destinadas a abordar nuevos proyectos, casos de uso o iniciativas. La tecnología de capas en la arquitectura de datos general introduce más complejidad.
Hoy en día, los desafíos de la arquitectura de datos y la complejidad de la integración afectan la velocidad de la innovación, la calidad de los datos, la seguridad de los datos, el gobierno de los datos y casi todo lo importante relacionado con la generación de valor a partir de los datos. Para la mayoría de las organizaciones, si no se aborda esta complejidad, los resultados comerciales se diluirán.
El aumento de los volúmenes y la velocidad de los datos puede reducir la velocidad con la que los equipos realizan adiciones o cambios en las estructuras de datos analíticos en los puntos de integración de datos, donde los datos se correlacionan desde múltiples fuentes diferentes en activos comerciales de alto valor. Para casos de uso de toma de decisiones en tiempo real, estos pueden estar en un caché de memoria o base de datos. Para almacenes de datos, puede ser una tabla analítica de columna ancha.
Muchas empresas llegan a un punto en el que la tasa de complejidad supera la capacidad de los ingenieros y arquitectos de datos para respaldar la velocidad de gestión de cambios de datos necesaria para el negocio.
Los analistas de negocios y los científicos de datos confían menos en los datos a medida que aumenta la desviación de datos, procesos y modelos entre los diferentes equipos de tecnología en los puntos de integración.
La deuda técnica sigue aumentando y todo lo relacionado con trabajar con datos se vuelve más difícil. La nube no resuelve necesariamente esta complejidad: es un problema de datos, no un problema local frente a la nube.
Reducir la complejidad es particularmente importante para crear nuevas experiencias de cliente; obtener vistas de 360 grados de los clientes; y la toma de decisiones para aplicaciones móviles, Internet de las Cosas (IoT) y realidad aumentada aceleran el movimiento de datos en tiempo real hacia el centro de la gestión de datos y la estrategia de la nube, y tienen un impacto en los resultados finales. Una nueva investigación ha encontrado que el 71% de las organizaciones vinculan el crecimiento de los ingresos con datos en tiempo real (datos continuos en movimiento, como datos de flujos de clics y dispositivos IoT inteligentes o redes sociales).
Olas de cambio
Hay oleadas de cambios que recorren las arquitecturas de datos para ayudar a aprovechar y aprovechar los datos para obtener resultados reales. Más del 80% de los datos nuevos no están estructurados, lo que ha ayudado a llevar las bases de datos NoSQL al frente de la estrategia de bases de datos.
La creciente popularidad del concepto de malla de datos destaca el hecho de que las líneas de negocio deben estar más empoderadas con los datos. Las estructuras de datos están cobrando impulso para mejorar el análisis en diferentes plataformas analíticas. Todo este cambio requiere liderazgo tecnológico para reenfocar la visión y la estrategia. El lugar para comenzar es mirar los datos en tiempo real, ya que se están convirtiendo en la canalización de datos central para un ecosistema de datos empresariales.
Hay un nuevo concepto que brinda unidad y sinergia a las aplicaciones, las tecnologías de transmisión, las bases de datos y las capacidades de la nube en una arquitectura nativa de la nube; a esto lo llamamos la “nube de datos en tiempo real”. Es la arquitectura fundamental y la capacidad de integración de datos para productos de datos de alto valor.
La estrategia de datos y la nube deben alinearse. Los productos de datos de alto valor pueden tener KPI y métricas a nivel de directorio asociados con ellos. La velocidad de gestión del cambio de estructuras de datos en tiempo real para análisis determinará los líderes de la industria, ya que estas capacidades definirán la experiencia del cliente.
Tomar las decisiones correctas sobre la plataforma de datos
Un primer paso importante para tomar las decisiones tecnológicas correctas para una nube de datos en tiempo real es comprender las capacidades y características requeridas de las plataformas de datos para ejecutar el modelo operativo comercial y la hoja de ruta de una organización.
Ofrecer valor comercial debe ser la base de una plataforma de nube de datos en tiempo real; la capacidad de demostrar a los líderes empresariales exactamente cómo un ecosistema de datos impulsará el valor comercial es fundamental. También debe entregar datos, de cualquier tipo, a escala, de manera que los equipos de desarrollo puedan aprovecharlos fácilmente para crear nuevas aplicaciones.
El artículo What Stands Between IT and Business Success destaca la importancia de alejarse de una perspectiva aislada y centrarse en optimizar cómo fluyen los datos a través de un ecosistema de datos. Veamos esto desde una perspectiva analítica.
Los datos deben fluir a través de un ecosistema con la mayor libertad posible, desde las fuentes de datos hasta las plataformas de ingesta, las bases de datos y las plataformas analíticas. Los datos o derivados de los datos también pueden regresar al ecosistema de datos. Los consumidores de datos (equipos de análisis y desarrolladores, por ejemplo) luego generan información y valor comercial a partir del análisis, el aprendizaje automático y la IA. Un ecosistema de datos necesita optimizar los flujos de datos, reducir la complejidad y facilitar que los equipos comerciales y de desarrollo trabajen con los datos en el ecosistema.
IDC Market Research destaca que las empresas pueden perder hasta un 30 % en ingresos anualmente debido a las ineficiencias resultantes de datos incorrectos o aislados. Los analistas de negocios y los científicos de datos frustrados se enfrentan a estas ineficiencias todos los días. Tomar meses para incorporar nuevos analistas comerciales, la dificultad para comprender y confiar en los datos, y los retrasos en las solicitudes comerciales para cambios en los datos son costos ocultos; pueden ser difíciles de entender, medir y (lo que es más importante) corregir. La investigación de Crux muestra que las empresas subestiman los costos de canalización de datos hasta en un 70 %.
Los datos en movimiento se incorporan a las colas de mensajes, la publicación de mensajes de suscripción (pub/sub) y las plataformas de transmisión de eventos . Los puntos de integración de datos ocurren con datos en movimiento en la memoria/cachés de datos y tableros que impactan las decisiones en tiempo real y las experiencias del cliente. Los puntos de integración de datos también aparecen en las bases de datos. La calidad de la integración de los datos en movimiento y las bases de datos afecta la calidad de la integración de datos en las plataformas analíticas. La complejidad en los puntos de integración de datos afecta la calidad y la velocidad de la innovación para el análisis, el aprendizaje automático y la inteligencia artificial en todas las líneas de negocio.
Estandarizar para optimizar
Para reducir la complejidad en los puntos de integración de datos y mejorar la capacidad de tomar decisiones en tiempo real, se debe reducir la cantidad de tecnologías que convergen en estos puntos.
Esto se logra trabajando con una plataforma de ingestión de datos multipropósito que puede admitir la cola de mensajes, la publicación/suscripción y la transmisión de eventos. Trabajar con una base de datos multimodelo que puede admitir una amplia gama de casos de uso reduce la integración de datos de una amplia gama de bases de datos de un solo propósito.
Kubernetes también se está convirtiendo en el estándar para administrar aplicaciones nativas de la nube. Trabajar con bases de datos y plataformas de ingesta de datos nativas de la nube permite a Kubernetes alinear aplicaciones, canalizaciones de datos y bases de datos.
Como se señala en el libro Arquitectura empresarial como estrategia: creación de una estrategia para la ejecución empresarial , “Estandarizar, optimizar, crear un efecto compuesto en toda la empresa”. En otras palabras, la optimización de un ecosistema de datos reduce la complejidad y aumenta la velocidad de la innovación con datos.
Donde las organizaciones ganan con los datos
La complejidad generada por plataformas de tecnología de datos dispares aumenta la deuda técnica, lo que hace que los consumidores de datos dependan más de equipos centralizados y expertos especializados. La innovación con datos ocurre en los puntos de integración de datos. Ha habido demasiado enfoque en la selección de plataformas de datos en función de las especificaciones tecnológicas y la mecánica para la ingesta de datos y las bases de datos, en lugar de estandarizar las tecnologías que ayudan a impulsar los conocimientos comerciales.
Las plataformas de datos y las arquitecturas de datos deben diseñarse desde el principio con un fuerte enfoque en la creación de activos de datos analíticos de alto valor y la generación de ingresos, así como en la capacidad de estos activos de datos para evolucionar a medida que cambian los requisitos comerciales. Las tecnologías de datos deben reducir la complejidad para acelerar los conocimientos empresariales.
Las organizaciones deben centrarse en los puntos de integración de datos porque ahí es donde ganan con los datos. Una plataforma de nube de datos en tiempo real exitosa necesita optimizar y estandarizar los flujos de datos y sus integraciones en todo el ecosistema de datos.
George Trujillo, estratega principal de datos en DataStax.