Para continuar siendo competitivas las organizaciones deben contar con una estrategia de administración de datos para procesar, almacenar, organizar y analizar datos de forma eficaz y, al mismo tiempo, garantizar que sean precisos y accesibles, así lo ha destacado Denodo.
No ostante, la creación de una estrategia de administración de datos preparada para el futuro es compleja, dadas las tecnologías emergentes como la nube y el big data, así como la necesidad de datos en tiempo real.
Actualmente, las organizaciones se ven afectadas por las nuevas regulaciones sobre protección de datos y privacidad, y el uso de información de identificación personal (PII). Más usuarios comerciales y reguladores requieren que toda la “fábrica” que entrega datos se vuelva más transparente, y esto implica catálogos de datos y metadatos más actualizados, lo que lleva a desafíos críticos que deben superar para crear una estrategia de administración de datos eficiente.
Aquí los más representativos desde la óptica de Denodo:
Acceso a datos en tiempo real
Para adaptarse rápidamente a los cambios del mercado y respaldar casos de uso de análisis en tiempo real, como monitorear el comportamiento del consumidor, optimizar anuncios y ofrecer recomendaciones de productos atractivos a los consumidores, las organizaciones necesitan acceso a datos en tiempo real. Sin embargo, la arquitectura de datos en la mayoría de las organizaciones no está diseñada para soportar esto. El enfoque más común de inteligencia empresarial (BI) y análisis, implica replicar datos de sistemas de origen en soluciones de almacenamiento como almacenes de datos y lagos de datos, utilizando múltiples procesos de extracción, transformación y carga (ETL). Si bien, este enfoque es adecuado para los informes comerciales regulares, no admite casos de uso de análisis en tiempo real.
Capacidad de aprovechar los macrodatos
Para llevar a cabo análisis avanzados, las organizaciones deben almacenar y analizar una variedad cada vez mayor de fuentes de big data. Esto incluye textos (como contratos y mensajes de redes sociales), mensajes de voz (como conversaciones entre controladores aéreos y pilotos), imágenes (como fotos de daños por accidentes) y videos (como los tomados de cámaras de seguridad en aeropuertos y tiendas minoristas).
Interoperabilidad de la plataforma en la nube
La tecnología de cómputo en la nube está creciendo más rápido que nunca, y las plataformas de integración de datos están optimizando la conectividad y cruzando los límites de las plataformas, haciendo de la arquitectura híbrida y de múltiples nubes el estándar de facto. La nueva estrategia de arquitectura de datos debe respaldar la interoperabilidad de la plataforma en la nube. Esto también permitiría realizar informes y análisis para casos comerciales que requieren que los datos se extraigan de múltiples plataformas en la nube.
Ciencia de datos
La ciencia de datos permite a las organizaciones encontrar patrones ocultos en los datos a través de modelos analíticos. Estos modelos analíticos se crean utilizando técnicas como estadísticas, aprendizaje profundo, aprendizaje automático (ML) e inteligencia artificial (IA). Sin embargo, varios estudios han demostrado que los científicos de datos a menudo dedican el 80% del tiempo a tareas de preparación de datos, como la limpieza y la exploración de datos, y solo el 20% de su tiempo a la creación de modelos predictivos. Por lo tanto, un plan de arquitectura de datos moderno debe contener herramientas que permitan a los científicos de datos concentrarse en sus habilidades básicas.
Estrategia ideal de administración de datos
El panorama de la tecnología analítica ha cambiado con el tiempo. Las empresas actuales no se limitan a realizar informes operativos simples. Es la era del uso de análisis avanzados para resolver desafíos comerciales complicados. Desde el punto de vista de la tecnología, las empresas necesitan una arquitectura de datos flexible que proporcione una vista lógicamente consolidada de todos los datos empresariales. Dicha arquitectura puede proporcionar datos a las aplicaciones de consumo, a los usuarios comerciales y a los equipos de análisis avanzados cuando lo deseen, sin tener que preocuparse por dónde se almacenan los datos y en qué formato.
“La virtualización de datos ofrece una vista simplificada e integrada de datos comerciales confiables en tiempo real, según lo requiera cualquier aplicación, usuario comercial o equipo de ciencia de datos que los consuma. La virtualización de datos integra datos de fuentes, ubicaciones y formatos dispares, sin tener que replicar datos en un repositorio central, para crear una capa de acceso a datos única y unificada que entrega datos a múltiples aplicaciones de consumo. El resultado es el acceso en tiempo real, a los datos de la empresa por un costo total más bajo”, señaló Sushant Kumar, Product Marketing Manager en Denodo.