Los datos alternativos ofrecen a las empresas la oportunidad de obtener una ventaja competitiva, pero los costos de integrarlos en los flujos de trabajo comerciales pueden ser mayores de lo que piensa.
Las fuentes de datos alternativas ahora están integradas en los procesos comerciales de las empresas en una variedad de sectores. Según una encuesta de 2022 realizada por el bufete de abogados Lowenstein Sandler, el 92% de las organizaciones de inversión, desde fondos de cobertura y capital privado hasta capital de riesgo, utilizan datos alternativos en una medida moderada o significativa para informar la toma de decisiones. Los encuestados también esperan que su uso de datos alternativos aumente hasta 2022.
Por lo general, estos datos provienen del agotamiento de otros procesos comerciales, como la actividad de las redes sociales, las imágenes satelitales, los datos de seguimiento de ubicación, las transacciones con tarjetas de crédito y el web scraping.
Si bien los datos alternativos se pueden usar en toda una organización, desde marketing y ventas hasta funciones de finanzas y estrategia, los departamentos de TI suelen ser responsables de la administración y propiedad de los datos de terceros.
En 2019, Forrester Research descubrió que el 56% de las adquisiciones de datos alternativos eran administradas por CIO y CDO que trabajaban dentro de TI.
La obtención, el almacenamiento y la gestión de datos alternativos crean nuevos desafíos para los administradores de TI y pueden generar costos significativos e innecesarios. Aquí hay 5 de esos desafíos y cómo mitigar su impacto.
Costos de selección de proveedores
Según la encuesta de Lowenstein, los costos de selección de proveedores son la preocupación más importante que tienen los usuarios de datos alternativos, y el 61% dice que es una preocupación importante para ellos. Los costos se incurren a través del proceso lento de examinar a los proveedores de datos alternativos y luego garantizar que los datos que brindan sean de calidad suficiente.
Esto es particularmente importante cuando los datos serán un elemento central de cualquier proceso comercial y no son fácilmente reemplazables. En estas situaciones, es fundamental que los compradores confíen en que el proveedor seguirá ofreciendo estos datos en el futuro previsible.
Una forma de mitigar estos riesgos es buscar consorcios de la industria para identificar fuentes de datos confiables. Es probable que otras empresas que operen en el mismo sector tengan necesidades similares y puedan compartir ideas y mejores prácticas.
Encontrar personal adecuadamente calificado
Según una encuesta de Quanthub, hubo una escasez de 250,000 científicos de datos en 2020. A finales de abril de 2022, el sitio de ofertas de trabajo Indeed.com enumeraba 2,700 vacantes de científicos de datos sólo en el Reino Unido. Esta escasez de profesionales adecuadamente calificados está obligando a subir los salarios y dificultando la retención del personal. Y los científicos de datos no son el único personal necesario para integrar datos alternativos en un negocio. Forrester Research recomienda que las empresas empleen los servicios de “cazadores de datos” cuya función es rastrear datos alternativos viables y validar la precisión e integridad de estas fuentes. El proveedor europeo de reaseguros Munich Re emplea un equipo de 20 cazadores de datos para este mismo propósito.
Las posibles soluciones a esta escasez de habilidades incluyen capacitar al personal existente cuyo conocimiento del negocio y sus necesidades les da una ventaja sobre las nuevas contrataciones. Forjar vínculos con colegios y universidades que ofrecen cursos de ciencia de datos y explorar posibilidades para la colocación de estudiantes y programas de capacitación de posgrado es otra forma de construir una fuente de habilidades.
Determinación de la propiedad de los datos
La naturaleza de los datos alternativos y sus orígenes en fuentes no tradicionales pueden hacer que la validación de la propiedad de los datos sea más difícil que con los datos proporcionados por proveedores establecidos y confiables. Esto es especialmente cierto cuando se han combinado múltiples fuentes de datos antes de la compra y cuando desenredar sus orígenes puede resultar complejo. Pueden surgir dificultades en torno a la concesión de licencias, las leyes de propiedad intelectual y las normas de protección de datos.
Los problemas se pueden mitigar mediante la selección de proveedores de confianza que ofrezcan a los clientes un grado de transparencia en sus métodos de obtención de datos. Por supuesto, usar datos internos siempre que sea posible es otra forma de reducir el riesgo.
Actualización de modelos para procesar datos alternativos
Mantener modelos de datos para garantizar la coherencia y tratar los errores a medida que ocurren es un costo significativo que muchas empresas subestiman. Idera calcula que el mantenimiento generalmente representa el 50-80% de los presupuestos de desarrollo. Agregar nuevas fuentes de datos a los modelos también puede agregar costos significativos a los presupuestos ajustados.
El modelado de datos cuidadoso al principio y la incorporación de un grado de flexibilidad en los diseños de modelos pueden suavizar este proceso.
Herramientas apropiadas para almacenar datos alternativos
Una cuarta parte de los que respondieron a la encuesta de Lowenstein mencionaron la falta de herramientas y técnicas para almacenar datos alternativos como una preocupación seria. Parte del problema radica en la falta de consistencia entre diferentes fuentes en términos de frecuencia de actualizaciones, API y formatos de datos.
Limpiar los datos para garantizar que los modelos funcionen sin problemas y produzcan resultados consistentes y confiables puede tener un costo significativo. Las opciones cada vez mayores de almacenamiento, desde sistemas locales hasta soluciones híbridas y en la nube, y asegurarse de que funcionen de manera eficiente para los requisitos de ingesta de los modelos de datos agrega otra capa de complejidad y costo a la ecuación.
A medida que los datos continúan brindando una fuente de ventaja competitiva para las empresas que pueden aprovechar su potencial comercial, los datos alternativos crecerán en importancia. Es importante comprender que, si bien el acceso a muchas fuentes de datos alternativos puede costar poco o nada, puede haber otros costos, a veces sustanciales, involucrados en hacer que se ajusten a su propósito e integrarlos en los flujos de trabajo establecidos.
Martin de Saulles, CIO.com