Contenido Exclusivo

Cinco costos ocultos de trabajar con datos alternativos

Los datos alternativos ofrecen a las empresas la oportunidad de obtener una ventaja competitiva, pero los costos de integrarlos en los flujos de trabajo comerciales pueden ser mayores de lo que piensa.

Las fuentes de datos alternativas ahora están integradas en los procesos comerciales de las empresas en una variedad de sectores. Según una encuesta de 2022 realizada por el bufete de abogados Lowenstein Sandler, el 92% de las organizaciones de inversión, desde fondos de cobertura y capital privado hasta capital de riesgo, utilizan datos alternativos en una medida moderada o significativa para informar la toma de decisiones. Los encuestados también esperan que su uso de datos alternativos aumente hasta 2022.

Por lo general, estos datos provienen del agotamiento de otros procesos comerciales, como la actividad de las redes sociales, las imágenes satelitales, los datos de seguimiento de ubicación, las transacciones con tarjetas de crédito y el web scraping. 

Si bien los datos alternativos se pueden usar en toda una organización, desde marketing y ventas hasta funciones de finanzas y estrategia, los departamentos de TI suelen ser responsables de la administración y propiedad de los datos de terceros. 

En 2019, Forrester Research descubrió que el 56% de las adquisiciones de datos alternativos eran administradas por CIO y CDO que trabajaban dentro de TI.

La obtención, el almacenamiento y la gestión de datos alternativos crean nuevos desafíos para los administradores de TI y pueden generar costos significativos e innecesarios. Aquí hay 5 de esos desafíos y cómo mitigar su impacto.

Costos de selección de proveedores

Según la encuesta de Lowenstein, los costos de selección de proveedores son la preocupación más importante que tienen los usuarios de datos alternativos, y el 61% dice que es una preocupación importante para ellos. Los costos se incurren a través del proceso lento de examinar a los proveedores de datos alternativos y luego garantizar que los datos que brindan sean de calidad suficiente. 

Esto es particularmente importante cuando los datos serán un elemento central de cualquier proceso comercial y no son fácilmente reemplazables. En estas situaciones, es fundamental que los compradores confíen en que el proveedor seguirá ofreciendo estos datos en el futuro previsible.

Una forma de mitigar estos riesgos es buscar consorcios de la industria para identificar fuentes de datos confiables. Es probable que otras empresas que operen en el mismo sector tengan necesidades similares y puedan compartir ideas y mejores prácticas.

Encontrar personal adecuadamente calificado

Según una encuesta de Quanthub, hubo una escasez de 250,000 científicos de datos en 2020. A finales de abril de 2022, el sitio de ofertas de trabajo Indeed.com enumeraba 2,700 vacantes de científicos de datos sólo en el Reino Unido. Esta escasez de profesionales adecuadamente calificados está obligando a subir los salarios y dificultando la retención del personal. Y los científicos de datos no son el único personal necesario para integrar datos alternativos en un negocio. Forrester Research recomienda que las empresas empleen los servicios de “cazadores de datos” cuya función es rastrear datos alternativos viables y validar la precisión e integridad de estas fuentes. El proveedor europeo de reaseguros Munich Re emplea un equipo de 20 cazadores de datos para este mismo propósito. 

Las posibles soluciones a esta escasez de habilidades incluyen capacitar al personal existente cuyo conocimiento del negocio y sus necesidades les da una ventaja sobre las nuevas contrataciones. Forjar vínculos con colegios y universidades que ofrecen cursos de ciencia de datos y explorar posibilidades para la colocación de estudiantes y programas de capacitación de posgrado es otra forma de construir una fuente de habilidades.

Determinación de la propiedad de los datos

La naturaleza de los datos alternativos y sus orígenes en fuentes no tradicionales pueden hacer que la validación de la propiedad de los datos sea más difícil que con los datos proporcionados por proveedores establecidos y confiables. Esto es especialmente cierto cuando se han combinado múltiples fuentes de datos antes de la compra y cuando desenredar sus orígenes puede resultar complejo. Pueden surgir dificultades en torno a la concesión de licencias, las leyes de propiedad intelectual y las normas de protección de datos. 

Los problemas se pueden mitigar mediante la selección de proveedores de confianza que ofrezcan a los clientes un grado de transparencia en sus métodos de obtención de datos. Por supuesto, usar datos internos siempre que sea posible es otra forma de reducir el riesgo.

Actualización de modelos para procesar datos alternativos

Mantener modelos de datos para garantizar la coherencia y tratar los errores a medida que ocurren es un costo significativo que muchas empresas subestiman. Idera calcula que el mantenimiento generalmente representa el 50-80% de los presupuestos de desarrollo. Agregar nuevas fuentes de datos a los modelos también puede agregar costos significativos a los presupuestos ajustados. 

El modelado de datos cuidadoso al principio y la incorporación de un grado de flexibilidad en los diseños de modelos pueden suavizar este proceso.

Herramientas apropiadas para almacenar datos alternativos

Una cuarta parte de los que respondieron a la encuesta de Lowenstein mencionaron la falta de herramientas y técnicas para almacenar datos alternativos como una preocupación seria. Parte del problema radica en la falta de consistencia entre diferentes fuentes en términos de frecuencia de actualizaciones, API y formatos de datos. 

Limpiar los datos para garantizar que los modelos funcionen sin problemas y produzcan resultados consistentes y confiables puede tener un costo significativo. Las opciones cada vez mayores de almacenamiento, desde sistemas locales hasta soluciones híbridas y en la nube, y asegurarse de que funcionen de manera eficiente para los requisitos de ingesta de los modelos de datos agrega otra capa de complejidad y costo a la ecuación.

A medida que los datos continúan brindando una fuente de ventaja competitiva para las empresas que pueden aprovechar su potencial comercial, los datos alternativos crecerán en importancia. Es importante comprender que, si bien el acceso a muchas fuentes de datos alternativos puede costar poco o nada, puede haber otros costos, a veces sustanciales, involucrados en hacer que se ajusten a su propósito e integrarlos en los flujos de trabajo establecidos.

Martin de Saulles, CIO.com

Lo Más Reciente

Tenable descubre nuevas técnicas de ataque en software de código abierto

El equipo de investigación de seguridad en la nube...

Shopperbot: robot mexicano que ayuda a tomar mejores decisiones de compra

Como parte de las soluciones para impulsar la hiperpersonalización...

Los ‘Scam-Yourself Attacks’ aumentan 614% en el tercer trimestre del año: informe

Los 'Scam-Yourself Attacks' o "ataques de estafa”, en los...

Newsletter

Recibe lo último en noticias e información exclusiva.

José Luis Becerra Pozas
José Luis Becerra Pozashttps://iworld.com.mx
Es Editor de CIO Ediworld México. Contáctalo en jbecerra@ediworld.com.mx o en el twitter @CIOMexico.

Tenable descubre nuevas técnicas de ataque en software de código abierto

El equipo de investigación de seguridad en la nube de Tenable descubrió nuevas técnicas de ataque en los Lenguajes Específicos de Dominio (DSLs, por...

“Mejorar la visibilidad en el ecosistema tecnológico, interno y de cara al cliente” : José Armando López Flores, CISO de Crediclub

“Queremos ser esa institución financiera que cubra con las expectativas de los clientes a través de garantizarles que su patrimonio estará seguro”. Con el objetivo...

Shopperbot: robot mexicano que ayuda a tomar mejores decisiones de compra

Como parte de las soluciones para impulsar la hiperpersonalización en la atención al cliente por medio de la tecnología, PepsiCo México desarrolló a Shopperbot....