Ocho razones por las que fallan los proyectos de ciencia de datos

La ciencia de datos puede ser la herramienta mÃ¡s popular para resolver problemas comerciales, pero los proyectos defectuosos pueden causar un daÃ±o significativo y desviar a los tomadores de decisiones.

La ciencia de datos rara vez deja de atraer el interÃ©s de los lÃderes empresariales y de TI por igual en estos dÃas. Pero falla.

De hecho, las iniciativas de ciencia de datos â€“que aprovechan los mÃ©todos cientÃficos, los procesos, los algoritmos y los sistemas tecnolÃ³gicos para extraer una variedad de conocimientos de datos estructurados y no estructuradosâ€“ pueden fallar de muchas maneras, lo que lleva a una pÃ©rdida de tiempo, dinero y otros recursos. Los proyectos defectuosos pueden resultar en mÃ¡s daÃ±o para una empresa que beneficios, al desviar a los tomadores de decisiones.

Estas son algunas de las razones mÃ¡s comunes por las que los proyectos de ciencia de datos no funcionan como se esperaba.

Mala calidad de los datos

Los datos incorrectos generan una ciencia de datos deficiente, por lo que es de vital importancia tomarse el tiempo para garantizar que los datos sean de alta calidad. Eso es cierto para cualquier empresa de anÃ¡lisis y ciertamente es el caso de la ciencia de datos.

Neal Riley, CIO, Adaptavist — Neal Riley, CIO de Adaptavist.

â€œLos datos incorrectos o sucios hacen que las iniciativas de ciencia de datos sean imposiblesâ€, como afirma Neal Riley, CIO de Adaptavist, una consultora de transformaciÃ³n digital. â€œUsted debe asegurarse de que sus datos estÃ©n limpios y listos para los analistas de datos. Si no es asÃ, es una completa pÃ©rdida de tiempo”.

Cuando las empresas usan datos que no estÃ¡n limpios para proyectos de ciencia de datos, terminarÃ¡n “mirando modelos que tienen resultados extraÃ±os [y] viendo que no representan la realidad o el proceso de una manera que mejore las cosas”, advierte Riley.

A veces, la calidad de los datos es deficiente debido a sesgos o discrepancias en los conjuntos de datos.

Brandon Jones, CIO, Worldwide Assurance for Employees of Public Agencies (WAEPA) — Brandon Jones, CIO de la aseguradora WAEPA.

â€œPara algunas organizaciones, se utilizan varios sistemas para administrar el negocioâ€, opina Brandon Jones, CIO de la aseguradora Worldwide Assurance for Employees of Public Agencies (WAEPA). â€œPara las empresas experimentadas, es posible que incluso tenga sistemas heredados a los que todavÃa se puede acceder [para] referencia o validaciÃ³n. En muchos casos, el negocio cambiÃ³ con cada sistema, por lo tanto, dio lugar a diferentes procesos y / o formas de contar una mÃ©trica dentro del negocio”.

Esta puede ser una de las principales causas de fracaso de la ciencia de datos, segÃºn Jones. Los resultados pueden estar inflados debido al doble recuento basado en un proceso comercial modificado. “Para resolver este problema, las organizaciones deben establecer el nivel de su programa de anÃ¡lisis de datos. Esto significa esbozar una fecha especÃfica en la que los datos se pueden validar y todos entienden y aceptan que este es el estÃ¡ndar comÃºn con el que trabajarÃ¡ la organizaciÃ³n”.

No hay una definiciÃ³n clara del problema a resolver

Â¿CÃ³mo puede tener Ã©xito una iniciativa de ciencia de datos si los miembros del equipo no comprenden el problema comercial que estÃ¡n tratando de resolver? Y, sin embargo, los equipos de ciencia de datos a veces encuentran esta deficiencia cuando se les pide que asuman proyectos.

“La definiciÃ³n de un problema a menudo se deja en manos de los cientÃficos de datos, cuando en realidad la definiciÃ³n de un problema [comprende] casos de negocios que abarcan el trabajo y definen el retorno potencial de la inversiÃ³n”, asevera Michael Roytman, cientÃfico jefe de datos de la empresa de ciberseguridad de Kenna.

Los usuarios comerciales que buscan aprovechar la ciencia de datos deben hacer preguntas de sondeo sobre el problema que estÃ¡n tratando de resolver, dice Marc Johnson, asesor senior y CIO virtual de la firma de consultorÃa de atenciÃ³n mÃ©dica Impact Advisors.

Michael Roytman, cientÃfico jefe de datos en Kenna Security.

â€œAl igual que con cualquier proyecto, dedique tiempo a bloquear el alcance del problema para identificar las fuentes correctas de los datosâ€, dice Johnson. â€œHace unos aÃ±os me pidieron que produjera un producto de anÃ¡lisis para una empresa de 20 aÃ±os. No hubo ninguna investigaciÃ³n con la base de clientes para ver si habÃa un mercado para ello. No se identificaron las mÃ©tricas para las que el cliente deseaba ver las analÃticas. Todo se basaba en que la competencia afirmaba que tenÃa un producto de anÃ¡lisis y se oÃan rumores de que los clientes lo querÃan “.

El proyecto durÃ³ dos aÃ±os sin rumbo “debido a la definiciÃ³n borrosa de cuÃ¡l era el problema que estÃ¡bamos tratando de resolver”, dice Johnson.

Falta de datos relevantes

Otra forma segura de fracasar con la ciencia de datos es no proporcionar los tipos especÃficos de datos necesarios para abordar un problema en particular.

Lanzar un enorme volumen de datos a un problema no es la respuesta.
â€œExiste la suposiciÃ³n de que los datos grandes conducirÃ¡n a conocimientos, lo que en realidad rara vez es el casoâ€, afirma Roytman. “Los conjuntos de datos inteligentes, personalizados y, a menudo, mÃ¡s pequeÃ±os son los que proporcionan modelos robustos generalizables”.

Marc Johnson, asesor senior y CIO virtual, Impact Advisors.

Para obtener valor de la ciencia de datos, debe haber un esfuerzo continuo para continuar la recopilaciÃ³n de datos de las fuentes mÃ¡s relevantes, dice Johnson. â€œLa creaciÃ³n [es] no un evento de una sola vezâ€, dice.

Dado que los datos se recopilan o compran de diversas fuentes, los equipos deben asegurarse de que cualquier modificaciÃ³n en los datos no distorsione los resultados y sacrifique la calidad de todo el conjunto de datos, dice Johnson. TambiÃ©n deben asegurarse de que no haya problemas de privacidad, legales o Ã©ticos con el conjunto de datos.

Falta de transparencia de datos

Los equipos deben ser transparentes con los datos que utilizaron para crear un modelo determinado.

â€œLos proyectos de ciencia de datos fracasan cuando las personas no confÃan en el modelo o no comprenden la soluciÃ³nâ€, dice Jack McCarthy, CIO del Poder Judicial del Estado de Nueva Jersey. “La forma de combatir esto es que debe poder ‘mostrar las matemÃ¡ticas’ y comunicarlas a las partes interesadas que podrÃan no tener las habilidades tÃ©cnicas o estadÃsticas”.

Los cientÃficos de datos deben explicar de dÃ³nde provienen los datos, quÃ© hicieron para calcular los modelos y proporcionar acceso a todos los datos relevantes. â€œLa transparencia puede ser clave para un proyecto exitosoâ€, dice McCarthy.

Jack McCarthy, CIO, State of New Jerseyâ€“Judiciary — Jack McCarthy, CIO del Poder Judicial del Estado de Nueva Jersey.

Un ejemplo de esto es el algoritmo de evaluaciÃ³n de riesgos que se utiliza en Nueva Jersey. “Proporcionamos a todas las partes interesadas un informe que muestra quÃ© casos en el historial de un acusado caen en quÃ© categorÃa y cÃ³mo se califica cada uno”, dice McCarthy. â€œEsto se proporciona a todos los adversarios para que tengan la oportunidad de analizar cada caso y cuestionar su inclusiÃ³n. Todo se hace de forma transparente”.

Falta de voluntad para reconocer que los hallazgos son inciertos

A veces, el grupo empresarial que solicita informaciÃ³n o el propio equipo de ciencia de datos simplemente no estÃ¡ dispuesto a concluir que los hallazgos fueron inciertos, poco claros o no lo suficientemente sÃ³lidos para una aplicaciÃ³n comercial, asevera Roytman.

â€œEs una respuesta igualmente aceptable y valiosa decir: ‘El modelo no es lo suficientemente bueno para generar ROI [retorno de la inversiÃ³n] para el negocio’â€, agrega.

El equipo de ciencia de datos de Kenna Security pasÃ³ dos meses construyendo un modelo de clasificaciÃ³n de vulnerabilidades que generarÃa automÃ¡ticamente una enumeraciÃ³n de debilidades comunes para una vulnerabilidad, recuerda Roytman. â€œEl modelo funcionÃ³; fue una respuesta sÃ³lida a un problema de curso a nivel de posgrado. Sin embargo, no funcionÃ³ lo suficientemente bien como para ser valioso para nuestros clientes. [La] precisiÃ³n fue demasiado baja. AsÃ que descartamos el proyecto, a pesar de que habÃamos invertido tiempo y obtuvimos un resultado”.

Ausencia de un campeÃ³n ejecutivo

Los esfuerzos de ciencia de datos necesitan un campeÃ³n en el C-suite, para garantizar que los proyectos obtengan suficientes recursos y soporte.

“Ayuda si es el CIO”, seÃ±ala Riley. “Consideramos la ciencia de datos como una parte integral de nuestra operaciÃ³n y me he asegurado de ser un campeÃ³n de nuestros esfuerzos”. Incluso si los CIO no son los campeones internos de la ciencia de datos, deberÃan ser responsables de mantener seguros todos los datos involucrados, dice. Pero la participaciÃ³n deberÃa ir mucho mÃ¡s allÃ¡ de la seguridad.

“Aprovechar al mÃ¡ximo la informaciÃ³n que captura es lo que yo llamarÃa la responsabilidad de un CIO moderno”, agrega Riley. “Con todos estos datos a mano, tiene los medios para aprender de ellos y usarlos de manera inteligente, y eso es algo que los CIO pueden utilizar para ayudar a sus organizaciones de manera transversal”.

Adaptavist ha aprovechado al mÃ¡ximo su trabajo de ciencia de datos para determinar nuevas tÃ¡cticas y modificaciones que puede realizar con el proceso de ventas, explica Riley. “No ha tenido nada que ver con nuestro producto o la infraestructura de TI, el marketing, nada de eso. Nos ha ayudado mÃ¡s desde el punto de vista de la optimizaciÃ³n de procesos comerciales, para manejar y gestionar mejor los clientes potenciales desde el interior de las ventas”.

Escasez de talento

La brecha de habilidades estÃ¡ plagando muchos aspectos de la TI, y la ciencia de datos no es una excepciÃ³n. Muchas organizaciones simplemente no cuentan con las habilidades necesarias para mantener proyectos u obtener el mÃ¡ximo valor.

Tracy Huitika, CIO de Beanworks.

â€œLos cientÃficos de datos de buena fe tienen una gran demanda, son difÃciles de conseguir y carosâ€, dice Tracy Huitika, CIO de ingenierÃa y datos de Beanworks, un proveedor de automatizaciÃ³n de cuentas por pagar basado en la nube. “El puesto generalmente requiere un doctorado en fÃsica o ciencias, asÃ como la capacidad de escribir cÃ³digo en R y Python”.

Una de las principales razones por las que los proyectos de ciencia de datos fracasan, incluso cuando llegan a la implementaciÃ³n, es la falta de talento operativo para continuar administrando el proyecto, afirma Johnson. â€œTomar a un cientÃfico de datos brillante para crear el modelo sin un plan para ejecutar las operaciones de mejora continua con ajustes para el mercado y los cambios de datos es como diseÃ±ar un automÃ³vil y entregarle las llaves a un niÃ±o de 10 aÃ±osâ€, dice.

Las empresas necesitan disponer de los conjuntos de habilidades adecuados para mantener el modelo despuÃ©s de que haya entrado en producciÃ³n, ya sea contratando o recurriendo a expertos externos, como consultores que estÃ©n bien versados â€‹â€‹en ciencia de datos.

La ciencia de datos no era la soluciÃ³n adecuada

Â¿QuÃ© pasa si un problema en particular no requiere ciencia de datos como soluciÃ³n en primer lugar? Este uso equivocado de la disciplina puede conducir al fracaso, por lo que vale la pena pensar mucho en cuÃ¡ndo y cuÃ¡ndo no aplicar mÃ©todos, procesos y herramientas de ciencia de datos.

“Una de las cosas mÃ¡s importantes que harÃ¡ que los proyectos de ciencia de datos fracasen es si la ciencia de datos, los algoritmos y el aprendizaje automÃ¡tico ni siquiera son la soluciÃ³n adecuada”, argumenta Riley.

â€œEs posible que no necesite un modelo de aprendizaje automÃ¡tico en absoluto; es posible que necesite una regresiÃ³n simple, y puede dedicar mucho tiempo y esfuerzo a revisar todas las diferentes permutaciones sin usar la ciencia de datosâ€, aÃ±ade Riley. â€œQuedamos atrapados en una de esas situaciones en las que buscÃ¡bamos modelos de ciencia de datos financieros para visualizar predictores del Ã©xito financiero futuro de las lÃneas de nuestro negocio. ResultÃ³ que lo mejor que se podÃa utilizar era simplemente una regresiÃ³n estadÃstica”.

Bob Violino, CIO.com

Secciones

Síguenos

Contenido Exclusivo

¡Ya está aquí la Revista Digital “Los Mejores 20 CISO de México 2025”!

¡Descarga la Revista Digital “Los Mejores 100 CIO de México 2025”!

“Los 100 Mejores CIO de MÃ©xico” celebran 20 AÃ±os de transformaciÃ³n y liderazgo Ã©tico

Secciones

Síguenos

Ocho razones por las que fallan los proyectos de ciencia de datos

Mala calidad de los datos

No hay una definiciÃ³n clara del problema a resolver

Falta de datos relevantes

Falta de transparencia de datos

Falta de voluntad para reconocer que los hallazgos son inciertos

Ausencia de un campeÃ³n ejecutivo

Escasez de talento

La ciencia de datos no era la soluciÃ³n adecuada

Lo Más Reciente

Video: Multiva contra el fraude digital

El consumo de electricidad de los centros de datos crecerá un 26% en 2026

La revolución de la IA está haciendo al hardware más importante que nunca

Crecer ya no es contratar: el dilema de las empresas mexicanas en 2026

Newsletter

Video: Multiva contra el fraude digital

El consumo de electricidad de los centros de datos crecerá un 26% en 2026

La revolución de la IA está haciendo al hardware más importante que nunca

Acerca de CIO | EDIWORLD

Secciones