Diez grandes mitos del Big Data

Big Data ha dominado las noticias tecnolÃ³gicas Ãºltimamente. Ha sido considerada como una posible soluciÃ³n para todo tipo de temas, desde la detecciÃ³n de intrusos hasta la prevenciÃ³n del fraude y la cura del cÃ¡ncer.

Sin embargo, el Big Data, que definimos como los datos recolectados en grandes cantidades, a gran velocidad y en muchos formatos, no es una cura para todos los problemas. De hecho, si las compaÃ±Ãas que creen en alguno de estos mitos alrededor del Big Data se dirigen en la direcciÃ³n equivocada, la pÃ©rdida de tiempo y dinero podrÃa costar a la empresa su posiciÃ³n competitiva en el mercado, o daÃ±ar la reputaciÃ³n de la compaÃ±Ãa.

A continuaciÃ³n algunos de los mÃ¡s grandes mitos alrededor del Big Data.

MITO 1: Solo los cientÃficos de datos pueden trabajar con el Big Data
De hecho, los cientÃficos de datos no bastan.

â€œLos cientÃficos de datos por sÃ mismos no van a poder jalar la informaciÃ³n desde el Big Data si no saben lo que estÃ¡n buscando en primer lugarâ€, seÃ±ala Pat Farrell, director senior de analÃtica de datos de Penn Medicine. â€œUno necesita de personas que estÃ©n familiarizadas con la industria, el dominio del conocimiento, entiendan quÃ© tipos de preguntas se pueden encontrar, quÃ© informaciÃ³n serÃa valiosa para la industria en particularâ€.

Penn Medicine, por ejemplo, incluye un sistema de salud y una escuela de medicina. Por mucho tiempo, el sistema de salud ha estado recolectando datos clÃnicos en un data warehouse. Mientras tanto, en la escuela de medicina, las nuevas tecnologÃas permiten determinar la secuencia del genoma humano, lo cual implica una enorme cantidad de datos.

â€œSabemos que se puede encontrar valor ahÃ fuera, y por fin tenemos el poder de cÃ³mputo para acceder a Ã©lâ€, sostiene Farrell. Al combinar la analÃtica de datos con la experticia en medicina se abre un campo totalmente nuevo de cuidados de la salud predictivos, afirma el ejecutivo.

MITO 2: Mientras mÃ¡s datos, mÃ¡s valor
Se requiere de tiempo y de recursos para recolectar los datos, alojarlos y catalogarlos, indica Farrell. Recolectar de manera indiscriminada grandes cantidades de datos puede entretener esos recursos alejÃ¡ndolos de proyectos mÃ¡s valiosos.

Farrell recomienda que las empresas tengan una clara idea de la mÃ©trica especÃfica o key performance indicator (KPI) que buscan antes de comenzar a recolectar datos.

â€œUno quiere llegar al punto donde se tiene un puÃ±ado de pepitas de sabidurÃa que sean valiosas para unoâ€, indica el ejecutivo. â€œLos datos en sÃ mismos, puesto ahÃ, no son suficienteâ€.

MITO 3: El Big Data es para las grandes compaÃ±Ãas
Las grandes compaÃ±Ãas pueden tener mÃ¡s recursos internos para conseguir datos, pero incluso las pequeÃ±as empresas pueden aprovechar los datos que provienen de las plataformas de medios sociales, las agencias gubernamentales y los proveedores de datos.

â€œSin importar el tamaÃ±o de su organizaciÃ³n, lo mejor es tomar decisiones en base a los datos y no confiar en la intuiciÃ³n o las corazonadasâ€, sostiene Darin Bartik, director ejecutivo de product management de Information Management Solutions de Dell Software.

Las compaÃ±Ãas pequeÃ±as pueden tomar decisiones basadas en datos con menos regularidad que sus contrapartes mÃ¡s grandes, afirma el ejecutivo; pero, cuando lo hacen, pueden realizar correcciones a su curso de acciones mÃ¡s rÃ¡pido.

â€œLas compaÃ±Ãas mÃ¡s pequeÃ±as pueden usar mejores prÃ¡cticas para guiarse mÃ¡s por los datos y superar o ser mÃ¡s hÃ¡biles que sus competidores mÃ¡s grandes y mÃ¡s lentosâ€, anota el ejecutivo.

MITO 4: Recolecte ahora, ordene despuÃ©s
El almacenamiento se abarata a cada momento, pero no llega a ser gratuito. Sin embargo, para muchas compaÃ±Ãas, el apetito por los datos se estÃ¡ expandiendo mÃ¡s rÃ¡pido que lo que se estÃ¡n reduciendo los costos del almacenamiento, seÃ±ala Brad Peters, CEO de Birst, empresa proveedora de soluciones de inteligencia de negocio en nube.

Las compaÃ±Ãas creen que si simplemente recogen datos, luego podrÃ¡n pensar en quÃ© hacer con ellos, afirma el ejecutivo. â€œVeo que varias grandes corporaciones recolectan â€˜camionadasâ€™ de cosas, su gasto se incrementa y no obtienen ningÃºn valor de elloâ€.

De hecho, con algunos grupos de datos, se comienza a aplicar la ley de los rendimientos decrecientes. Por ejemplo, si encuesta a las personas para predecir una elecciÃ³n. Uno necesita una cierta cantidad de persona para obtener una muestra representativa. Pero luego de cierto punto, agregar mÃ¡s personas no afectarÃ¡ significativamente el margen de error.

â€œÂ¿Almacena datos que podrÃa necesitar, que podrÃa darle un par de dÃgitos de precisiÃ³n?â€, pregunta el ejecutivo. â€œO Â¿adquiere mÃ¡s personal? Â¿Asegura mejor sus redes? La economÃa no estÃ¡ creciendo muy rÃ¡pidamente y los presupuestos no se estÃ¡n incrementandoâ€.

Y no solo se trata de los costos de almacenamiento, seÃ±ala Dean Gonsowski, jefe global de gobierno de la informaciÃ³n y administraciÃ³n de big data de Recommind, empresa de San Francisco que se especializa en analÃtica de datos no estructurados.

Por ejemplo, podrÃa costarle a la compaÃ±Ãa perder esos datos, afirma. Y tener los datos en los warehouses significa que se encuentran sujetos a la inspecciÃ³n en caso de que surja algÃºn juicio.

Finalmente, cuantos mÃ¡s datos, mÃ¡s tiempo se necesita para ordenarlos. â€œCuando los repositorios llegan a los miles de millones de registros, las bÃºsquedas pueden requerir de horas o semanasâ€, seÃ±ala el ejecutivo. â€œEl volumen de la informaciÃ³n comienza a atascar los sistemas que nunca fueron construidos para manejar estos volÃºmenesâ€.

MITO 5: Todos los datos han sido creados iguales
El estado de Virginia ha estado recolectando datos sobre las matrÃculas de los estudiantes, ayuda financiera y nivel de dinero otorgado, en los Ãºltimos 20 aÃ±os. Pero eso no significa que los datos recolectados hace 20 aÃ±os, y almacenados en el mismo campo de datos, son necesariamente los mismos.

â€œEl problema mÃ¡s grande con el que me he topado es que simplemente, porque se encuentra en el diccionario de datos, los investigadores creen que todo es lo mismoâ€, seÃ±ala Tod Massa, director de investigaciÃ³n de polÃticas y data warehousing del Consejo Estatal de EducaciÃ³n Superior de Virginia. â€œPor ejemplo, los datos sobre los puntajes en las evaluaciones de los estudiantes en el ACT (American College Test) y el SAT (Scholastic Assessment Test) inicialmente solo se recolectaban para estudiantes del estado, entonces habÃa una brecha; luego se comenzÃ³ a recolectar tanto para estudiantes del estado como para estudiantes de fuera del estadoâ€. De forma similar, la raza y la etnicidad se registran de forma diferente a nivel escolar y en la educaciÃ³n superior.

De hecho, cualquier dato en particular puede ser reportado de manera diferente de parte de instituciones diferentes o en diferentes puntos de tiempo, o por diferentes personas en esas instituciones. â€œSi se encuentras en un lugar aislado o en una empresa que solamente es responsable por los datos que recolecta, podrÃa tener una situaciÃ³n diferenteâ€, seÃ±ala. â€œPero incluso entonces, sospecho que el significado de dato cambia con el tiempoâ€.

Como resultado, los analista no solo necesitan habilidades estadÃsticas, sino tambiÃ©n conocimiento local de los datos y conocimiento de las tendencias de la industria como un todo, como cuando se reacomodaron los puntajes del SAT y el ACT.

â€œUno no puede programar todas esas cosas en un repositorio de datosâ€, indica el ejecutivo.

Lo mismo se aplica para las fuentes de datos externas, agrega. â€œLa recolecciÃ³n de datos a nivel federal ha cambiado drÃ¡sticamente en los pasados 50 aÃ±osâ€, seÃ±ala. â€œEl entendimiento de la cultura y el contexto de la recolecciÃ³n de datos es realmente necesario para usar bien los datosâ€.

MITO 6: Mientras mÃ¡s especÃfica sea la predicciÃ³n, mejor
Es parte de la naturaleza humana pensar que algo que es mÃ¡s especÃfico es mÃ¡s exacto. Decir â€œ3:12 pmâ€ es mÃ¡s exacto que â€œen algÃºn momento de la tardeâ€. Que el meteorÃ³logo que predice que va a llover el domingo por la maÃ±ana es mÃ¡s exacto que aquel que predice que â€œexiste un 50% de probabilidades de que llueva el fin de semanaâ€.

De hecho, el opuesto es cierto. En muchas situaciones, mientras mÃ¡s exacta es la predicciÃ³n menos probabilidades de que sea certera.

Por ejemplo, un cliente compra una laptop muy especÃfica, con una configuraciÃ³n muy particular. Y el Ãºnico otro cliente que ha comprado ese mismo producto en el pasado tambiÃ©n comprÃ³ un par de zapatos con taco aguja rosados.

â€œLa recomendaciÃ³n de comprar zapatos con tacÃ³n de aguja rosados podrÃa ser muy especÃfica, demasiado especÃfica, y tener un gran margen de errorâ€, seÃ±ala Jerry Jao, CEO de Retention Science, firma de marketing de California.

â€œEsto es algo que en realidad vemos con frecuencia en los negocios y los gerentes de marketingâ€, indica.

MITO 7: Big Data es igual a Hadoop
Hadoop, la popular base de datos de cÃ³digo abierto para datos no estructurados, ha llamado mucho la atenciÃ³n Ãºltimamente.

Pero existen otras opciones.

â€œExiste todo un movimiento NoSQLâ€, seÃ±ala Irfan Khan, gerente general y vicepresidente senior de SAP Big Data. â€œExiste MongoDB, Cassandra -todo un grupos de otras tecnologÃasâ€.

Algunas de esas tecnologÃas podrÃan ser una mejor alternativa que las otras para un proyecto en particular de Big Data.

En particular, Hadoop funciona dividiendo los datos en pedazos, y trabajando en varios pedazos al mismo tiempo. Este enfoque funciona en muchos problemas de Big Data, pero no en todos.

â€œAunque YARN y Hadoop 2 encaran algunos temas, en ocasiones uno necesita trabajar de formas en las que no es ideal Hadoopâ€, sostiene Grant Ingersoll, CTO de LucidWorks, firma consultora en Big Data. â€œLas personas necesitan decidir quÃ© es lo mejor para ellas, no simplemente elegir ese objeto brillante que todos los chicos cool estÃ¡n utilizandoâ€.

MITO 8: Los usuarios finales no necesitan acceso directo a Big Data
Big Data se mueve a gran velocidad, desde una variedad de fuentes y en grandes volÃºmenes; con ello parece que es simplemente demasiado complicado como para que los empleados comunes trabajen con ellos.

Pero eso no es necesariamente el caso.

Por ejemplo, todos los datos generados por los dispositivos en una unidad de cuidado intensivo. Pulsaciones, datos de respiraciÃ³n, lecturas de electrocardiogramas. Sin embargo, generalmente los doctores y las enfermeras solo pueden ver las lecturas actuales del paciente.

â€œNo puedo ver lo que pasaba hace 10 minutos, o dibujar una lÃnea de tendencia de lo que podrÃa pasar dentro de una horaâ€, seÃ±ala Anthony Jones, chief marketing officer de Patient Care & Clinical Informatics de Philips Healthcare.

Estar en capacidad de ver los datos histÃ³ricos de un paciente puede ser muy valioso para un profesional mÃ©dico que tiene que tomar una decisiÃ³n. â€œLa gente que se encuentra cercana a un equipo de ciencias con datos importantes estÃ¡ perdiendo una gran oportunidadâ€, seÃ±ala Jones.

El problema hoy es hacer que todos los diferentes dispositivos que generan datos conversen unos con otros a pesar de que no se encuentran diseÃ±ados para hacer esto, y usar diferentes plataformas y lenguajes de programaciÃ³n. Y una vez que lo hagan, llevar los datos en una forma que sea Ãºtil para los doctores y enfermeras cuando lo necesiten.

MITO 9: Big Data es para los grandes problemas
El CIO de un gran banco recientemente dio una charla sobre Big Data, y se le preguntÃ³ acerca del autoservicio del usuario final.

â€œY el CIO dice, â€˜no creo en esoâ€™â€, recuerda Peters, CEO de Birst.

Esa es una actitud comÃºn, seÃ±ala, ya que algunos ejecutivos creen que Big Data solo responde ciertos tipos de preguntas. La actitud puede resumirse de la siguiente manera: â€œLa meta del Big Data para nosotros es resolver sÃ³lo algunos problemas muy valiosos con un grupo de cientÃficos de datos. No queremos que se genere un caos en los datos si es que las personas normales tienen acceso a esta informaciÃ³n porque no creo que la necesitanâ€.

Peters no estÃ¡ de acuerdo con este enfoque, aunque seÃ±ala que es muy comÃºn en muchas industrias. â€œDentro de las grandes compaÃ±Ãas de seguros crece el mito de que los usuarios de negocio no son lo suficientemente inteligentes como para manejar los datosâ€.

MITO 10: La burbuja del Big Data va a reventar con el tiempo
Los ciclos de entusiasmo van y vienen, pero los cambios tecnolÃ³gicos transformadores se quedan. La caÃda de las empresas punto com no fue la seÃ±al del fin de Internet.

Incluso cuando el entusiasmo desaparezca, las compaÃ±Ãas seguirÃ¡n teniendo Big Data con la cual trabajar. De hecho, tendrÃ¡n mÃ¡s Big Data de lo que esperan, debido al crecimiento exponencial de los datos; IDC proyecta que la cantidad total de datos recolectados se duplicarÃ¡ cada dos aÃ±os hasta el 2020.

Y no se trata de que las empresas estÃ©n simplemente recolectando mÃ¡s cosas de las que actualmente recolectan. MÃ¡s bien, es probable que aparezcan nuevos tipos de datos, los cuales van a requerir enormes cantidades de almacenamiento.

â€œLlegaremos a un punto en el que a todos aquellos que sean ingresados a un hospital se les mapearÃ¡ su genomaâ€, seÃ±ala Anthony Jones, chief marketing officer de Patient Care & Clinical Informatics de Philips Healthcare. â€œEsto permitirÃ¡ que el tratamiento sea personalizado para el paciente. Y cuando se habla de Big Data, se habla de una enorme cantidad de datos. No creo que muchos CIO realmente se den cuenta de cuÃ¡n difÃciles van a ponerse las cosasâ€.

Si se piensa en el Big Data como simplemente una fase, las compaÃ±Ãas pueden perder oportunidades para capturar elementos de datos que podrÃan tener un impacto en los resultados de sus negocios, seÃ±ala Bryan Hill, CTO de Cadient Group, una agencia de marketing interactivo de Pennsylvania.

â€œEl tÃ©rmino â€˜Big Dataâ€™ probablemente cambie, de la misma manera en que surgiÃ³ la computaciÃ³n en la nube, que no fue muy diferente a lo que pasÃ³ con web, o Internetâ€, sostiene el ejecutivo. â€œEl tÃ©rmino puede cambiar, pero el espÃritu del Big Data estÃ¡ aquÃ para quedarseâ€.

-Maria Korolov, Network World

Secciones

Síguenos

Contenido Exclusivo

¡Ya está aquí la Revista Digital “Los Mejores 20 CISO de México 2025”!

¡Descarga la Revista Digital “Los Mejores 100 CIO de México 2025”!

“Los 100 Mejores CIO de MÃ©xico” celebran 20 AÃ±os de transformaciÃ³n y liderazgo Ã©tico

Secciones

Síguenos

Lo Más Reciente

84% de las empresas mexicanas recurre a SOCaaS

ESET invertirá 40 millones de euros para combatir los ataques de la IA autónoma

La falta de tecnología en el checkout frustra a los consumidores actuales

La automatización de parches es el nuevo escudo de la ciberseguridad

Newsletter

84% de las empresas mexicanas recurre a SOCaaS

ESET invertirá 40 millones de euros para combatir los ataques de la IA autónoma

La falta de tecnología en el checkout frustra a los consumidores actuales

Acerca de CIO | EDIWORLD

Secciones