Contenido Exclusivo

Cinco cosas que el CIO debe saber de big data

 

#1 Usted necesita pensar en los big data
El análisis de las grandes cantidades de datos (big data) tiene su origen en los grandes proveedores de servicios Web como Google, Yahoo y Twitter, que necesitaban aprovechar al máximo los datos generados por sus usuarios. Pero las empresas también requieren del análisis de esos datos para seguir siendo competitivas y relevantes.
 
Su compañía puede ser realmente pequeña y tener muchos datos. Tan sólo un pequeño fondo de inversión puede tener terabytes de datos, explicó Jo Maitland, directora de investigación de big data de GigaOm. En los próximos dos años, un gran número de industrias – incluyendo la de salud, sector público, retail y manufactura – se beneficiarán financieramente con el análisis de más de sus datos, anticipó la firma de consultoría McKensey and Company en un reporte reciente.
Hay algo inevitable con Hadoop y las implementaciones de big data, señaló Eric Baldeschwieler, director de tecnología de Hortonworks, una empresa de Yahoo que ofrece una distribución de Hadoop. Se aplica a una gran variedad de clientes. Reunir y analizar información de sus transacciones le dará a las organizaciones más claves sobre las preferencias de sus clientes. Puede usarse para informar mejor la creación de nuevos productos y servicios, y permitir a las organizaciones remediar los problemas más rápidamente.
#2 Los datos útiles pueden venir de cualquier parte
Tal vez usted no cree tener patabytes de datos que valen la pena analizar, pero lo valen, si es que no lo está haciendo ya. Los big data son datos reunidos que solían estar “tirados sobre el piso”, indicó Baldeschwieler.
 
Big data podrían ser los archivos de registro de su servidor, por ejemplo. Un servidor mantiene un registro de todo quienes entran a un sitio, y qué páginas visitan cuando están ahí. Rastrear estos datos puede brindar información de lo qué están buscando los clientes. Si bien el análisis de estos datos no es nada nuevo, puede hacerse para alcanzar nuevos niveles de granularidad muy altos.
Otra fuente importante serán los datos de los sensores. Durante años los analistas han estado hablando del Internet de las Cosas, en el que sensores económicos se conectan a Internet, lo que ofrece flujos continuos de datos sobre su uso. Podrían estar en autos, o puentes o máquinas expendedoras de bebidas. “El valor real alrededor de los dispositivos es su capacidad de capturar datos, analizar esa información y lograr eficiencias para el negocio”, explicó Kevin Dallas, director general de Microsoft Windows Embedded.
#3 Necesitará nuevo talento para los big data
Cuando establezca un sistema de análisis de grandes cantidades de datos, su mayor obstáculo será encontrar al talento adecuado que sepa cómo utilizar las herramientas para analizar los datos, a decir del analista de Forrester Research, James Kobielus.
 
Los big data dependen del modelado de datos sólidos. Las organizaciones tendrán que enfocarse en la ciencia de los datos, añadió Kobielus. Tienen que contratar a modeladores estadísticos, profesionales de la minería de datos, gente que se especializa en el análisis de sentimientos. Esto tal vez no sea la misma serie de habilidades que los analistas de hoy expertos en herramientas de BI conocen muy bien.
Esa gente podría ser escasa. Para 2018, tan sólo en Estados Unidos podría darse una escasez de 140 mil a 190 mil personas con profundas capacidades analíticas así como 1.5 millones de gerentes y analistas con el conocimiento para usar el análisis de big data para tomar decisiones efectivas, estimó McKinsey and Company.
Otra habilidad que usted necesitará tener a la mano es la capacidad de integrar las grandes cantidades de hardware necesarias para almacenar y analizar los datos. Administrar 100 servidores es un problema totalmente distinto a manejar sólo 10, señaló Maitland. Usted tal vez necesite contratar algunos administradores de súpercomputadoras de una universidad local o de un laboratorio de investigación.
#4 Big data no requiere de una organización previa
Los CIO que están acostumbrados a planear rigurosamente todos los tipos de datos que van dentro de un almacén de datos empresarial pueden respirar tranquilos con los sistemas de big data. Aquí, la regla es reunir primero los datos, y después preocuparse por cómo los usará más tarde.  
 
Con un almacén de datos, usted tiene que preparar el esquema de datos antes de que pueda comenzar a almacenar los datos. “Esto básicamente significa que tiene que saber de antemano qué está buscando”, sentenció Jack Norris, vicepresidente de mercadotecnia de MapR. Como resultado, “usted está aplanando los datos y perdiendo parte de la granularidad”, agregó. “Más tarde, si usted cambia de opinión, o quiere hacer un análisis histórico, se habrá limitado”.
“Puede utilizar un repositorio de big data como un vertedero, y ejecutar el análisis sobre él, y descubrir después las relaciones”, señaló Norris. Muchas organizaciones tal vez no sepan lo que están buscando hasta después de que han seleccionado los datos, de modo que este tipo de libertad “es excelente”, dijo.
#5 Big Data no se limita sólo a Hadoop
Cuando la gente habla sobre big data, la mayoría de las veces se están refiriendo a la plataforma de análisis de datos Hadoop. “Hadoop es una iniciativa polémica, a la que se le asigna presupuestos y gente”, en muchas organizaciones, señaló Kobielus. Sin embargo, finalmente usted puede optar por otro software.
Recientemente la firma de investigación legal LexusNexus, que no se queda atrás en el análisis de grandes cantidades de datos, lanzó su propia plataforma de análisis, HPCC Systems. MarkLogic también creó su propia base de datos para datos no estructurados, el MarkLogic Server, para trabajos estilo big data también. Otra herramienta que está ganando popularidad es el motor de búsqueda Splunk, que puede usarse para buscar y analizar datos generados por máquinas, como los archivos de registro de un servidor.

Lo Más Reciente

Tenable descubre nuevas técnicas de ataque en software de código abierto

El equipo de investigación de seguridad en la nube...

Shopperbot: robot mexicano que ayuda a tomar mejores decisiones de compra

Como parte de las soluciones para impulsar la hiperpersonalización...

Los ‘Scam-Yourself Attacks’ aumentan 614% en el tercer trimestre del año: informe

Los 'Scam-Yourself Attacks' o "ataques de estafa”, en los...

Newsletter

Recibe lo último en noticias e información exclusiva.

Tenable descubre nuevas técnicas de ataque en software de código abierto

El equipo de investigación de seguridad en la nube de Tenable descubrió nuevas técnicas de ataque en los Lenguajes Específicos de Dominio (DSLs, por...

“Mejorar la visibilidad en el ecosistema tecnológico, interno y de cara al cliente” : José Armando López Flores, CISO de Crediclub

“Queremos ser esa institución financiera que cubra con las expectativas de los clientes a través de garantizarles que su patrimonio estará seguro”. Con el objetivo...

Shopperbot: robot mexicano que ayuda a tomar mejores decisiones de compra

Como parte de las soluciones para impulsar la hiperpersonalización en la atención al cliente por medio de la tecnología, PepsiCo México desarrolló a Shopperbot....