Proyectos Big Data

La mayorÃa de tendencias sobrevaloradas salen del mercado o dejan de funcionar muy rÃ¡pidamente, lo que deberÃa hacer que los escÃ©pticos se preocupen sobre el tema de Big Data. Sin embargo, aunque Big Data estÃ¡ siendo promocionada como la nueva e innovadora tendencia que va a cambiar el mundo, los escÃ©pticos no estÃ¡n siendo tan escÃ©pticos como lo eran con la nube y el tema social.

Esto es probablemente porque Big Data estÃ¡ generando ganancias reales para las compaÃ±Ãas que la han adoptado. Desde ya, la analÃtica de Big Data estÃ¡ comenzando a cambiar esas disciplinas disparatadas como la investigaciÃ³n farmacÃ©utica, ventas y marketing y desarrollo de producto.

Muchos casos de uso, como las ciudades inteligentes y los carros sin conductor, nos emocionan y nos hablan sobre un mundo alrededor de nosotros que parece anticipar nuestras necesidades. Esos escenarios podrÃan ser el futuro de Big Data, pero no son el ahora.

“Hay una gran diferencia entre lo que es tecnolÃ³gicamente factible y lo que es prÃ¡ctico”, seÃ±ala Don DeLoaxh, CEO de Infobright, una compaÃ±Ãa de anÃ¡lisis de datos. “Mire a las dos tendencias que conducen Big Data: la Internet de las Cosas (IoC) y la comunicaciÃ³n de mÃ¡quina a mÃ¡quina (M2M).Ambas han estado ahÃ por un largo tiempo, pero la creciente sofisticaciÃ³n de los sensores y la disminuciÃ³n de precios correspondiente, mÃ¡s la proliferaciÃ³n de varias opciones de comunicaciÃ³n inalÃ¡mbrica, significa que lo que alguna vez fue tecnolÃ³gicamente posible en teorÃa, se estÃ¡ convirtiendo posible en la prÃ¡ctica”, aÃ±ade.

Algunos de nuestros sueÃ±os de Big Data mÃ¡s ambiciosos no han entrado en lo practico todavÃa. La tecnologÃa estÃ¡ ahÃ para un carro sin conductor, pero la infraestructura todavÃa no existe.

“Si quiere hacerle seguimiento y saber todo lo que estÃ¡ pasando con Big Data, simplemente siga al dinero”, anota DeLoach. “Es donde el ROI (retorno sobre la inversiÃ³n) es mÃ¡s obvio, donde las gente invertirÃ¡”, y vaya que si han invertido.

El ROI o para Big Data en los temas de salud, telemÃ¡tica de vehÃculos y marketing online ya estÃ¡ lo suficientemente claro. Sin embargo, esto no significa que eventualmente no vamos a ver carros sin conductor y ciudades sÃºper inteligentes; solo significa que todavÃa no son lo suficientemente prÃ¡cticas como para atraer grandes inversiones.

AquÃ les explicamos cinco proyectos de Big Data que estÃ¡n entre la lÃnea de lo que es prÃ¡ctico y lo que es posible, y estos proyectos o algunos como ellos, podrÃan cambiar fÃ¡cilmente nuestras vidas:

El proyecto del genoma humano revoluciona la medicina

Cuando el proyecto del genoma humano fue dado a conocer en 1990, no lo veÃamos como un proyecto de Big Data, pero eso era lo que era. Para el momento en que el genoma humano completo fue mapeado en el 2003, algunos de los precursores del movimiento Big Data ya habÃan comenzado a filtrarse en el mundo de la tecnologÃa.

AsÃ que no es para nada sorprendente que los sectores de salud y farmacÃ©utica sean los dos primeros en adoptar agresivamente las herramientas de Big Data, ya que cuentan con una trayectoria de Ã©xito.

El proyecto del genoma humano ha ilustrado tambiÃ©n una clase de Ley de Moore de Big Data. Ya puede obtener una foto incompleta, pero Ãºtil de su genoma de sitios como 23andMe por cien dÃ³lares o menos, y la presiÃ³n para bajar el costo de mapear su genoma personal completo por el mismo precio ya estÃ¡ en camino. Los precios han caÃdo o bajado todos los aÃ±os. Puede mapear su genoma completo por entre mil y cinco mil dÃ³lares. Antes, en el 2007, esto le hubiera costado como un millÃ³n de dÃ³lares.

Las nuevas empresas como Life Technologies (adquirida recientemente por Thermo Fisher Scientific) e InVitae estÃ¡n haciendo lo mejor que pueden para hacer que el mapeo del genoma sea algo a lo que todos puedan acceder, lo que llevarÃa a tratamientos personalizados para todo, desde el cÃ¡ncer hasta artritis reumatoide.

El Emory University Hospital e IBM, estÃ¡n desarrollando un ICU del futuro

Emory University Hospital estÃ¡ usando un software de IBM y Excel Media Electronics (EME) para un proyecto de investigaciÃ³n que tiene como objetivo crear atenciÃ³n mÃ©dica avanzada y predictiva para pacientes crÃticos o graves a travÃ©s de anÃ¡lisis en tiempo real.

Emory estÃ¡ probando un nuevo sistema que puede identificar patrones en datos fisiolÃ³gicos para alertar inmediatamente a los clÃnicos sobre los signos de daÃ±os en los pacientes. En un ICU tÃpico, una docena de diferentes corrientes de datos mÃ©dicos aparecen en pantallas al costado de la cama del paciente-incluyendo la fisiologÃa del corazÃ³n, la respiraciÃ³n, presiÃ³n sanguÃnea y las ondas cerebrales. Esta constante informaciÃ³n sobre los signos vitales es transmitida como ondas y nÃºmeros, y mostradas en pantallas de computadoras al lado de cada cama. Actualmente, depende de los doctores y las enfermeras el hecho de procesar y analizar rÃ¡pidamente toda esta informaciÃ³n para tomar decisiones mÃ©dicas.

Hoy en dÃa, cualquier pequeÃ±a desviaciÃ³n de la norma, que podrÃa ser algÃºn signo de alerta temprano, normalmente pasa desapercibido.

El sistema piloteado por Emory, usa BedMaster EX de EME, IBM InfoSphere Streams, y el motor analÃtico de Emory para recolectar y analizar los datos fisiolÃ³gicos de los pacientes en tiempo real. El nuevo sistema permitirÃ¡ que los clÃnicos adquieran, analicen y correlacionen datos mÃ©dicos mÃ¡s rÃ¡pidamente de lo que hubieran soÃ±ado aÃ±os atrÃ¡s.

“Acceder y dibujar insights de datos en tiempo real puede significar la vida y la muerte para un paciente”, anota Tim Buchman, MD, PhD y director de cuidados intensivos en el Emory University Hospital. “A travÃ©s de este nuevo sistema seremos capaces de analizar miles de puntos de datos y actuar en esos insights para tomar mejores decisiones sobre quÃ© paciente necesita inmediatamente nuestra atenciÃ³n y cÃ³mo tratarlo. Esto estÃ¡ haciendo que nuestro enfoque de cuidados intensivos sea mucho mÃ¡s inteligente”.

El software identifica patrones que pueden indicar complicaciones serias como sepsis, fallas en el corazÃ³n o neumonÃa, con el objetivo de proporcionar insights mÃ©dicos en tiempo real para que los mÃ©dicos actÃºen inmediatamente.

El Salis Lab de Penn State ayuda a los investigadores a desarrollar organismos sintÃ©ticos

Howard M. Salis, profesor asistente en el departamento de ingenierÃa quÃmica en la Penn State University, aprendiÃ³ como codificar y construir un portal web de alto rendimiento, el Salis Lab, que permite a los investigadores de los campos de ingenierÃa de biologÃa sintÃ©tica y metabÃ³lica usar los mÃ©todos computacionales para diseÃ±ar organismos sintÃ©ticos.

“Los microorganismos son los mejores quÃmicos del planeta Tierra”, anota Salir. “Si aprendemos como aprovecharlos, podemos desarrollar una gran cantidad o diversidad de productos. En el pasado, la ingenierÃa genÃ©tica era algo mÃ¡s como ensayo y error”.

En otras palabras, la ingenierÃa genÃ©tica era mÃ¡s como la propia selecciÃ³n natural, random y lenta, pero con una variedad de temas mucho mÃ¡s limitada.

“La biologÃa sintÃ©tica, por otro lado, es mÃ¡s como una disciplina de la ingenierÃa. Queremos cuantificar absolutamente todo. Desarrollamos modelos biofÃsicos que podemos usar para hacer predicciones cuantitativas sobre lo que va a pasar cuando el ADN mute de varias formas”, explica Salis.

La biologÃa sintÃ©tica involucra algoritmos extremadamente complejos, por eso el proyecto estÃ¡ ubicado en el AWS Elastic Compute Cloud, que puede escalar para arriba o para abajo segÃºn sea necesario. El nÃºmero de mutaciones posibles en una corta secuencia de ADN es mayor que el nÃºmero de Ã¡tomos en el universo. Salis Lab se ha convertido en el mÃ¡s popular con mÃ¡s de dos mil investigadores de biotecnologÃa diseÃ±ando mÃ¡s de treinta mil secuencias sintÃ©ticas de ADN a travÃ©s del portal web en los Ãºltimos dos aÃ±os.

Las aplicaciones para esto son tan variadas como la imaginaciÃ³n de los investigadores. Uno de los objetivos es descubrir una manera en la que desarrollar y hacer ingenierÃa con microorganismos que proporcionen una fuente de combustible competitiva en tÃ©rmino econÃ³micos al uso de combustibles fÃ³siles. Un caso de uso mÃ¡s mundano es desarrollar los pigmentos para los blue jeans.

Algo mÃ¡s sorprendente e increÃble es el poder predictivo al que los investigadores pueden acceder. “Usando nuestros modelos, podemos predecir la evoluciÃ³n”, seÃ±ala Salis. “Podremos simular el efecto de las mutaciones de ADN para predecir el probable curso de la evoluciÃ³n”.

Eventualmente, esto le va a permitir a los investigadores desarrollar microorganismos resistentes a la evoluciÃ³n.

Los posibles casos de uso de todo esto son asombrosos. Hay miles de millones de microorganismos en el mundo y cada uno tiene partes del genoma que podrÃamos poner potencialmente en uso y que nos beneficiarÃa. Es un gran reto de big data hacer una secuencia de esos genomas, cuantificarlos, catalogarlos y finalmente, predecir cÃ³mo combinarlos de maneras Ãºtiles. Sin embargo, es un reto que investigadores como Salis estÃ¡n listos para enfrentar y aprovechar.

La Global Insight Initiative de Georgetown aborda los “Grandes problemas”

La Global Insight Initiative de la Universidad de Georgetown recolecta datos de todo el mundo para ganar insights sobre tendencias sociales. Esta iniciativa analiza datos, pero primero necesita recolectarlos, organizarlos y luego empaquetarlos en grupos que respondan preguntas complejas.

“El mundo es un sistema realmente complejo. Hay siete mil millones de personas interactuando y compitiendo por recursos”, seÃ±ala J.C.Samrt, director de la Global Insight Initiative en la Universidad de Georgetown. El mundo tiene cuarenta mil ciudades, doce millones de millas de calles, ochocientos millones de autos, etc. “Entender cÃ³mo todos estos interactÃºan y cÃ³mo todos son dependientes de todos es un sistema muy complejo. Es un sistema de sistemas. Eso es big data, pero hablando del punto importante, cuando estÃ¡ mirando el planeta, es Big Knowledge o Gran Conocimiento.”

La Global Insight Initiative necesitaba herramientas de integraciÃ³n de datos para manejar tal cantidad de volumen de datos y mejorar sus bases de conocimiento. “La base de conocimiento, solo para darle un nÃºmero estimado de las cosas sobre las que estamos hablando, estamos hablando de mÃ¡s o menos un trillÃ³n de objetos y un cuatrillÃ³n de relaciones”, explica Smart.

Kapow Software trabajÃ³ con la Global Insight Initiative de la Universidad de Georgetown para automatizar la integraciÃ³n de los grandes volÃºmenes de datos con el fin de expandir la base de conocimiento de esta Iniciativa. Esto involucra el acceso a mÃ¡s de 20 mil pÃ¡ginas o fuentes de la web de 162 paÃses que representan 42 lenguas nativas para ver al planeta y obtener ese “Gran Conocimiento”. Antes de la automatizaciÃ³n, este proceso era tan intenso manualmente que necesitaba que doce personas estuvieran buscando, recolectado y organizando los documentos y otros artefactos de la web. DespuÃ©s de eso Â¿dÃ³nde encuentra el tiempo y recursos para analizar toda esa colecciÃ³n de informaciÃ³n?

La Global Insight Initiative usÃ³ el software de Kapow para crear flujos de datos automatizados integrados (puede pensar en esto como robots recolectores de informaciÃ³n). Una vez implementado, estos infobots permiten que un solo usuario (que no necesita tener ningÃºn tipo de habilidad especial) ejecute y maneje cientos de aplicaciones de integraciÃ³n de datos automatizados en cualquier momento para explorar una visiÃ³n integrada de lo que podrÃan ser datos salvajemente dispares.

Ahora, la Global Insight Initiative va a tratar de encontrar respuestas a problemas realmente grandes y difÃciles, como: Â¿cÃ³mo implementar mejor los recursos hÃdricos? Â¿CÃ³mo minimizar la propagaciÃ³n de enfermedades? Â¿CÃ³mo administrar y manejar la distribuciÃ³n de energÃa? Â¿CÃ³mo administrar o manejar ubicaciones de clÃnicas para garantizar el acceso del mayor nÃºmero posible de personas?, y Â¿CÃ³mo posicionar los recursos mÃ©dicos cuando ocurren desastres y catÃ¡strofes?

La ExpressPark busca cesar la congestiÃ³n y reducir la contaminaciÃ³n

El centro de la ciudad de Los Angeles ha venido experimentando un crecimiento significante durante la Ãºltima dÃ©cada, transformÃ¡ndose de una parte de la ciudad conocida por sus barrios a un lugar atractivo para el entretenimiento y los negocios. Sin embargo, junto con el crecimiento vienen tremendos problemas de trÃ¡fico. Debido a que los conductores buscan espacios libres para estacionar, dan vueltas alrededor de la manzana por mÃ¡s de treinta minutos.

“Estacionarse en el centro de Los Angeles se ha convertido en un juego caro de azar”, anota David Cummins, vicepresidente senior y director ejecutivo de soluciones de estacionamiento y justicia en Xerox.

Para empeorar las cosas, los precios de estacionamiento en la calle en los medidores raramente igualan la demanda. Los precios eran uniformes en un Ã¡rea dada y eran casi siempre los mismos o mÃ¡s baratos que los garajes que estaban a unas cuantas cuadras mÃ¡s allÃ¡. SegÃºn la investigaciÃ³n del profesor de UCLS Donal Shoup, tanto como el 74% de la congestiÃ³n en las Ã¡reas del centro de Los Angeles se deben a que los conductores siempre estÃ¡n buscando cuadrarse en la calle. En una ciudad donde la gente de por sÃ maneja demasiado, no hay ningÃºn tipo de incentivo para que los conductores se cuadren mÃ¡s lejos de lo que deberÃan.

Para satisfacer mejor la demanda y cesar o disminuir la congestiÃ³n, la ciudad le pidiÃ³ ayuda a Xerox para que desarrollara el sistema de parqueo LA ExpressPark. Xerox instalÃ³ sensores en cada uno de los espacios para detectar si alguno estaba libre. Luego, para alinear mejor el suministro con la demanda, Xerox desarrollÃ³ un algoritmo basado en un motor de fijaciÃ³n dinÃ¡mico de precios para aumentar las tarifas en las cuadras que estaban altamente ocupadas y unas mÃ¡s bajas en las cuadras vacÃas (para alentar a la gente a que saliera un poco de su ruta).

“Siempre me ha desconcertado el hecho que los angelinos preferirÃan darle vueltas a la cuadra por siempre antes de cuadrarse dos cuadrar mÃ¡s allÃ¡. Lo que nunca se me ocurriÃ³ es que parte del problema es falta de conocimiento. Si la gente supiera que estacionarse dos cuadras mÃ¡s allÃ¡ es mÃ¡s barato, la mayorÃa aprovecharÃa esa oportunidad”, anota Cummins.

Lo que pasÃ³ cuando el suministro y la demanda fueron alineados fue que las tarifas disminuyeron un 60% de metros, mientras estos incrementaron solo en un 20% de las tarifas. (Otros se quedaron igual).

Para dirigir a los conductores a esos espacios o estacionamientos vacÃos, nuevas seÃ±ales de mensajes han sido implementadas, seÃ±ales que pueden ser actualizadas automÃ¡ticamente mientras las condiciones cambias. La informaciÃ³n es tambiÃ©n compartida con aplicaciones de smartphone como Parker y Park Me, asÃ como tambiÃ©n con la pÃ¡gina web de L.A. City. Muy pronto, Xerox pretende incorporar todos los datos al sistema de navegaciÃ³n de los vehÃculos, los cuales dirigirÃ¡n automÃ¡ticamente a los conductores al estacionamiento libre mÃ¡s cercano a sus destinos, y quizÃ¡ hasta pagar automÃ¡ticamente por el derecho a estacionarse.

Los primeros resultados han sido prometedores. La ciudad se ha venido beneficiando por el incremento total del uso de las Ã¡reas menos ocupadas de la ciudad, y a pesar de que las tarifas son bajan, los ingresos han subido un 2%.

Mejor aÃºn, la congestiÃ³n ha comenzado a cesar y deberÃa mejorar mucho mÃ¡s a medida que los conductores descubren LA ExpressPark. “Los administradores de estacionamientos tienen ahora una inmediata y complete visibilidad de lo que estÃ¡ pasando en las calles y distritos de su ciudad, y pueden tomar decisiones basÃ¡ndose en los datos acerca de las estructuras de las tarifas y las colecciones de metros. La tecnologÃa emergente combina mÃºltiples proveedores – desde proveedores de procesamiento de violaciÃ³n de tickets hasta equipos de mantenimiento y recolecciÃ³n- para que todo estÃ© disponible y a tiempo para la autoridad del estacionamiento o parqueo. Usar los datos de esta forma mejora el rendimiento y crea ingresos adicionales”, explica Cummins.

Cummins nota que los primeros resultados del programa prueban que las decisiones basadas en datos pueden ayudar a cambiar la mala conducta de los conductores para reducir la congestiÃ³n y contaminaciÃ³n.

Jeff Vance, Network World EE.UU.

Secciones

Síguenos

Contenido Exclusivo

¡Ya está aquí la Revista Digital “Los Mejores 20 CISO de México 2025”!

¡Descarga la Revista Digital “Los Mejores 100 CIO de México 2025”!

“Los 100 Mejores CIO de MÃ©xico” celebran 20 AÃ±os de transformaciÃ³n y liderazgo Ã©tico

Secciones

Síguenos

Proyectos Big Data que pueden cambiar su vida

Lo Más Reciente

La revolución de la IA está haciendo al hardware más importante que nunca

Crecer ya no es contratar: el dilema de las empresas mexicanas en 2026

La nueva fiscalización digital convierte los datos en un activo estratégico

México 2026: fútbol, prime time y una audiencia hiperconectada

Newsletter

La revolución de la IA está haciendo al hardware más importante que nunca

Crecer ya no es contratar: el dilema de las empresas mexicanas en 2026

La nueva fiscalización digital convierte los datos en un activo estratégico

Acerca de CIO | EDIWORLD

Secciones