Proyectos Big Data

La mayoría de tendencias sobrevaloradas salen del mercado o dejan de funcionar muy rápidamente, lo que debería hacer que los escépticos se preocupen sobre el tema de Big Data. Sin embargo, aunque Big Data está siendo promocionada como la nueva e innovadora tendencia que va a cambiar el mundo, los escépticos no están siendo tan escépticos como lo eran con la nube y el tema social.

Esto es probablemente porque Big Data está generando ganancias reales para las compañías que la han adoptado. Desde ya, la analítica de Big Data está comenzando a cambiar esas disciplinas disparatadas como la investigación farmacéutica, ventas y marketing y desarrollo de producto.

Muchos casos de uso, como las ciudades inteligentes y los carros sin conductor, nos emocionan y nos hablan sobre un mundo alrededor de nosotros que parece anticipar nuestras necesidades. Esos escenarios podrían ser el futuro de Big Data, pero no son el ahora.

“Hay una gran diferencia entre lo que es tecnológicamente factible y lo que es práctico”, señala Don DeLoaxh, CEO de Infobright, una compañía de análisis de datos. “Mire a las dos tendencias que conducen Big Data: la Internet de las Cosas (IoC) y la comunicación de máquina a máquina (M2M).Ambas han estado ahí por un largo tiempo, pero la creciente sofisticación de los sensores y la disminución de precios correspondiente, más la proliferación de varias opciones de comunicación inalámbrica, significa que lo que alguna vez fue tecnológicamente posible en teoría, se está convirtiendo posible en la práctica”, añade.

Algunos de nuestros sueños de Big Data más ambiciosos no han entrado en lo practico todavía. La tecnología está ahí para un carro sin conductor, pero la infraestructura todavía no existe.

“Si quiere hacerle seguimiento y saber todo lo que está pasando con Big Data, simplemente siga al dinero”, anota DeLoach. “Es donde el ROI (retorno sobre la inversión) es más obvio, donde las gente invertirá”, y vaya que si han invertido.

El ROI o para Big Data en los temas de salud, telemática de vehículos y marketing online ya está lo suficientemente claro. Sin embargo, esto no significa que eventualmente no vamos a ver carros sin conductor y ciudades súper inteligentes; solo significa que todavía no son lo suficientemente prácticas como para atraer grandes inversiones.

Aquí les explicamos cinco proyectos de Big Data que están entre la línea de lo que es práctico y lo que es posible, y estos proyectos o algunos como ellos, podrían cambiar fácilmente nuestras vidas:

El proyecto del genoma humano revoluciona la medicina

Cuando el proyecto del genoma humano fue dado a conocer en 1990, no lo veíamos como un proyecto de Big Data, pero eso era lo que era. Para el momento en que el genoma humano completo fue mapeado en el 2003, algunos de los precursores del movimiento Big Data ya habían comenzado a filtrarse en el mundo de la tecnología.

Así que no es para nada sorprendente que los sectores de salud y farmacéutica sean los dos primeros en adoptar agresivamente las herramientas de Big Data, ya que cuentan con una trayectoria de éxito.

El proyecto del genoma humano ha ilustrado también una clase de Ley de Moore de Big Data. Ya puede obtener una foto incompleta, pero útil de su genoma de sitios como 23andMe por cien dólares o menos, y la presión para bajar el costo de mapear su genoma personal completo por el mismo precio ya está en camino. Los precios han caído o bajado todos los años. Puede mapear su genoma completo por entre mil y cinco mil dólares. Antes, en el 2007, esto le hubiera costado como un millón de dólares.

Las nuevas empresas como Life Technologies (adquirida recientemente por Thermo Fisher Scientific) e InVitae están haciendo lo mejor que pueden para hacer que el mapeo del genoma sea algo a lo que todos puedan acceder, lo que llevaría a tratamientos personalizados para todo, desde el cáncer hasta artritis reumatoide.

El Emory University Hospital e IBM, están desarrollando un ICU del futuro

Emory University Hospital está usando un software de IBM y Excel Media Electronics (EME) para un proyecto de investigación que tiene como objetivo crear atención médica avanzada y predictiva para pacientes críticos o graves a través de análisis en tiempo real.

Emory está probando un nuevo sistema que puede identificar patrones en datos fisiológicos para alertar inmediatamente a los clínicos sobre los signos de daños en los pacientes. En un ICU típico, una docena de diferentes corrientes de datos médicos aparecen en pantallas al costado de la cama del paciente-incluyendo la fisiología del corazón, la respiración, presión sanguínea y las ondas cerebrales. Esta constante información sobre los signos vitales es transmitida como ondas y números, y mostradas en pantallas de computadoras al lado de cada cama. Actualmente, depende de los doctores y las enfermeras el hecho de procesar y analizar rápidamente toda esta información para tomar decisiones médicas.

Hoy en día, cualquier pequeña desviación de la norma, que podría ser algún signo de alerta temprano, normalmente pasa desapercibido.

El sistema piloteado por Emory, usa BedMaster EX de EME, IBM InfoSphere Streams, y el motor analítico de Emory para recolectar y analizar los datos fisiológicos de los pacientes en tiempo real. El nuevo sistema permitirá que los clínicos adquieran, analicen y correlacionen datos médicos más rápidamente de lo que hubieran soñado años atrás.

“Acceder y dibujar insights de datos en tiempo real puede significar la vida y la muerte para un paciente”, anota Tim Buchman, MD, PhD y director de cuidados intensivos en el Emory University Hospital. “A través de este nuevo sistema seremos capaces de analizar miles de puntos de datos y actuar en esos insights para tomar mejores decisiones sobre qué paciente necesita inmediatamente nuestra atención y cómo tratarlo. Esto está haciendo que nuestro enfoque de cuidados intensivos sea mucho más inteligente”.

El software identifica patrones que pueden indicar complicaciones serias como sepsis, fallas en el corazón o neumonía, con el objetivo de proporcionar insights médicos en tiempo real para que los médicos actúen inmediatamente.

El Salis Lab de Penn State ayuda a los investigadores a desarrollar organismos sintéticos

Howard M. Salis, profesor asistente en el departamento de ingeniería química en la Penn State University, aprendió como codificar y construir un portal web de alto rendimiento, el Salis Lab, que permite a los investigadores de los campos de ingeniería de biología sintética y metabólica usar los métodos computacionales para diseñar organismos sintéticos.

“Los microorganismos son los mejores químicos del planeta Tierra”, anota Salir. “Si aprendemos como aprovecharlos, podemos desarrollar una gran cantidad o diversidad de productos. En el pasado, la ingeniería genética era algo más como ensayo y error”.

En otras palabras, la ingeniería genética era más como la propia selección natural, random y lenta, pero con una variedad de temas mucho más limitada.

“La biología sintética, por otro lado, es más como una disciplina de la ingeniería. Queremos cuantificar absolutamente todo. Desarrollamos modelos biofísicos que podemos usar para hacer predicciones cuantitativas sobre lo que va a pasar cuando el ADN mute de varias formas”, explica Salis.

La biología sintética involucra algoritmos extremadamente complejos, por eso el proyecto está ubicado en el AWS Elastic Compute Cloud, que puede escalar para arriba o para abajo según sea necesario. El número de mutaciones posibles en una corta secuencia de ADN es mayor que el número de átomos en el universo. Salis Lab se ha convertido en el más popular con más de dos mil investigadores de biotecnología diseñando más de treinta mil secuencias sintéticas de ADN a través del portal web en los últimos dos años.

Las aplicaciones para esto son tan variadas como la imaginación de los investigadores. Uno de los objetivos es descubrir una manera en la que desarrollar y hacer ingeniería con microorganismos que proporcionen una fuente de combustible competitiva en término económicos al uso de combustibles fósiles. Un caso de uso más mundano es desarrollar los pigmentos para los blue jeans.

Algo más sorprendente e increíble es el poder predictivo al que los investigadores pueden acceder. “Usando nuestros modelos, podemos predecir la evolución”, señala Salis. “Podremos simular el efecto de las mutaciones de ADN para predecir el probable curso de la evolución”.

Eventualmente, esto le va a permitir a los investigadores desarrollar microorganismos resistentes a la evolución.

Los posibles casos de uso de todo esto son asombrosos. Hay miles de millones de microorganismos en el mundo y cada uno tiene partes del genoma que podríamos poner potencialmente en uso y que nos beneficiaría. Es un gran reto de big data hacer una secuencia de esos genomas, cuantificarlos, catalogarlos y finalmente, predecir cómo combinarlos de maneras útiles. Sin embargo, es un reto que investigadores como Salis están listos para enfrentar y aprovechar.

La Global Insight Initiative de Georgetown aborda los “Grandes problemas”

La Global Insight Initiative de la Universidad de Georgetown recolecta datos de todo el mundo para ganar insights sobre tendencias sociales. Esta iniciativa analiza datos, pero primero necesita recolectarlos, organizarlos y luego empaquetarlos en grupos que respondan preguntas complejas.

“El mundo es un sistema realmente complejo. Hay siete mil millones de personas interactuando y compitiendo por recursos”, señala J.C.Samrt, director de la Global Insight Initiative en la Universidad de Georgetown. El mundo tiene cuarenta mil ciudades, doce millones de millas de calles, ochocientos millones de autos, etc. “Entender cómo todos estos interactúan y cómo todos son dependientes de todos es un sistema muy complejo. Es un sistema de sistemas. Eso es big data, pero hablando del punto importante, cuando está mirando el planeta, es Big Knowledge o Gran Conocimiento.”

La Global Insight Initiative necesitaba herramientas de integración de datos para manejar tal cantidad de volumen de datos y mejorar sus bases de conocimiento. “La base de conocimiento, solo para darle un número estimado de las cosas sobre las que estamos hablando, estamos hablando de más o menos un trillón de objetos y un cuatrillón de relaciones”, explica Smart.

Kapow Software trabajó con la Global Insight Initiative de la Universidad de Georgetown para automatizar la integración de los grandes volúmenes de datos con el fin de expandir la base de conocimiento de esta Iniciativa. Esto involucra el acceso a más de 20 mil páginas o fuentes de la web de 162 países que representan 42 lenguas nativas para ver al planeta y obtener ese “Gran Conocimiento”. Antes de la automatización, este proceso era tan intenso manualmente que necesitaba que doce personas estuvieran buscando, recolectado y organizando los documentos y otros artefactos de la web. Después de eso ¿dónde encuentra el tiempo y recursos para analizar toda esa colección de información?

La Global Insight Initiative usó el software de Kapow para crear flujos de datos automatizados integrados (puede pensar en esto como robots recolectores de información). Una vez implementado, estos infobots permiten que un solo usuario (que no necesita tener ningún tipo de habilidad especial) ejecute y maneje cientos de aplicaciones de integración de datos automatizados en cualquier momento para explorar una visión integrada de lo que podrían ser datos salvajemente dispares.

Ahora, la Global Insight Initiative va a tratar de encontrar respuestas a problemas realmente grandes y difíciles, como: ¿cómo implementar mejor los recursos hídricos? ¿Cómo minimizar la propagación de enfermedades? ¿Cómo administrar y manejar la distribución de energía? ¿Cómo administrar o manejar ubicaciones de clínicas para garantizar el acceso del mayor número posible de personas?, y ¿Cómo posicionar los recursos médicos cuando ocurren desastres y catástrofes?

La ExpressPark busca cesar la congestión y reducir la contaminación

El centro de la ciudad de Los Angeles ha venido experimentando un crecimiento significante durante la última década, transformándose de una parte de la ciudad conocida por sus barrios a un lugar atractivo para el entretenimiento y los negocios. Sin embargo, junto con el crecimiento vienen tremendos problemas de tráfico. Debido a que los conductores buscan espacios libres para estacionar, dan vueltas alrededor de la manzana por más de treinta minutos.

“Estacionarse en el centro de Los Angeles se ha convertido en un juego caro de azar”, anota David Cummins, vicepresidente senior y director ejecutivo de soluciones de estacionamiento y justicia en Xerox.

Para empeorar las cosas, los precios de estacionamiento en la calle en los medidores raramente igualan la demanda. Los precios eran uniformes en un área dada y eran casi siempre los mismos o más baratos que los garajes que estaban a unas cuantas cuadras más allá. Según la investigación del profesor de UCLS Donal Shoup, tanto como el 74% de la congestión en las áreas del centro de Los Angeles se deben a que los conductores siempre están buscando cuadrarse en la calle. En una ciudad donde la gente de por sí maneja demasiado, no hay ningún tipo de incentivo para que los conductores se cuadren más lejos de lo que deberían.

Para satisfacer mejor la demanda y cesar o disminuir la congestión, la ciudad le pidió ayuda a Xerox para que desarrollara el sistema de parqueo LA ExpressPark. Xerox instaló sensores en cada uno de los espacios para detectar si alguno estaba libre. Luego, para alinear mejor el suministro con la demanda, Xerox desarrolló un algoritmo basado en un motor de fijación dinámico de precios para aumentar las tarifas en las cuadras que estaban altamente ocupadas y unas más bajas en las cuadras vacías (para alentar a la gente a que saliera un poco de su ruta).

“Siempre me ha desconcertado el hecho que los angelinos preferirían darle vueltas a la cuadra por siempre antes de cuadrarse dos cuadrar más allá. Lo que nunca se me ocurrió es que parte del problema es falta de conocimiento. Si la gente supiera que estacionarse dos cuadras más allá es más barato, la mayoría aprovecharía esa oportunidad”, anota Cummins.

Lo que pasó cuando el suministro y la demanda fueron alineados fue que las tarifas disminuyeron un 60% de metros, mientras estos incrementaron solo en un 20% de las tarifas. (Otros se quedaron igual).

Para dirigir a los conductores a esos espacios o estacionamientos vacíos, nuevas señales de mensajes han sido implementadas, señales que pueden ser actualizadas automáticamente mientras las condiciones cambias. La información es también compartida con aplicaciones de smartphone como Parker y Park Me, así como también con la página web de L.A. City. Muy pronto, Xerox pretende incorporar todos los datos al sistema de navegación de los vehículos, los cuales dirigirán automáticamente a los conductores al estacionamiento libre más cercano a sus destinos, y quizá hasta pagar automáticamente por el derecho a estacionarse.

Los primeros resultados han sido prometedores. La ciudad se ha venido beneficiando por el incremento total del uso de las áreas menos ocupadas de la ciudad, y a pesar de que las tarifas son bajan, los ingresos han subido un 2%.

Mejor aún, la congestión ha comenzado a cesar y debería mejorar mucho más a medida que los conductores descubren LA ExpressPark. “Los administradores de estacionamientos tienen ahora una inmediata y complete visibilidad de lo que está pasando en las calles y distritos de su ciudad, y pueden tomar decisiones basándose en los datos acerca de las estructuras de las tarifas y las colecciones de metros. La tecnología emergente combina múltiples proveedores – desde proveedores de procesamiento de violación de tickets hasta equipos de mantenimiento y recolección- para que todo esté disponible y a tiempo para la autoridad del estacionamiento o parqueo. Usar los datos de esta forma mejora el rendimiento y crea ingresos adicionales”, explica Cummins.

Cummins nota que los primeros resultados del programa prueban que las decisiones basadas en datos pueden ayudar a cambiar la mala conducta de los conductores para reducir la congestión y contaminación.

Jeff Vance, Network World EE.UU.

Secciones

Síguenos

Contenido Exclusivo

¡Convocatoria Abierta! “Los Mejores 20 CISO de México 2025”

La IA que no asusta

Descargue gratis el estudio: Gestión de la ciberseguridad y seguridad de la información en organizaciones ubicadas en México en 2024 y sus tendencias en...

Secciones

Síguenos

Proyectos Big Data que pueden cambiar su vida

Lo Más Reciente

Ciberseguridad: Clave para el crecimiento del comercio electrónico

Más de 184 millones de credenciales expuestas en una base desprotegida

Brecha de habilidades y escasez de talento limitan el crecimiento de la industria TIC

Crece en México la demanda de agentes de IA para dar servicio y soporte al cliente: CISCO

Newsletter

Ciberseguridad: Clave para el crecimiento del comercio electrónico

Más de 184 millones de credenciales expuestas en una base desprotegida

Brecha de habilidades y escasez de talento limitan el crecimiento de la industria TIC

Acerca de CIO | EDIWORLD

Secciones