A pesar de que los sistemas como Hadoop y Spark pueden trabajar con grandes cantidades de datos, sus herramientas para analizar esta información de manera eficiente y en tiempo real son aún limitadas. SpaceCurve, una startup de dos años de antigüedad de Seattle, lanzó un nuevo sistema de bases de datos dirigido a acelerar el proceso de analizar los datos orientados a la localización a medida que son generados.
“Nos encontramos en una posición como para fusionar los datos espaciales, algo que es muy complejo y difícil de hacer”, sostuvo Dane Coyer, CEO de SpaceCurve. El software puede “ingestar continuamente grandes volúmenes de datos geoespaciales”, y permitir a los usuarios consultar y monitorear la información.
Alrededor del 80% de los datos tiene algún tipo de componente geoespacial, estimó la firma de análisis TI Gartner. Aun así son pocas las herramientas de software empresarial que se encuentran equipadas para sacar provecho de estos datos, sostuvo Coyer.
Las bases de datos tradicionales e incluso los nuevos sistemas de procesamiento de big data en realidad no se encuentran optimizados para analizar rápidamente estos datos, a pesar de que la mayoría de los sistemas tienen algún soporte geoespacial. Y, a pesar de que no faltan sistemas de información geográfica, éstos no se encuentran equipados para manejar los inmensos volúmenes de datos de sensores que podrían producir las redes de sensores tipo ‘Internet de las Cosas’, afirmó Coyer.
El equipo de desarrollo de SpaceCurve desarrolló un conjunto de algoritmos de computación geométrica que simplifica el análisis de los datos geográficos. Ellos también construyeron el motor de base de datos principal desde cero, y lo diseñaron para correr en varios servidores en paralelo.
Como consecuencia, SpaceCurve, a diferencia de los sistemas de big data como Hadoop, puede realizar consultas en flujos de datos en tiempo real, y hacerlo a una parte del costo de los sistemas de análisis in memory como TimesTen de Oracle, afirmó Coyer.
El software puede tener una amplia gama de usos, indicó el ejecutivo. Las firmas de telecomunicaciones podrían usar la tecnología para monitorear el movimiento de sus usuarios en tiempo real. También se puede usar para administrar el tsunami de datos de sensores provenientes de sistemas remotos.
Como ejemplo de las capacidades del sistema, Coyer mostró la forma en que SpaceCurve podría presentar una visualización en tiempo real de un vehículo viajando por el tráfico de la ciudad de Seattle junto con resúmenes demográficos de los viajeros, usando información de logs de las torres celulares y uniendo esos datos con las estadísticas de la Oficina de Censos de Estados Unidos.
SpaceCurve puede trabajar con datos que han sido empaquetados de varias formas, incluyendo los formatos REST (Representational State Transfer), JSON (JavaScript Object Notation) y ArcGIS de Esri.
“Cuando uno considera algún tipo de tecnología que le permite a uno usar información geográfica para optimizar procesos y crear eficiencias, uno tendrá muchos casos de casos de uso que tienen un buen retorno a la inversión”, sostuvo Tom Petrocelli, que es director de investigación que cubre las aplicaciones empresariales sociales, móviles y de nube para la firma de análisis Neuralytix.
En este campo, el diferenciador de SpaceCurve podría ser la combinación del volumen de datos que el software puede manejar con sus capacidades de análisis en tiempo real. Un sistema de este tipo puede establecer el camino para campañas de marketing móvil de gran escala que podrían permitir que una persona sepa de un remate mientras camina por la tienda, sostuvo Petrocelli.
– Joab Jackson, IDG News Service