Contenido Exclusivo

VIDEO: Escalabilidad, seguridad y latencia: los 3 desafíos de la IA en redes de datos

Emilio Madero, Vicepresidente Ejecutivo de Marketing en Cirion Technologies,...

¿Cómo comunicar los riesgos de ciberseguridad al Consejo de Administración?

Los Consejos de Administración de las organizaciones deben comprender...

VIDEO: ¿Qué funciones desempeña un Chief Business Officer (CBO)?

¿Por qué es importante crear el puesto de CBO...

HP extiende al Big Data el uso del lenguaje R de programación

HP descubrió una forma para hacer funcionar los programas escritos en lenguaje estadístico R en los conjuntos de datos que se alojan en más de un servidor, preparando el camino hacia el análisis predictivo en tiempo real y a gran escala.

“Historicamente el uso del Big Data se ha focalizado siempre en el pasado”, afirmó Jeff Veis, vicepresidente de Marketing para la unidad de negocio de Big Data en HP. El nuevo software permitiría a las organizaciones “anticiparse a las nuevas tendencias” usando grandes conjuntos de datos, agregó.

En efecto, mientras que varios paquetes comerciales ofrecen diversas maneras de utilizar R en los clúster de computadoras, el nuevo Distributed R de HP es el primero en ofrecer esta capacidad en un paquete de código abierto, según el directivo.

Con millones de usuarios en todo el mundo, la fuente de código abierto R es uno de los lenguajes de programación más extendidos, al ser especialmente diseñado para análisis estadísticos y predictivos, junto a SAS, MatLab, Mathematica y un número de librerías Pynthon. La ejecución de R con grandes conjuntos de datos ha sido, sin embargo, un desafío, ya que funciona como una sola secuencia en las computadoras.

Esta aproximación limita la cantidad de datos que pueden ser analizados. Es por ello que, con frecuencia, los científicos de datos analizan sólo una muestra de los datos, y no la muestra entera, lo que potencialmente reduce la precisión del resultado.

El nuevo paquete de HP incluye un conjunto de algoritmos creados por los Laboratorios HP para la ejecución de R en múltiples computadoras a la vez, permitiendo el análisis de miles de millones de filas de datos. Tal aproximación permite analizar todo el conjunto de datos.

¿En qué consiste la solución?

En primer lugar, HP creó Distributed R para ser ejecutado en el sistema de bases de datos orientados en columnas de Vertica, creado para facilitar el análisis de terabytes de datos.

Distributed R ha sido lanzado bajo la versión 2 de la licencia de código abierto GPL y puede funcionar con otras bases de datos y plataformas de proceso añadidas a Vertica, como Hadoop. Además, es compatible con las herramientas de desarrollo R Studio y R console.

-Joab Jackson, IDG News Service

Lo Más Reciente

¿Qué es la componibilidad empresarial y por qué es el futuro de la banca?

Tanto en los negocios como a nivel personal, la...

VIDEO: Escalabilidad, seguridad y latencia: los 3 desafíos de la IA en redes de datos

Emilio Madero, Vicepresidente Ejecutivo de Marketing en Cirion Technologies,...

CDMX ya es el mercado de talento tecnológico más grande de América Latina

La Ciudad de México superó a Sao Paulo este año...

Preponderante estrangula inversiones telco en México

El agente económico preponderante en telecomunicaciones (AEP-T) en México,...

Newsletter

Recibe lo último en noticias e información exclusiva.

¿Qué es la componibilidad empresarial y por qué es el futuro de la banca?

Tanto en los negocios como a nivel personal, la única constante es el cambio. En ambos casos, nuestra capacidad de adaptación determina el éxito....

VIDEO: Escalabilidad, seguridad y latencia: los 3 desafíos de la IA en redes de datos

Emilio Madero, Vicepresidente Ejecutivo de Marketing en Cirion Technologies, expuso de qué manera su compañía está apoyando a las organizaciones con la infraestructura digital...

CDMX ya es el mercado de talento tecnológico más grande de América Latina

La Ciudad de México superó a Sao Paulo este año como el mercado de talento tecnológico más grande de América Latina, según el informe anual...