SAP continua fusionando su plataforma de base de datos in memory HANA con su software de almacenamiento de datos Business Warehouse, con la más reciente actualización que añade soporte para los servicios de carga de datos en tiempo real de HANA.
Las compañías con grandes almacenes de datos generalmente cargan conjuntos de información en momentos que no sean pico, como en los trabajos en lote nocturnos. Pero con la disponibilidad general de Business Warehouse 7.4, los servicios de “acceso inteligente a datos” de HANA pueden trabajar con cualquier fuente dentro o fuera de una compañía de acuerdo a las necesidades. SAP llama a este enfoque “infraestructura de datos in memory”.
Los servicios en realidad no mueven físicamente los datos a Business Warehouse; más bien las fuentes objetivo son vistas como tablas virtuales. Estos servicios proporcionan un acceso más amplio a los conjuntos de datos, así como la capacidad de mantener a los datos a los que más frecuentemente se accede dentro del core data warehouse, mientras que se accede a los que se necesita solo ocasionalmente cuando se desee.
SAP ha estado promocionando la base de datos IQ que obtuvo con la adquisición de Sybase como una opción ideal para trabajar con esos conjuntos de datos “fríos”.
El acceso a los datos en tiempo real también ayuda a los usuarios de Business Warehouse a generar mejores reportes de inteligencia de negocios, afirmó Neil McGovern, director senior de marketing de productos e innovación de SAP. “Uno siempre obtiene los datos más recientes porque se tiene contacto con la fuente”.
Los data warehouses monolíticos y centralizados “ya no son viables”, añadió Ken Tsai, vicepresidente de Hana y marketing de gestión de productos e innovación de datos de SAP.
Aun así, SAP está ansioso de mostrar la escalabilidad de Hana y Business Warehouse. SAP recientemente anunció que había ganado el Record Mundial Guinness por el almacén de datos más grande del mundo. Construyó un sistema de 12 petabytes en Amazon Web Services que abarcan 111 instancias de HANA.
Los queries en el clúster corrieron en 330 milisegundos, en comparación con los 250 milisegundos para una sola instancia, “demostrando la capacidad para escalar en gran medida con poco impacto en el desempeño”, afirmó SAP.
-Chris Kanaracus, IDG News Service