Contenido Exclusivo

Aumentan la capacidad de sistemas mainframe IBM Z para uso de IA

IBM reveló detalles de la arquitectura de su próximo procesador Telum II y el acelerador IBM Spyre en Hot Chips 2024.

Ambas tecnologías son la apuesta del Gigante Azul para aumentar la capacidad de procesamiento en los sistemas mainframe IBM Z de próxima generación, lo que ayudaría a acelerar el uso de los modelos de Inteligencia Artificial (IA) tradicionales, así como los grandes modelos de lenguaje de IA.

Ya que muchos de los proyectos de IA generativa que aprovechan modelos de lenguaje grandes (LLM) pasan de la prueba de concepto a la producción, las demandas de soluciones energéticamente eficientes, seguras y escalables se han convertido en prioridades clave.

Una investigación de Morgan Stanley publicada en agosto proyecta que las demandas de energía de la IA generativa se dispararán un 75% anualmente durante los próximos años.

De acuerdo con la información proporcionada por IBM, entre las innovaciones presentadas destacan las siguientes:

  • Procesador IBM Telum II: El nuevo chip IBM presenta mayor frecuencia, capacidad de memoria, está diseñado para impulsar los sistemas IBM Z de próxima generación, cuenta con un crecimiento del 40% en caché y núcleo acelerador de IA integrado, así como una unidad de procesamiento de datos (DPU) conectada coherentemente en comparación con el chip Telum I. Se espera que el nuevo procesador admita soluciones informáticas empresariales para LLM y satisfaga las complejas necesidades de transacciones del sector.
  • Unidad de aceleración IO: una unidad de procesamiento de datos (DPU) completamente nueva en el chip de procesador Telum II, que está diseñada para acelerar los protocolos de E/S complejos para redes y almacenamiento en el mainframe. La DPU simplifica las operaciones del sistema y puede mejorar el rendimiento de los componentes clave.
  • Acelerador IBM Spyre: proporciona capacidad de procesamiento de IA adicional para complementar el procesador Telum II. Al trabajar juntos, los chips Telum II y Spyre forman una arquitectura escalable para soportar métodos conjuntos de modelado de IA: la práctica de combinar múltiples modelos de IA de aprendizaje automático o de aprendizaje profundo con LLM de codificador. Al aprovechar las fortalezas de cada arquitectura de modelo, los modelos de conjunto pueden proporcionar resultados más precisos y sólidos en comparación con los modelos individuales. El chip acelerador IBM Spyre se entregará como una opción complementaria. Cada chip acelerador está conectado a través de un adaptador PCIe de 75 vatios y se basa en tecnología desarrollada en colaboración con el IBM Research AI Hardware Center. Al igual que con otras tarjetas PCIe, el acelerador Spyre es escalable para adaptarse a las necesidades del cliente.

Cabe señalar que tanto el procesador Telum II como el acelerador IBM Spyre están fabricados por Samsung Foundry y están construidos sobre su nodo de proceso de 5 nm de alto rendimiento y eficiencia energética.

La potencia de procesamiento combinada anunciada hoy para la aplicación de casos de uso de IA generativa, como la detección de fraudes en el cobre de seguros, la prevención del lavado de dinero y la implementación acelerada de asistentes de inteligencia artificial.

Especificaciones y métricas de rendimiento

El Procesador Telum II ofrece ocho núcleos de alto rendimiento que funcionan a 5.5 GHz, con 36 MB de caché L2 por núcleo y un aumento del 40 % en la capacidad de caché en el chip para un total de 360 MB. El caché de nivel 4 virtual de 2.88 GB por cajón de procesador proporciona un aumento del 40 % respecto a la generación anterior.

El acelerador de IA integrado permite una inferencia de IA de alto rendimiento y baja latencia en las transacciones. Esto puede mejorar la detección de fraudes durante las transacciones financieras, y proporciona un aumento de cuatro veces en la capacidad de cómputo por chip en comparación con la generación anterior, según IBM.

Por su parte, la nueva unidad de aceleración de E/S (DPU) está integrada en el chip Telum II. Está diseñado para mejorar el manejo de datos con una densidad de E/S aumentada en un 50 %. Este avance mejora la eficiencia general y la escalabilidad de IBM Z, lo que les confiere un diseño pensado para manejar las cargas de trabajo de IA a gran escala y las aplicaciones intensivas en datos de las empresas actuales, concluyó la compañía.

Lo Más Reciente

Realizan el segundo Foro de Talento en Data Centers

La Asociación Mexicana de Data Centers, MEXDC, realizó el...

Cinco tendencias del sector retail para 2025

El sector retail en México y América Latina ha...

Microsoft presenta innovaciones en IA durante Ignite 2024

En los últimos tres años, los ataques cibernéticos basados...

Newsletter

Recibe lo último en noticias e información exclusiva.

Chivas Rayadas del Guadalajara consigue gestionar sus activos de TI de manera más eficiente

El Club Deportivo Guadalajara es uno de los más importantes en México. Con más de 500 colaboradores, requería herramientas para auditar su parque informático,...

Realizan el segundo Foro de Talento en Data Centers

La Asociación Mexicana de Data Centers, MEXDC, realizó el Foro de Talento 2024 "Construyendo el Futuro Digital en México" por segundo año consecutivo, al...

Cinco tendencias del sector retail para 2025

El sector retail en México y América Latina ha acelerado su transformación, impulsado por la adopción de nuevas tecnologías y la necesidad de adaptarse...