Aumentan la capacidad de sistemas mainframe IBM Z para uso de IA

IBM reveló detalles de la arquitectura de su próximo procesador Telum II y el acelerador IBM Spyre en Hot Chips 2024.

Ambas tecnologías son la apuesta del Gigante Azul para aumentar la capacidad de procesamiento en los sistemas mainframe IBM Z de próxima generación, lo que ayudaría a acelerar el uso de los modelos de Inteligencia Artificial (IA) tradicionales, así como los grandes modelos de lenguaje de IA.

Ya que muchos de los proyectos de IA generativa que aprovechan modelos de lenguaje grandes (LLM) pasan de la prueba de concepto a la producción, las demandas de soluciones energéticamente eficientes, seguras y escalables se han convertido en prioridades clave.

Una investigación de Morgan Stanley publicada en agosto proyecta que las demandas de energía de la IA generativa se dispararán un 75% anualmente durante los próximos años.

De acuerdo con la información proporcionada por IBM, entre las innovaciones presentadas destacan las siguientes:

Procesador IBM Telum II: El nuevo chip IBM presenta mayor frecuencia, capacidad de memoria, está diseñado para impulsar los sistemas IBM Z de próxima generación, cuenta con un crecimiento del 40% en caché y núcleo acelerador de IA integrado, así como una unidad de procesamiento de datos (DPU) conectada coherentemente en comparación con el chip Telum I. Se espera que el nuevo procesador admita soluciones informáticas empresariales para LLM y satisfaga las complejas necesidades de transacciones del sector.
Unidad de aceleración IO: una unidad de procesamiento de datos (DPU) completamente nueva en el chip de procesador Telum II, que está diseñada para acelerar los protocolos de E/S complejos para redes y almacenamiento en el mainframe. La DPU simplifica las operaciones del sistema y puede mejorar el rendimiento de los componentes clave.
Acelerador IBM Spyre: proporciona capacidad de procesamiento de IA adicional para complementar el procesador Telum II. Al trabajar juntos, los chips Telum II y Spyre forman una arquitectura escalable para soportar métodos conjuntos de modelado de IA: la práctica de combinar múltiples modelos de IA de aprendizaje automático o de aprendizaje profundo con LLM de codificador. Al aprovechar las fortalezas de cada arquitectura de modelo, los modelos de conjunto pueden proporcionar resultados más precisos y sólidos en comparación con los modelos individuales. El chip acelerador IBM Spyre se entregará como una opción complementaria. Cada chip acelerador está conectado a través de un adaptador PCIe de 75 vatios y se basa en tecnología desarrollada en colaboración con el IBM Research AI Hardware Center. Al igual que con otras tarjetas PCIe, el acelerador Spyre es escalable para adaptarse a las necesidades del cliente.

Cabe señalar que tanto el procesador Telum II como el acelerador IBM Spyre están fabricados por Samsung Foundry y están construidos sobre su nodo de proceso de 5 nm de alto rendimiento y eficiencia energética.

La potencia de procesamiento combinada anunciada hoy para la aplicación de casos de uso de IA generativa, como la detección de fraudes en el cobre de seguros, la prevención del lavado de dinero y la implementación acelerada de asistentes de inteligencia artificial.

Especificaciones y métricas de rendimiento

El Procesador Telum II ofrece ocho núcleos de alto rendimiento que funcionan a 5.5 GHz, con 36 MB de caché L2 por núcleo y un aumento del 40 % en la capacidad de caché en el chip para un total de 360 MB. El caché de nivel 4 virtual de 2.88 GB por cajón de procesador proporciona un aumento del 40 % respecto a la generación anterior.

El acelerador de IA integrado permite una inferencia de IA de alto rendimiento y baja latencia en las transacciones. Esto puede mejorar la detección de fraudes durante las transacciones financieras, y proporciona un aumento de cuatro veces en la capacidad de cómputo por chip en comparación con la generación anterior, según IBM.

Por su parte, la nueva unidad de aceleración de E/S (DPU) está integrada en el chip Telum II. Está diseñado para mejorar el manejo de datos con una densidad de E/S aumentada en un 50 %. Este avance mejora la eficiencia general y la escalabilidad de IBM Z, lo que les confiere un diseño pensado para manejar las cargas de trabajo de IA a gran escala y las aplicaciones intensivas en datos de las empresas actuales, concluyó la compañía.

Secciones

Síguenos

Contenido Exclusivo

La IA que no asusta

Descargue gratis el estudio: Gestión de la ciberseguridad y seguridad de la información en organizaciones ubicadas en México en 2024 y sus tendencias en...

Estudio de Exploración: Desarrollo e impacto actual de las TIC en organizaciones ubicadas en México y las tendencias que se proyectan para 2025

Secciones

Síguenos

Aumentan la capacidad de sistemas mainframe IBM Z para uso de IA

Especificaciones y métricas de rendimiento

Lo Más Reciente

Cinco mejores prácticas de ciberseguridad en el marco del “Día Mundial de Internet”

Asistente de IA por WhatsApp recupera facturas en minutos

Diseñan jardín interactivo con IA que convierte señales de abejas en arte inmersivo

De edificio a sistema inteligente: así evolucionan los centros de datos

Newsletter

Cinco mejores prácticas de ciberseguridad en el marco del “Día Mundial de Internet”

Asistente de IA por WhatsApp recupera facturas en minutos

Diseñan jardín interactivo con IA que convierte señales de abejas en arte inmersivo

Acerca de CIO | EDIWORLD

Secciones