Contenido Exclusivo

¿Cómo comunicar los riesgos de ciberseguridad al Consejo de Administración?

Los Consejos de Administración de las organizaciones deben comprender...

VIDEO: ¿Qué funciones desempeña un Chief Business Officer (CBO)?

¿Por qué es importante crear el puesto de CBO...

¡Última semana para postularse! Los Mejores 20 CISO de México 2024

CIO Ediworld le invita a participar en la tercera edición...

Aumentan la capacidad de sistemas mainframe IBM Z para uso de IA

IBM reveló detalles de la arquitectura de su próximo procesador Telum II y el acelerador IBM Spyre en Hot Chips 2024.

Ambas tecnologías son la apuesta del Gigante Azul para aumentar la capacidad de procesamiento en los sistemas mainframe IBM Z de próxima generación, lo que ayudaría a acelerar el uso de los modelos de Inteligencia Artificial (IA) tradicionales, así como los grandes modelos de lenguaje de IA.

Ya que muchos de los proyectos de IA generativa que aprovechan modelos de lenguaje grandes (LLM) pasan de la prueba de concepto a la producción, las demandas de soluciones energéticamente eficientes, seguras y escalables se han convertido en prioridades clave.

Una investigación de Morgan Stanley publicada en agosto proyecta que las demandas de energía de la IA generativa se dispararán un 75% anualmente durante los próximos años.

De acuerdo con la información proporcionada por IBM, entre las innovaciones presentadas destacan las siguientes:

  • Procesador IBM Telum II: El nuevo chip IBM presenta mayor frecuencia, capacidad de memoria, está diseñado para impulsar los sistemas IBM Z de próxima generación, cuenta con un crecimiento del 40% en caché y núcleo acelerador de IA integrado, así como una unidad de procesamiento de datos (DPU) conectada coherentemente en comparación con el chip Telum I. Se espera que el nuevo procesador admita soluciones informáticas empresariales para LLM y satisfaga las complejas necesidades de transacciones del sector.
  • Unidad de aceleración IO: una unidad de procesamiento de datos (DPU) completamente nueva en el chip de procesador Telum II, que está diseñada para acelerar los protocolos de E/S complejos para redes y almacenamiento en el mainframe. La DPU simplifica las operaciones del sistema y puede mejorar el rendimiento de los componentes clave.
  • Acelerador IBM Spyre: proporciona capacidad de procesamiento de IA adicional para complementar el procesador Telum II. Al trabajar juntos, los chips Telum II y Spyre forman una arquitectura escalable para soportar métodos conjuntos de modelado de IA: la práctica de combinar múltiples modelos de IA de aprendizaje automático o de aprendizaje profundo con LLM de codificador. Al aprovechar las fortalezas de cada arquitectura de modelo, los modelos de conjunto pueden proporcionar resultados más precisos y sólidos en comparación con los modelos individuales. El chip acelerador IBM Spyre se entregará como una opción complementaria. Cada chip acelerador está conectado a través de un adaptador PCIe de 75 vatios y se basa en tecnología desarrollada en colaboración con el IBM Research AI Hardware Center. Al igual que con otras tarjetas PCIe, el acelerador Spyre es escalable para adaptarse a las necesidades del cliente.

Cabe señalar que tanto el procesador Telum II como el acelerador IBM Spyre están fabricados por Samsung Foundry y están construidos sobre su nodo de proceso de 5 nm de alto rendimiento y eficiencia energética.

La potencia de procesamiento combinada anunciada hoy para la aplicación de casos de uso de IA generativa, como la detección de fraudes en el cobre de seguros, la prevención del lavado de dinero y la implementación acelerada de asistentes de inteligencia artificial.

Especificaciones y métricas de rendimiento

El Procesador Telum II ofrece ocho núcleos de alto rendimiento que funcionan a 5.5 GHz, con 36 MB de caché L2 por núcleo y un aumento del 40 % en la capacidad de caché en el chip para un total de 360 MB. El caché de nivel 4 virtual de 2.88 GB por cajón de procesador proporciona un aumento del 40 % respecto a la generación anterior.

El acelerador de IA integrado permite una inferencia de IA de alto rendimiento y baja latencia en las transacciones. Esto puede mejorar la detección de fraudes durante las transacciones financieras, y proporciona un aumento de cuatro veces en la capacidad de cómputo por chip en comparación con la generación anterior, según IBM.

Por su parte, la nueva unidad de aceleración de E/S (DPU) está integrada en el chip Telum II. Está diseñado para mejorar el manejo de datos con una densidad de E/S aumentada en un 50 %. Este avance mejora la eficiencia general y la escalabilidad de IBM Z, lo que les confiere un diseño pensado para manejar las cargas de trabajo de IA a gran escala y las aplicaciones intensivas en datos de las empresas actuales, concluyó la compañía.

Lo Más Reciente

Plataforma Getin AI predice “cuántas personas visitarán una tienda y cuánto se venderá”

¿Se puede anticipar el número de clientes que llegarán...

La Transformación Digital Genera Valor para Fabricantes y Clientes en la Industria Automotriz

La industria automotriz está experimentando una revolución impulsada por...

Veeam nombró a Niraj Tolia como director de tecnología

Veeam nombró a Niraj Tolia como director de tecnología...

Guía básica para resolver conflictos laborales de forma efectiva

Los conflictos son una de esas situaciones incómodas y...

Newsletter

Recibe lo último en noticias e información exclusiva.

Plataforma Getin AI predice “cuántas personas visitarán una tienda y cuánto se venderá”

¿Se puede anticipar el número de clientes que llegarán a una tienda en días lluviosos, semanas o incluso meses antes? Getin, empresa proveedora de...

La Transformación Digital Genera Valor para Fabricantes y Clientes en la Industria Automotriz

La industria automotriz está experimentando una revolución impulsada por la transformación digital, donde los avances tecnológicos están remodelando no solo el diseño de vehículos,...

Veeam nombró a Niraj Tolia como director de tecnología

Veeam nombró a Niraj Tolia como director de tecnología (CTO), quien se une a esta firma tras la adquisición de Alcion, una startup de...