Contenido Exclusivo

¿Quiénes son los Mejores 20 CISO de México 2024?

La noche del pasado viernes 27 de septiembre CIO...

VIDEO: Escalabilidad, seguridad y latencia: los 3 desafíos de la IA en redes de datos

Emilio Madero, Vicepresidente Ejecutivo de Marketing en Cirion Technologies,...

Aumentan la capacidad de sistemas mainframe IBM Z para uso de IA

IBM reveló detalles de la arquitectura de su próximo procesador Telum II y el acelerador IBM Spyre en Hot Chips 2024.

Ambas tecnologías son la apuesta del Gigante Azul para aumentar la capacidad de procesamiento en los sistemas mainframe IBM Z de próxima generación, lo que ayudaría a acelerar el uso de los modelos de Inteligencia Artificial (IA) tradicionales, así como los grandes modelos de lenguaje de IA.

Ya que muchos de los proyectos de IA generativa que aprovechan modelos de lenguaje grandes (LLM) pasan de la prueba de concepto a la producción, las demandas de soluciones energéticamente eficientes, seguras y escalables se han convertido en prioridades clave.

Una investigación de Morgan Stanley publicada en agosto proyecta que las demandas de energía de la IA generativa se dispararán un 75% anualmente durante los próximos años.

De acuerdo con la información proporcionada por IBM, entre las innovaciones presentadas destacan las siguientes:

  • Procesador IBM Telum II: El nuevo chip IBM presenta mayor frecuencia, capacidad de memoria, está diseñado para impulsar los sistemas IBM Z de próxima generación, cuenta con un crecimiento del 40% en caché y núcleo acelerador de IA integrado, así como una unidad de procesamiento de datos (DPU) conectada coherentemente en comparación con el chip Telum I. Se espera que el nuevo procesador admita soluciones informáticas empresariales para LLM y satisfaga las complejas necesidades de transacciones del sector.
  • Unidad de aceleración IO: una unidad de procesamiento de datos (DPU) completamente nueva en el chip de procesador Telum II, que está diseñada para acelerar los protocolos de E/S complejos para redes y almacenamiento en el mainframe. La DPU simplifica las operaciones del sistema y puede mejorar el rendimiento de los componentes clave.
  • Acelerador IBM Spyre: proporciona capacidad de procesamiento de IA adicional para complementar el procesador Telum II. Al trabajar juntos, los chips Telum II y Spyre forman una arquitectura escalable para soportar métodos conjuntos de modelado de IA: la práctica de combinar múltiples modelos de IA de aprendizaje automático o de aprendizaje profundo con LLM de codificador. Al aprovechar las fortalezas de cada arquitectura de modelo, los modelos de conjunto pueden proporcionar resultados más precisos y sólidos en comparación con los modelos individuales. El chip acelerador IBM Spyre se entregará como una opción complementaria. Cada chip acelerador está conectado a través de un adaptador PCIe de 75 vatios y se basa en tecnología desarrollada en colaboración con el IBM Research AI Hardware Center. Al igual que con otras tarjetas PCIe, el acelerador Spyre es escalable para adaptarse a las necesidades del cliente.

Cabe señalar que tanto el procesador Telum II como el acelerador IBM Spyre están fabricados por Samsung Foundry y están construidos sobre su nodo de proceso de 5 nm de alto rendimiento y eficiencia energética.

La potencia de procesamiento combinada anunciada hoy para la aplicación de casos de uso de IA generativa, como la detección de fraudes en el cobre de seguros, la prevención del lavado de dinero y la implementación acelerada de asistentes de inteligencia artificial.

Especificaciones y métricas de rendimiento

El Procesador Telum II ofrece ocho núcleos de alto rendimiento que funcionan a 5.5 GHz, con 36 MB de caché L2 por núcleo y un aumento del 40 % en la capacidad de caché en el chip para un total de 360 MB. El caché de nivel 4 virtual de 2.88 GB por cajón de procesador proporciona un aumento del 40 % respecto a la generación anterior.

El acelerador de IA integrado permite una inferencia de IA de alto rendimiento y baja latencia en las transacciones. Esto puede mejorar la detección de fraudes durante las transacciones financieras, y proporciona un aumento de cuatro veces en la capacidad de cómputo por chip en comparación con la generación anterior, según IBM.

Por su parte, la nueva unidad de aceleración de E/S (DPU) está integrada en el chip Telum II. Está diseñado para mejorar el manejo de datos con una densidad de E/S aumentada en un 50 %. Este avance mejora la eficiencia general y la escalabilidad de IBM Z, lo que les confiere un diseño pensado para manejar las cargas de trabajo de IA a gran escala y las aplicaciones intensivas en datos de las empresas actuales, concluyó la compañía.

Lo Más Reciente

Seis recomendaciones para lograr la verdadera transformación digital en su empresa

Actualmente, vivimos en mundo globalizado que se caracteriza por...

La IA “impacta la ciberseguridad en el sector público”, advierten

Contar con Inteligencia Artificial (IA) disminuye las posibilidades de...

¿Qué acciones realizar para que las nuevas generaciones permanezcan en las empresas?

En un entorno laboral cada vez más competitivo, atraer...

Ocho de cada 10 personas están dispuestas a boicotear a una compañía: estudio YouGov

¿Qué tan activistas se consideran los consumidores? De acuerdo...

Newsletter

Recibe lo último en noticias e información exclusiva.

Seis recomendaciones para lograr la verdadera transformación digital en su empresa

Actualmente, vivimos en mundo globalizado que se caracteriza por ser cambiante, veloz y tecnológico, donde la digitalización, los conocimientos técnicos y la implementación de...

La IA “impacta la ciberseguridad en el sector público”, advierten

Contar con Inteligencia Artificial (IA) disminuye las posibilidades de un ataque, o al menos reduce el impacto que puede tener un ataque. Los ciberataques son...

¿Qué acciones realizar para que las nuevas generaciones permanezcan en las empresas?

En un entorno laboral cada vez más competitivo, atraer y conservar a los Millennials y a la Generación Z se ha convertido en unos...