En el marco del CES 2024, NVIDIA presentó microservicios de producción para NVIDIA Avatar Cloud Engine (ACE) que permiten a los desarrolladores de videojuegos, herramientas y middleware integrar modelos de IA generativa en los avatares digitales de juegos y aplicaciones.
Los nuevos microservicios NVIDIA ACE permiten a los desarrolladores crear avatares interactivos para múltiples funciones y herramientas utilizando modelos de IA como NVIDIA Audio2Face (A2F), que crea animaciones faciales expresivas a partir de fuentes de audio, y NVIDIA Riva Automatic Speech Recognition (ASR), para crear aplicaciones personalizables de habla y traducción multilingüe utilizando IA generativa.
“Las tecnologías de IA generativa están transformando prácticamente todo lo que hacemos. NVIDIA ACE ofrece nuevas posibilidades a los desarrolladores al agregar realismo a los personajes digitales y eliminando la necesidad de diálogos preestablecidos.”, afirma Keita Iida, vicepresidente de relaciones con los desarrolladores en NVIDIA.
IA generativa para PCs y estaciones de trabajo RTX
La compañía también presentó las GPU de escritorio GeForce RTX SUPER, que ofrecen un mayor rendimiento para la IA generativa al integrarse a los nuevos equipos portátiles de IA de los principales fabricantes, y las nuevas herramientas y software de IA acelerados por NVIDIA RTX para desarrolladores y usuarios.
NVIDIA ofrece ahora estas herramientas para mejorar las experiencias de PC con IA generativa: aceleración NVIDIA TensorRT del popular modelo Stable Diffusion XL para flujos de trabajo de texto a imagen; NVIDIA RTX Remix con herramientas de textura de IA generativa; y por supuesto, microservicios NVIDIA ACE.
Además, NVIDIA TensorRT-LLM (TRT-LLM), una biblioteca de código abierto que optimiza el rendimiento de inferencia de los últimos modelos de lenguaje de gran tamaño (LLM), ahora admite más modelos preoptimizados para PC. Acelerado por TRT-LLM, Chat with RTX, una demo tecnológica de NVIDIA que también se publica este mes, permite a los entusiastas de la IA interactuar con sus notas, documentos y otros contenidos.
Ejecutar IA generativa localmente en un PC es fundamental para aplicaciones sensibles a la privacidad, la latencia y costos. Requiere una amplia base de sistemas preparados para la IA, así como las herramientas de desarrollo adecuadas para ajustar y optimizar los modelos de IA para la plataforma de PC. Para satisfacer estas necesidades, NVIDIA impulsa nuevas experiencias con una serie de actualizaciones y herramientas.
Las GPUs NVIDIA RTX están diseñadas para liberar el potencial de la IA generativa en las PC. Los núcleos tensoriales de estas GPU aceleran el rendimiento de la IA en las aplicaciones más exigentes para el trabajo y el tiempo libre. Las nuevas tarjetas gráficas de la serie GeForce RTX 40 SUPER, también anunciadas en CES, incluyen las GeForce RTX 4080 SUPER, 4070 Ti SUPER y 4070 SUPER para ofrecer un mayor rendimiento en IA.
Las estaciones de trabajo móviles con GPU RTX pueden ejecutar el software NVIDIA AI Enterprise, que incluye TensorRT y NVIDIA RAPIDS para simplificar y asegurar el desarrollo de inteligencia artificial generativa y ciencia de datos.
De igual manera, se presentó NVIDIA AI Workbench, un conjunto de herramientas unificadas e intuitivas para ayudar a los desarrolladores a crear, probar y personalizar modelos de IA generativa y LLM pre entrenados con un rendimiento y un consumo de memoria propios de un PC.
Los proyectos se pueden escalar a prácticamente cualquier lugar, ya sea el centro de datos, una nube pública o NVIDIA DGX Cloud, y luego traer de vuelta a los sistemas RTX locales en un PC o estación de trabajo para la inferencia y la personalización ligera.
Después de crear modelos de IA para casos de uso en PC, los desarrolladores pueden optimizarlos utilizando NVIDIA TensorRT para aprovechar al máximo los tensor cores de las GPUs RTX.