IBM anunció el lanzamiento de Granite 3.0, la tercera generación de su familia de modelos de Inteligencia Artificial (IA).
Se trata de los modelos de lenguaje Granite 3.0 8B y 2B, diseñados para la IA empresarial, que pueden emplear en tareas como la regeneración aumentada de recuperación (RAG), clasificación, resumen, extracción de entidades y uso de herramientas. Se trata de modelos que se pueden ajustar a los datos empresariales e integrarse en “cualquier entorno empresarial o flujo de trabajo”.
Se informó que IBM ofrecerá una indemnización de propiedad intelectual (IP) para todos los modelos Granite en watsonx.ai, lo que permite a los clientes empresariales tener mayor confianza al combinar sus datos con estos modelos.
La familia Granite 3.0 fue presentada en el evento TechXchange e incluye:
- Propósito general/Lenguaje: Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base.
- Barreras de protección y seguridad: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B.
- Mixture of Experts (MoE): Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base, Granite 3.0 1B A400M Base.
Según IBM, esta tercera generación de modelos Granite se ha entrenado con más de 12 billones de tokens de datos a partir de 12 lenguajes naturales y 116 lenguajes de programación diferentes, utilizando un método de entrenamiento en dos fases que aprovecha los resultados de varios miles de experimentos diseñados para optimizar la calidad y la selección de datos y los parámetros de entrenamiento.
Para finales de año, se espera que los modelos lingüísticos 8B y 2B también incluyan soporte para una ventana de contexto extendida de 128K y capacidades de comprensión multimodal de documentos.
Granite Guardian 3.0: la nueva era de la IA responsable
Como parte de este lanzamiento, IBM también liberó una nueva familia de modelos Granite Guardian que permiten a los desarrolladores de aplicaciones implementar barreras de seguridad mediante la comprobación de los avisos al usuario y las respuestas LLM para detectar una variedad de riesgos.
Además de las dimensiones de daño, como prejuicios sociales, odio, toxicidad, blasfemia, violencia, técnicas de jailbreak, etc., estos modelos también proporcionan una serie de comprobaciones específicas de regeneración aumentada de recuperación (RAG), como el fundamento, la relevancia del contexto y la relevancia de la respuesta.
Asimismo, los modelos Granite Guardian pueden utilizarse para implementar medidas de seguridad junto a cualquier modelo de IA, ya sea abierto o propietario.
IBM informó que toda la suite de modelos Granite 3.0 y los modelos actualizados series temporales están disponibles para su descarga en Hugging Face bajo la licencia permisiva Apache 2.0. Las variantes instructivas de los nuevos modelos lingüísticos Granite 3.0 8B y 2B y los modelos Granite Guardian 3.0 estarán disponibles desde esta semana para uso comercial en la plataforma watsonx de IBM. También estará disponible una selección de modelos Granite 3.0 como microservicios NVIDIA NIM y a través de las integraciones Vertex AI Model Garden de Google Cloud con Hugging Face.