- Gemini Ultra: modelo con mayor capacidad y tamaño para tareas complejas
- Gemini Pro: modelo diseñado para escalar una amplia gama de tareas
- Gemini Nano: modelo más eficiente para tareas en dispositivos móviles.
¿Qué es Gemini?
Se trata de un modelo de Inteligencia Artificial multimodal, lo que significa que puede generar y comprender, operar y combinar diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación.
También es el modelo más flexible de Google hasta el momento, capaz de ejecutarse eficientemente en cualquier dispositivo, desde móviles hasta centros de datos. Ofrece mejorar la forma en la que los clientes corporativos y desarrolladores construyen y escalan con IA.
- Basado en tecnología de última generación. Hasta el momento, el método estándar para crear modelos multimodales consistía en entrenar componentes separados para distintas modalidades, y luego unirlos para imitar a grandes rasgos algunas de sus funciones. A veces, estos modelos pueden ser buenos en determinadas tareas, como la descripción de imágenes, pero tienen algunas dificultades con el razonamiento más conceptual y complejo.
- Pruebas comparativas. Este nuevo modelo de IA se ha puesto a prueba, evaluando su rendimiento en una amplia variedad de tareas que abarcan desde la comprensión de imágenes naturales, audio y video, hasta codificación y el razonamiento matemático. Su desempeño supera 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de grandes modelos lingüísticos.
Gemini 1.0 se encontrará disponible en una serie de productos y plataformas:
Para usuarios
- Bard con Gemini Pro ya está disponible en inglés en más de 170 países y territorios. Esta herramienta será más capaz en cuestiones como comprender y resumir, razonar, generar ideas, escribir y planificar. Esta es la mayor mejora de calidad de Bard desde su lanzamiento.
- Gemini en Pixel. Pixel 8 Pro es el primer teléfono inteligente diseñado para ejecutar Gemini Nano que impulsa nuevas funciones como resumir en la aplicación de Grabadora e implementar Redacción Inteligente en Gboard, comenzando con WhatsApp, y el próximo año se incluirán más aplicaciones de mensajería.
- Gemini Ultra. Como parte de las verificaciones de confianza y seguridad de Google, se pondrá a disposición de clientes, desarrolladores, socios y expertos en seguridad y responsabilidad seleccionados para que experimenten y den su opinión antes de lanzarlo para desarrolladores y clientes corporativos, a principios del año que viene.
- Bard Advanced. Disponible a principios del 2024, se trata de una nueva experiencia de IA avanzada mediante la que podrá acceder a los mejores modelos y capacidades, comenzando por Gemini Ultra.
Google también está trabajando para que Gemini potencie otros productos como Search, Chrome, anuncios y Duet AI.
Para clientes y desarrolladores
- AI Studio es una herramienta web gratuita que ayuda a desarrolladores a prototipar y lanzar aplicaciones de manera rápida y sencilla.
- Vertex AI permite una personalización de Gemini con control total sobre los datos y suma los beneficios de Google Cloud como seguridad, privacidad, gobernanza de datos y compliance de nivel corporativo.