Sigo de cerca la carrera frenética de la inteligencia artificial. A veces parece que apenas entendemos una tecnologÃa cuando ya llega la siguiente. Recuerdo bien cuando, en 2022, apareció ChatGPT: un programa conversacional al que podÃamos preguntar casi cualquier cosa. No hacÃa milagros, pero era útil. TenÃa un lÃmite: solo respondÃa con lo que habÃa aprendido en su entrenamiento. Nada más.
Después, en 2023 y 2024, el panorama cambió. Los modelos comenzaron a procesar no solo texto, sino también imágenes, audios, videos. A eso lo llamaron “multimodalâ€. Más tarde surgieron los llamados Modelos de Protocolo de Contexto (MCP), conectores que permitÃan a los LLM “leer y escribir†en la computadora. Esto, aunque suene técnico, fue clave: abrió la puerta a que la IA dejara de ser solo un interlocutor y empezara a interactuar con nuestro entorno digital.
Y ahora estamos en otro nivel. El llamado modo agente. ¿Qué tiene de especial? Pues que ya no se limita a responder. Actúa. Un agente puede descomponer un objetivo grande en tareas pequeñas, usar varias herramientas, recordar lo que hizo antes y planificar lo que viene. Incluso puede ofrecerte un plan completo, editable, algo que antes sonaba a ciencia ficción.
Esto no es nuevo en informática. Los “agentes†existen desde hace décadas, pero con capacidades muy limitadas. Lo que cambia ahora es que, gracias a la inteligencia artificial generativa, estos programas son mucho más hábiles y, sobre todo, más útiles.
He probado cuatro plataformas que representan bien este salto. Primero está el modo agente de ChatGPT (OpenAI), ya disponible. Le pides que planee un viaje y en minutos compara vuelos, hoteles, restaurantes, atracciones… y te presenta opciones. Eso sÃ, la rapidez no es su fuerte y su costo de uso es alto, especialmente para empresas.
Luego conocà Manus, creada por una startup con raÃces en Singapur y China. Tiene buena autonomÃa, un precio accesible (unos 24 dólares al mes), aunque solo se accede por invitación y usa un solo modelo, lo que limita su alcance.
Por otro lado, está GensPak, una apuesta californiana que presume ser “multiagenteâ€: combina varios modelos para completar sus tareas. Según una comparativa del analista Jack Staley, resolvió una estrategia de mercado en cuatro minutos por 20 dólares, mientras ChatGPT tardó media hora y costó diez veces más.
Finalmente, está Minimax, un gigante con inversión china que empezó como un algoritmo de juegos. Ahora maneja 456 mil millones de parámetros y su “ventana de contexto†es tan grande que puede analizar libros enteros sin pestañear. Impresionante, aunque no está claro si ese tamaño se traduce en mejor desempeño o solo en números rimbombantes.
Estas cuatro plataformas son apenas la punta del iceberg. Si esto sigue asÃ, pronto tendremos asistentes digitales que no solo respondan, sino que decidan y actúen con nosotros. No sé si eso es emocionante o un poco inquietante. Pero algo es evidente: los agentes han llegado, y no parece que se vayan pronto.
El autor de la columna Tecnogobâ€, Rodrigo Sandoval Almazán, es Profesor de Tiempo Completo SNI Nivel 2 de la Universidad Autónoma del Estado de México. Lo puede contactar en tecnogob@pm.me y en la cuenta de Threads @horus72.
