Entre una pléyade de alianzas, actualizaciones y lanzamientos dados a conocer en su evento anual re:Invent 2016, Amazon Web Services anunció su entrada al mercado de la Inteligencia Artificial (IA) con tres nuevas soluciones: Amazon Rekognition, Amazon Polly y Amazon Lex.
La nueva oferta de la compañía fue creada a fin de facilitar a desarrolladores la construcción de aplicaciones que puedan entender el lenguaje de un modo mucho más natural, con mayor precisión y calidad, permitiéndoles crear lo que la compañía denomina “aplicaciones de nueva generación”, capaces de ver, escuchar, hablar, entender e interactuar con personas, máquinas y objetos de su entorno.
En qué consiste cada solución
La primera de ellas es Rekognition que, como su nombre lo indica, es capaz de reconocer en una imagen el rostro de una persona, con la inteligencia suficiente para registrarla, incluso con características físicas cambiantes como una barba, cambio de corte de cabello e incluso si ésta porta lentes. Pero, a diferencia de herramientas similares, no sólo es capaz de reconocer personas, también lo hace con objetos y escenas dentro de una misma imagen, gracias a su Deep Learning.
Por lo que respecta a Amazon Polly, esta solución les permitirá a desarrolladores introducir sonidos y capacidades de habla a aplicaciones ya existentes basadas en texto, pensado para aplicaciones de noticias, libros, y similares, ya sea para personas que capacidades diferentes o simplemente para facilitar la interacción del usuario con este tipo de apps. De igual manera, puede ser utilizada para crear nuevas apps o introducirlas a objetos para que cubran la misma función.
Por su parte, Lex es un servicio para construir interfaces de conversación usando voz y texto. Está construido bajo la misma tecnología de Reconocimiento Automático del Habla (ASR, por sus siglas en inglés) y la tecnología de Entendimiento Natural del Habla (NLU) –constituida en el asistente de voz de Amazon, Alexa– permitiendo mantener conversaciones más realistas para prácticamente cualquier tipo de aplicación.
De acuerdo con información de la compañía, estos servicios de inteligencia artificial son “manejables”, de modo que el desarrollador no necesite de un gran número de algoritmos para poder desarrollar aplicaciones basadas en éstos, no requieren modelos de machine learning para entrenar y no se necesita invertir mucho capital en infraestructura para correrlos.
La IA que ofrece AWS con sus nuevos servicios está disponible para cualquier tipo de escala y aplicación, sin importar en qué dispositivo se desee implementar, o desde cualquier lugar, gracias a la combinación de mejores algoritmos, “lo cual permite un amplio acceso a grandes cantidades de datos”, de acuerdo con la compañía.
Abierta a desarrolladores
Aunque no se trata del primer contacto de Amazon en la IA –ya que las nuevas soluciones están basadas en la misma tecnología que utilizan de manera interna para, por ejemplo, predecir gustos de compras, y con su asistente de voz, Alexa–, sí es la primera vez que la compañía abre su tecnología y APIs para desarrolladores.
Por el momento son capacidades de IA disponibles sólo en inglés, pero esperan próximamente abrirlo a mayores idiomas, incluido el español. Polly estará en el mercado en el primer trimestre de 2017; Lex y Rekognition ya están disponibles.
-Karina Rodríguez, Computerworld México