Después de la cumbre histórica de desnuclearización donde participó el presidente de Estados Unidos, Donald Trump, y el lÃder norcoreano, Kim Jong-un, hace unas semanas, la no proliferación es una vez más un tema oportuno. ¿Cómo pueden los avances en el aprendizaje automático (machine learning), el análisis de datos y la Inteligencia Artificial ayudar a la no proliferación de este tipo de armamento?
Desde los albores de la era nuclear, vigilar quién tiene capacidades y materiales nucleares de grado militar ha sido una tarea vital y difÃcil. Afortunadamente, también es una labor que puede estar haciéndose más fácil, gracias a avances en campos como el análisis de datos, el aprendizaje automático y la Inteligencia Artificial.
Recientemente, los Thomson Reuters Labs fueron invitados a participar en un taller llamado “Aplicaciones de herramientas y tecnologÃas innovadoras para la no proliferación y el desarme” celebrado en Krems, Austria, para diplomáticos que representan a sus paÃses en la Agencia Internacional de EnergÃa Atómica (IAEA) y otras organizaciones internacionales. El taller diplomático estuvo precedido por una sesión de un dÃa de duración para participantes técnicos en el Centro de Viena para el Desarme y la No Proliferación.
El objetivo del taller fue ayudar a los diplomáticos que representan a sus paÃses en la IAEA y otras organizaciones de las Naciones Unidas involucradas en la no proliferación a comprender el estado de la tecnologÃa para monitorear la proliferación en el mundo.
Una sesión se centró en las nuevas capacidades para imágenes satelitales que ya empiezan a estar disponibles, incluso como inteligencia de código abierto. Otros se centraron en el aprendizaje automático y la Inteligencia Artificial.
En todos los casos, los diplomáticos están extremadamente preocupados por preservar la credibilidad de los mecanismos internacionales para mantener la no proliferación. Las limitaciones de cualquier tecnologÃa prometedora y las desventajas potenciales deben investigarse cuidadosamente; los errores en esta área son simplemente demasiado costosos. Las amenazas a la soberanÃa de la nación miembro también son extremadamente preocupantes.
El panel en el que participamos, “Datos de minerÃa, Aprendizaje automático y Análisis de datos”, se centró en la aplicación de tecnologÃa de vanguardia para el análisis de inteligencia de no proliferación. Nos enfocamos en la escala de los datos del conjunto de entrenamiento que se pueden aprovechar para diferentes tipos de flujos de trabajo de análisis o inteligencia orientados a la IA relevantes para la no proliferación. Los analistas de Thomson Reuters realizan una gran cantidad de tareas similares a las que realizan los analistas de la no proliferación de forma rutinaria. Muchos de estos son o pueden ser mejorados con el aprendizaje automático.
El aprendizaje automático consiste en aprender con el ejemplo. Una computadora se presenta con muchos, muchos ejemplos del fenómeno que se está entrenando para discernir, y “aprende” las regularidades estadÃsticas que distinguen los casos que caen bajo esa etiqueta de aquellos que no.
Las tareas de análisis son un caso de uso ideal para desarrollar capacidades de aprendizaje automático porque el registro histórico de análisis pasados ​​puede aprovecharse para entrenar a la máquina para realizar tareas similares, al menos en casos de rutina. Por ejemplo, las máquinas se pueden entrenar para categorizar imágenes por el tipo de vehÃculo representado, identificar cambios sutiles en escenas y otras tareas analÃticas. Para entrenar la máquina, se requieren cantidades crecientes de datos de entrenamiento.
Con datos de entrenamiento del orden de miles de ejemplos, es posible entrenar una computadora para distinguir entidades de ciertos tipos y categorizar texto por tema. Con niveles de datos de capacitación más cercanos a los millones, podemos entrenar a la máquina no sólo para identificar y categorizar elementos dentro del texto, sino también para aprender a especificar “¿y qué?”: ¿De qué trata este texto y por qué es relevante?
También deep learning puede contribuir
Si bien el resumen automático ha existido durante años, las técnicas anteriores han sido en gran medida extractivas. Los algoritmos de aprendizaje profundo (deep learning), junto con millones de ejemplos de resúmenes previos de textos, permiten que la máquina aprenda a producir resúmenes similares, donde el texto del resumen no se encuentra dentro del texto resumido en sà mismo. La máquina aprende qué tipo de resumen requiere el texto de origen mediante el análisis de millones de pares de textos fuente de ejemplo y resúmenes humanos. Entonces puede producir resultados similares. Sorprendentemente, nuestras evaluaciones han demostrado que los textos generados por máquina son más gramaticales en conjunto que los generados por el ser humano.
Los datos y la tecnologÃa pueden desempeñar un papel importante para hacer que los análisis sean más eficientes, incluso dentro de este dominio de la no proliferación en el que el mundo se encuentra actualmente enfocado.
Como ejemplo concreto, una solución tecnológica de gestión de comercio internacional, por ejemplo, puede brindar a su usuario toda la información necesaria para cumplir con las listas de control de exportaciones para control de armas y bienes de doble uso al categorizar las exportaciones y ayudarlas a mantener sus licencias de exportación.
Con máquinas incrementando la capacidad de los analistas humanos, tenemos una mejor oportunidad de analizar toda la información relevante y conectar todos los puntos entre los malos actores antes de que sea demasiado tarde.
________________
El autor de este artÃculo, Brian Ulicny, es miembro fundador y Director Senior de Thomson Reuters Labs, un laboratorio de innovación que trabaja en asociación con equipos internos, clientes y terceros, para desarrollar innovaciones basadas en la ciencia de los datos.
