El Instituto Politécnico Nacional (IPN) desarrolló una aplicación móvil para el registro de las lenguas indígenas mexicanas, denominada INDLEX (Indigenous lexicon).
El desarrollo de este proyecto, el cual se encuentra a cargo de alumnos pertenecientes al Laboratorio de Lenguaje Natural y Procesamiento de Texto del Centro de Investigación en Computación (CIC), innovará en el uso de las tecnologías por su aplicación en la recolección y documentación sistematizada de las lenguas indígenas mexicanas en sus versiones vivas.
Al respecto, Christian Efraín Maldonado Sifuentes, responsable técnico del equipo, informó: “INDLEX brindará opciones para tomar fotos, subir imágenes representativas del vocablo traducido, así como la oportunidad de grabar audios propios con la pronunciación de cada palabra y hacer seguimiento de la evolución de los alfabetos. Los investigadores de campo tendrán métodos de trabajo más efectivos y modernos para interactuar con las comunidades de hablantes, sistematizar y compartir vocabularios con el resto de la comunidad científica”.
Existen 68 lenguas indígenas en México que suman más de 7 millones de hablantes y 25 millones de personas que se identifican con dichos grupos lingüísticos aún sin hablar la lengua. Asimismo, las lenguas indígenas han sido reconocidas por la UNESCO como “herencia insustituible para la humanidad y […] un patrimonio invaluable para la sociedad”. Debido a falta de mecanismos efectivos para su documentación, estas lenguas se encuentran en declive y alto riesgo de extinción.
Christian Efraín Maldonado Sifuentes explicó: “en este proyecto utilizaremos técnicas de programación novedosas que permitan brindar a los hablantes bilingües –indígena/español–, una manera sencilla y rápida de registrar traducciones, y realizar anotaciones de multimedia en su lengua y variante indígena.
La información recolectada por INDLEX servirá a investigadores de humanidades y de inteligencia artificial que requieran mayores recursos léxicos y desarrollar tecnologías del lenguaje en beneficio de las comunidades indígenas de México.
En el mundo existen cerca de 7000 lenguas habladas y se estima que la mitad están en peligro de desaparecer en el transcurso de este siglo. Por ello se han desarrollado esfuerzos como los de Broadwell et al, 2020 y Harrison et al 2019, para el rescate de las lenguas en peligro de desaparecer.
Christian Efraín Maldonado Sifuentes precisó que existen iniciativas de otros países, tales como living dictionaries o living tongues con tecnologías para la documentación sistemática de lenguas, “sin embargo en México carecemos de ello aún y queda en evidencia en los repositorios de talking dictionaries, living dictionaries, qué son las tecnologías extranjeras las tienen mayor disponibilidad de recursos lingüísticos de lenguas indígenas mexicanas que las que tenemos en nuestros sistemas nacionales, y mientras nuestras lenguas originarias siguen a la espera de mayor atención tecnológica para el rescate de este importante patrimonio nacional”.
La aplicación INDLEX busca simplificar la recolección de traducciones de palabras y recursos multimedia representados en múltiples lenguas indígenas de México y sus más de 360 variantes lingüísticas. Permitirá interfaz sencilla y amigable para ser usada por cualquier persona bilingüe (indígena/español); operar en condiciones de baja conectividad, o utilizar la app sin conexión a internet empleando tecnología de sincronización de datos; implementar una base de datos abierta que almacene múltiples traducciones de cada vocablo por lengua y variante, permitiendo la expresión natural de los hablantes; desarrollar un sistema multi-usuario para que diversos hablantes puedan trabajar con un solo dispositivo. Asimismo, fácil acceso a los datos para que investigadores de diferentes áreas y disciplinas puedan hacer uso de los mismos con fines académicos y de preservación de lenguas.