• El programa informático de reconocimiento y síntesis de voz transcribe cualquier idioma en tiempo real
• Podría contribuir al rescate, preservación y difusión de los idiomas y variantes lingüísticas de nuestro país
En el Museo Nacional de Antropología se presentó el programa informático de reconocimiento y síntesis de voz denominado VoxArs, el cual fue desarrollado por el lingüista e inventor, Boris Fridman Mintz, con el objetivo de ofrecer una herramienta tecnológica que contribuya al rescate, preservación y difusión del patrimonio lingüístico, entre otros usos.
El proyecto es la “conjugación de la tecnología y la innovación vinculadas con el trabajo desde los pueblos indígenas y la academia para la defensa y fortalecimiento de las lenguas originarias”, refirió el director general del Instituto Nacional de Antropología e Historia (INAH), dependencia de la Secretaría de Cultura del Gobierno de México, Diego Prieto Hernández.
“El planteamiento es construir una empresa pública que pueda hacerse cargo de la promoción, instrumentación y la comercialización de este programa”, abundó el antropólogo.
En su intervención, Fridman Mintz, quien se ha desempeñado como investigador y profesor en el INAH, explicó que VoxArs es un modelo acústico de corte analítico, el único que existe con este enfoque. “No es simplemente una cuestión tecnológica, mi propósito fue modelar la percepción humana, así como permitir el acceso a esta tecnología al mayor número de personas”.
A su vez, el profesor investigador de la Dirección de Etnología y Antropología, Roberto Flores Ortiz, dijo que la propuesta está dirigida a instancias gubernamentales, interesadas en la creación de una empresa pública, VoxScripta, la cual ofrezca a las comunidades de hablantes, académicos, empresas y usuarios en general los servicios de reconocimiento y síntesis de voz que VoxArs promueve.
Se trata de una innovación tecnológica en el campo del procesamiento de voz, cuyo objetivo es contribuir a un uso más eficiente y amigable de los dispositivos computacionales, agregó.
A fin de estrechar lazos entre la academia y la industria, se busca implementar un área de investigación y desarrollo, que actualice constantemente el programa, al tiempo que impulse la creación de nuevas tecnologías, ahondó.
Este avance, destacó Flores Ortiz, abre la puerta a nuevas tecnologías de tratamiento automático de la voz, en áreas como la fonética, la gramática y la lexicografía, así como en aplicaciones de mecanismos de control, mediante la voz; al conocimiento y preservación del patrimonio lingüístico del país y de la lingüística forense, entre las más destacadas.
Los sistemas de Reconocimiento Automático de Habla (ASR, por sus siglas en inglés), de las transnacionales informáticas, refirió Fridman Mintz, “convierten los sonidos en letras, las cuales se agrupan en palabras, posteriormente, requieren otro modelo de lenguaje para la interpretación pragmática, semántica, gramatical y las enunciaciones en las que tales palabras ocurren.
“Se buscan patrones que se repitan en un listado alfabético, y la combinación de dichos patrones numéricos le permite al sistema buscar secuencias probables de representación alfabética para esos sonidos”, abundó.
A esa estructura se le llama modelo probabilístico, conformado por un listado de opciones fonéticas del habla, el cual “torna difícil el reconocimiento de neologismos, préstamos o palabras de variantes lingüísticas distintas a las registradas, por lo que dichos sistemas requieren personal especializado para realizar diversas actividades”, indicó el especialista.
La transcripción fonética en VoxArs funciona mediante un modelo acústico, en el cual se analiza la señal sonora, tomando muestras consecutivas de 0.1975 de segundo, de manera ininterrumpida, puntualizó.
Cada muestra, añadió Fridman Mintz, mide valores de frecuencia y amplitud que permiten identificar cada sonido o nota fonética, así como el tono y otros valores relevantes para la comunicación lingüística.
El programa de reconocimiento y procesamiento de voz, concluyó, fue calibrado y validado con la transcripción de 27 archivos de diferentes lenguas, tomados de la Asociación Fonética Internacional.
En el evento también se contó con la presencia del coordinador general de Patrimonio Cultural y Educación Indígena del Instituto Nacional de los Pueblos Indígenas, Gustavo Torres Cisneros.
Consulta los materiales del proyecto:
Drive:
https://drive.google.com/drive/folders/1BCs7duGIMqyE04OtMnciltJ0N4aUzfR6
iCloud:
https://www.icloud.com/iclouddrive/01bU0BJLPCxsKKbzyz35bbSpw#Spectral_analyses