Universidade Federal do Ceará cria ferramenta de manutenção de idioma descendente do Tupi Guarani

Compartilhe

Os pesquisadores têm estruturado a tradução do antigo idioma “nheengatu” — a língua geral amazônica (LGA) —, único idioma vivo descendente do tupi antigo.

O objetivo da pesquisa é salvar a língua estudada da extinção. O equipamento utilizado nos trabalhos da UFC permite a investigação da estrutura gramatical da língua, e amplia suas possibilidades de tradução. De acordo com os professores à frente do estudo, o nheegatu tem apenas 6 mil falantes no Brasil e 8 mil na Colômbia, por isso, o idioma se encontra em risco de acabar. Sob essa perspectiva, o grupo de pesquisa Computação e Linguagem Natural (COMPLIN) tenta preservar a memória e ampliar o conhecimento sobre esse tupi moderno.

Pesquisa da UFC tenta resgatar antiga língua Tupi à beira da extinção (Foto: divulgação),

Assim, foi elaborado o Nheentiquetador, um etiquetador morfossintático (programa que reconhece a categoria da palavra) do nheengatu. O grupo trabalha agora na criação de um analisador sintático automático (programa que entende a palavra no contexto da frase), que dará mais precisão às traduções automáticas do GrammYEP.

O grupo começou, há três anos, a aplicar os estudos da linguística computacional ao nheengatu focado sobretudo no português. De acordo com o líder da pesquisa, professor Leonel Figueiredo de Alencar Araripe, “ainda não havia nada em termos de ferramentas e recursos para o processamento computacional da LGA, apesar de sua importância histórica, cultural e linguística”, explica.

Araripe conclui que, “a primeira ferramenta criada foi o GrammYEP, o tradutor automático pioneiro em uma língua indígena brasileira. Entretanto, para avançar na qualidade e no escopo dessas traduções, foi preciso criar uma nova ferramenta, com a função de organizar as classes gramaticais das palavras. O GrammYEP foi concluído em 2020, e traduz textos simples com sentenças que expressam qualidades, estados e localizações de pessoas e objetos, levando em conta os padrões gramaticais e a semântica (isto é, o significado das palavras e frases) do tupi moderno”, pontua.

A ferramenta traduz a LGA para o português e o inglês, e também traduz do nheengatu para as duas línguas. Agora, o projeto está sendo expandido para que a tradução seja permitida entre a língua indígena e outros 30 idiomas.

Você pode gostar...

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Skip to content