Projeto Nheengatu Digital: Inteligência Artificial Revitaliza Línguas Indígenas no Brasil e Garante Soberania Cultural
Parceria entre USP, IBM Research e comunidades originárias enfrenta complexidades técnicas e dilemas éticos para proteger e expandir o patrimônio linguístico brasileiro, do Nheengatu ao Alto Rio Negro.
A inteligência artificial (IA) emerge como uma ferramenta poderosa na luta pela preservação e revitalização de línguas indígenas no Brasil. O Projeto Nheengatu Digital, uma iniciativa conjunta da Universidade de São Paulo (USP), IBM Research e comunidades tradicionais, está na vanguarda desse movimento, buscando não apenas traduzir, mas garantir a soberania digital e cultural dos povos originários. Coordenado pelo professor Claudio Pinhanez, vice-diretor do Centro de Inteligência Artificial (C4AI) da USP, o projeto explora os desafios técnicos e éticos de aplicar a IA em contextos linguísticos e culturais tão ricos e complexos.
Desafios e Ética na Tradução por IA
A tarefa de revitalizar línguas como o Nheengatu por meio da IA não é trivial. Pinhanez aponta as intrincadas complexidades gramaticais que dificultam a tradução automática, exigindo abordagens inovadoras. Um dos maiores riscos é a reprodução de visões coloniais, preconceitos ou distorções sobre a realidade indígena, algo que o projeto busca ativamente evitar. Para garantir a qualidade das traduções, a equipe desenvolve métricas que valorizam o julgamento humano, indo além dos critérios estatísticos. O fenômeno das “alucinações” da IA – quando os sistemas inventam respostas plausíveis, mas incorretas – é combatido com a participação direta das comunidades indígenas, que atuam na validação e no aprimoramento das ferramentas.
Soberania Digital e Propriedade dos Dados
A discussão sobre “dados culturalmente tóxicos” é central para o Projeto Nheengatu Digital. Pinhanez alerta para o perigo de treinar modelos de IA com conteúdos que carregam vieses históricos, defendendo a autonomia e a propriedade dos dados pelas próprias comunidades. A soberania digital é um pilar fundamental: o objetivo é fortalecer a autossuficiência tecnológica dos povos originários, permitindo que eles não apenas utilizem, mas também desenvolvam e mantenham suas próprias ferramentas de IA. Isso inclui a criação de infraestruturas digitais locais e o uso de software em código aberto, como estratégia para reduzir a dependência de tecnologias externas e expandir o alcance da preservação linguística, mesmo em contextos com poucos recursos digitais escritos.
A IA Brasileira e a Formação Cultural
O Brasil ainda carece de modelos robustos de IA para o português, apesar de iniciativas como Sabiá e Maritaca. O C4AI da USP, com sua base de dados Carolina, está investindo na infraestrutura necessária, como a recente máquina com 96 GPUs, para avançar nesse campo. Pinhanez ressalta que trabalhar com línguas indígenas é também olhar para a própria formação cultural e linguística brasileira, lembrando a influência de línguas originárias no português falado no país. A estratégia inicial do projeto foi criar ferramentas digitais úteis às comunidades, incentivando a escrita e, assim, ampliando a produção de dados linguísticos. A colaboração técnica com os povos indígenas é feita com rigorosa proteção dos dados, garantindo que, enquanto o código é aberto, os dados pertencem e permanecem protegidos pelas comunidades.
O Futuro do Aldeamento Digital
Para Pinhanez, a criação de modelos brasileiros de IA é uma prioridade nacional, pois essas tecnologias refletem formas específicas de compreender o mundo, como exemplificado pela dificuldade de IAs estrangeiras em interpretar a vírgula decimal brasileira. O pesquisador defende uma política de “dados para o bem comum”, onde informações produzidas coletivamente pela sociedade devem gerar benefícios concretos à coletividade. O projeto visa promover o “aldeamento digital da internet”: a criação de espaços digitais autônomos para as comunidades indígenas, onde língua e cultura possam florescer. A iniciativa planeja expandir para novas etnias a partir de 2026, com foco em comunidades do Alto Rio Negro, no Amazonas, estimulando jovens indígenas a desenvolverem seus próprios nichos de trabalho e produção tecnológica, consolidando uma internet construída “por eles mesmos” e capaz de refletir a vasta riqueza cultural do Brasil.
Fonte: jornal.usp.br
