Facebook poderá traduzir até 100 idiomas sem usar inglês
O Facebook desenvolveu o primeiro modelo de tradução automática multilíngue, capaz de traduzir até 100 idiomas sem utilizar o inglês como intermediário. O sistema, batizado de M2M-100, utiliza inteligência artificial.
Segundo a assistente de pesquisa do Facebook, Angela Fan, isso é um importante passo em direção a um modelo universal que compreenda todos os idiomas em diferentes tarefas. A empresa ainda não divulgou informações de quando o modelo será implementado. Até o momento, a tecnologia é apenas um projeto de pesquisa.
Como o estudo foi realizado
Inicialmente, a equipe de pesquisadores coletou da internet 7,5 bilhões de pares de frases em 100 línguas diferentes, dando prioridade às traduções mais solicitadas pelos internautas.
Em seguida, os idiomas foram separados em 14 grupos, com base em semelhanças linguísticas, geográficas e culturais. Um desses grupos, por exemplo, inclui línguas comuns da Índia, como hindi, bengali e marata. Para facilitar o entendimento das pessoas, a equipe decidiu criar pontes de tradução.
No caso das línguas indianas, o hindi, bengali e tâmil serviram como intermediárias para as indo-arianas. Com essa técnica, a empresa diz que superou os sistemas centrados em inglês em 10 pontos na métrica BLEU, que avalia traduções automáticas, alcançado a marca de 20,1.
“Ao traduzir, digamos, de chinês para francês, a maioria dos modelos multilíngues centrados em inglês treinam de chinês para inglês e de inglês para francês, porque os dados de treinamento em inglês estão amplamente disponíveis”, explicou Angela Fan. “Nosso modelo treina diretamente em dados chineses para franceses para preservar melhor o significado.”
Apesar de ainda não ter sido incorporado ao Facebook, onde usuários postam conteúdo em mais de 160 línguas, testes realizados pela equipe indicam que o modelo pode suportar uma grande variedade de traduções.
Deixe uma resposta
Você precisa fazer o login para publicar um comentário.