Facebook poderá traduzir até 100 idiomas sem usar inglês

O Facebook desenvolveu o primeiro modelo de tradução automática multilíngue, capaz de traduzir até 100 idiomas sem utilizar o inglês como intermediário. O sistema, batizado de M2M-100, utiliza inteligência artificial.

Segundo a assistente de pesquisa do Facebook, Angela Fan, isso é um importante passo em direção a um modelo universal que compreenda todos os idiomas em diferentes tarefas. A empresa ainda não divulgou informações de quando o modelo será implementado. Até o momento, a tecnologia é apenas um projeto de pesquisa.

Como o estudo foi realizado

Fonte:  Facebook/Divulgação 

Inicialmente, a equipe de pesquisadores coletou da internet 7,5 bilhões de pares de frases em 100 línguas diferentes, dando prioridade às traduções mais solicitadas pelos internautas.

Em seguida, os idiomas foram separados em 14 grupos, com base em semelhanças linguísticas, geográficas e culturais. Um desses grupos, por exemplo, inclui línguas comuns da Índia, como hindi, bengali e marata. Para facilitar o entendimento das pessoas, a equipe decidiu criar pontes de tradução.

No caso das línguas indianas, o hindi, bengali e tâmil serviram como intermediárias para as indo-arianas. Com essa técnica, a empresa diz que superou os sistemas centrados em inglês em 10 pontos na métrica BLEU, que avalia traduções automáticas, alcançado a marca de 20,1. 

Comparação entre o novo modelo de tradução, com 20,1 pontos na métrica BLEU; e o modelo atual, com apenas 16,7 pontos. Fonte:  Facebook/Divulgação 

“Ao traduzir, digamos, de chinês para francês, a maioria dos modelos multilíngues centrados em inglês treinam de chinês para inglês e de inglês para francês, porque os dados de treinamento em inglês estão amplamente disponíveis”, explicou Angela Fan. “Nosso modelo treina diretamente em dados chineses para franceses para preservar melhor o significado.”

Apesar de ainda não ter sido incorporado ao Facebook, onde usuários postam conteúdo em mais de 160 línguas, testes realizados pela equipe indicam que o modelo pode suportar uma grande variedade de traduções.

 

Deixe uma resposta

IPOL Pesquisa
Receba o Boletim
Facebook
Revista Platô

Revistas – SIPLE

Revista Njinga & Sepé

REVISTA NJINGA & SEPÉ

Visite nossos blogs
Forlibi

Forlibi - Fórum Permanente das Línguas Brasileiras de Imigração

Forlibi – Fórum Permanente das Línguas Brasileiras de Imigração

GELF

I Seminário de Gestão em Educação Linguística da Fronteira do MERCOSUL

I Seminário de Gestão em Educação Linguística da Fronteira do MERCOSUL

Clique na imagem
Arquivo
Visitantes