Facebook poderá traduzir até 100 idiomas sem usar inglês
O Facebook desenvolveu o primeiro modelo de tradução automática multilíngue, capaz de traduzir até 100 idiomas sem utilizar o inglês como intermediário. O sistema, batizado de M2M-100, utiliza inteligência artificial.
Segundo a assistente de pesquisa do Facebook, Angela Fan, isso é um importante passo em direção a um modelo universal que compreenda todos os idiomas em diferentes tarefas. A empresa ainda não divulgou informações de quando o modelo será implementado. Até o momento, a tecnologia é apenas um projeto de pesquisa.
Como o estudo foi realizado
Inicialmente, a equipe de pesquisadores coletou da internet 7,5 bilhões de pares de frases em 100 línguas diferentes, dando prioridade às traduções mais solicitadas pelos internautas.
Em seguida, os idiomas foram separados em 14 grupos, com base em semelhanças linguísticas, geográficas e culturais. Um desses grupos, por exemplo, inclui línguas comuns da Índia, como hindi, bengali e marata. Para facilitar o entendimento das pessoas, a equipe decidiu criar pontes de tradução.
No caso das línguas indianas, o hindi, bengali e tâmil serviram como intermediárias para as indo-arianas. Com essa técnica, a empresa diz que superou os sistemas centrados em inglês em 10 pontos na métrica BLEU, que avalia traduções automáticas, alcançado a marca de 20,1.
“Ao traduzir, digamos, de chinês para francês, a maioria dos modelos multilíngues centrados em inglês treinam de chinês para inglês e de inglês para francês, porque os dados de treinamento em inglês estão amplamente disponíveis”, explicou Angela Fan. “Nosso modelo treina diretamente em dados chineses para franceses para preservar melhor o significado.”
Apesar de ainda não ter sido incorporado ao Facebook, onde usuários postam conteúdo em mais de 160 línguas, testes realizados pela equipe indicam que o modelo pode suportar uma grande variedade de traduções.
Google Tradutor lança modo transcrição em tempo real
O Google tradutor é uma das ferramentas essenciais para quem vai viajar ou precisa se comunicar com alguém de outro país e não domina a lígua local. Agora, é possível usá-lo em tempo real com a transcrição ativa em oito línguas.
A pessoa fala em outra língua, o google traduz e já exibe a frase ou a conversa escrita na tela. A função era um pedido antigo dos clientes e facilita quem precisa fazer entrevistas ou texto.
A opção estará disponível em celulares Android a partir de amanhã (18) com suporte para inglês, francês, alemão, hindu, português, russo, espanhol e tailandês. A Google afirma que vai adicionar para usuários de iOS, sistema operacioanal da Apple para iPhone e iPads, em um futuro próximo.
Para ativar o modo basta atualizar o aplicativo do Google Tradutor na Google Store e acionar a função de transcrição, que aparecerá do lado esquerdo, ao lado de “conversa”.
Mapa mostra as línguas faladas no mundo e permite que você ouça até os sotaques regionais
Qualquer um que já viajou de uma região a outra do Brasil, e, em alguns casos, mesmo de uma cidade a outra, sabe que há diferenças marcantes no vocabulário utilizado e mesmo no jeito como as palavras são pronunciadas.
Essas diferenças territoriais na forma como se fala são suficientes para constituir dialetos. No Brasil, por exemplo, há o dialeto recifense, falado na região metropolitana do Recife; o dialeto caipira, falado em partes de São Paulo, Mato Grosso do Sul, Minas Gerais, Goiás e Paraná; e o cearense.
Para quem não conhece uma língua, compreender e se acostumar com essas diferentes formas de falar pode ser tão difícil quanto aprender uma nova gramática. Foi a partir desse problema que David Ding, ex-engenheiro de softwares da Microsoft, criou o Localingual, um mapa interativo on-line no qual é possível ouvir trechos de falas de pessoas de diversas regiões do globo.
Clique aqui e veja o mapa interativo.
Com ele é possível ouvir não só as diferenças entre o português de um gaúcho e de um paraibano, mas também entre um falante de francês de Paris ou de Québec, no Canadá, por exemplo.
O site mostra um mapa-múndi com todos os países. Conforme se dá um zoom na imagem, as divisões administrativas internas — Estados, no caso do Brasil —, assim como algumas das principais cidades, são destacadas. Ao clicar nelas é possível ouvir o som de vozes locais.
Segundo o criador do Localingual, o objetivo é fazer com que o site, que é mantido à base de doações, se transforme em uma “Wikipédia das línguas e dialetos”, que poderia ser consultada por qualquer interessado em aprender a pronunciar as palavras de acordo com a região do globo.
Importantes recursos lingüísticos fueron presentados por la SPL
La Secretaría de Políticas Lingüísticas (SPL) pone a disposición de la ciudadanía recursos tecnológicos que promueven el uso y difusión de las lenguas. Fue durante un acto denominado “Ñane ñe’ẽnguéra rekove” realizado este martes en el Aula Magna de la Universidad Católica de Asunción.
Los recursos tecnológicos consisten en el: Diccionario Digital Bilingüe, Corpus de Referencia del Guaraní Paraguayo Actual, y la Memoria de la Feria de Lenguas en el Paraguay “Toikove Ñe’ẽnguéra Paraguáipe” 2014.
La Ministra de la SPL, Ladislaa Alcaraz de Silvero dio apertura aal acto con estas expresioens en guaraní “Ñamyasãiramo tembiapoita ojegueroguatáva ñane ñe’ẽnguéra hekove resãi potávo ñane retãme, ikatúne jaikuaave ñane ñe’ẽnguéra rembiasa ha ñañomokyre’ỹvéne katuete ñambojoaju rekávo ñane rembiapokuéra ha upéichamante jahechakuaáta tekotevẽteha ñamba’apo ñane ñe’ẽnguéra rehe, ha upépe ñaikotevẽ ojuehe”.
El Diccionario Digital Bilingüe (guaraní-castellano) en su formato escrito y audio ya está disponible en el portal: www.paraguay.gov.py. Fue elaborado por la Secretaría de Políticas Lingüísticas, con el apoyo de la Secretaría Nacional de Tecnologías de la Información y Comunicación (SENATICs) y el Grupo de Grabaciones en Guaraní (GGG).