Diversidade linguística

A tipografia das línguas indígenas brasileiras: catalogação ortográfica

Convite para pesquisadores envolvidos com línguas indígenas brasileiras para colaborar com projeto de pesquisa de catalogação ortográfica.
Cada contribuição consiste na listagem dos caracteres acentuados utilizados na língua (ou línguas) com a qual se tem familiaridade, contato, envolvimento. É possível fazer múltiplas contribuições, por meio deste formulário:

https://docs.google.com/forms/d/e/1FAIpQLSehr2ghfSE1HKNQ92PUCw9WULNk-JIzUKi2GuP2M5nFwzrm0A/viewform

 

 

Revista Digital de Políticas Lingüísticas (RDPL) – Núm. 12 (2020)

Já está disponível o novo número da Revista Digital de Políticas Linguísticas (RDPL)
 Acesse aqui:

 ##issue.viewIssueIdentification##

MIT cria inteligência artificial para traduzir línguas ‘mortas’

Uma equipe de pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) anunciou na última quarta-feira (21) a criação de um algoritmo de decifração capaz de fornecer automaticamente o significado de linguagens perdidas há muito tempo, mesmo que não tenham qualquer relação com outros idiomas.

O projeto se baseia em um artigo escrito no ano passado pela professora Regina Barsilay, do MIT, e do estudante de doutorado Jiaming Luo, do MIT , que decifrou duas línguas mortas: o ugarítico e o Linear B, que levaram muitos anos para serem decifradas pelos humanos. Porém, essas línguas estavam relacionadas às primeiras formas do hebraico e do grego.

Com o novo sistema, a relação entre línguas é inferida diretamente pelo algoritmo. Essa questão era um dos maiores desafios da decifração. No caso do Linear B, um silabário utilizado pela Civilização Micênica entre os séculos XV a.C. e XII a.C., foram necessárias décadas de estudo para que se chegasse à sua decifração.

Fonte: alagunasr/Adobe Stock/Reprodução Fonte:  alagunasr/Adobe Stock 

Testando linguagens

Mas há línguas, como a ibérica, das quais não se conhece outras linguagens relacionadas, com alguns defendendo o basco, enquanto outros afirmam categoricamente que o ibérico não se relaciona com nenhum tipo de idioma conhecido.

Preparado para avaliar a proximidade entre duas línguas, o algoritmo foi testado no ibérico, comparando-o ao basco e a outros candidatos menos prováveis, como famílias românicas, germânicas, turcas e Uralic. Nenhuma das línguas foi considerada relacionada, nem mesmo o basco ou o latim.

Para chegar a essa conclusão, o algoritmo teve que categorizar palavras em um idioma antigo e vinculá-las a seus equivalentes em outros idiomas relacionados. Em outras palavras, o processo não consegue ser um Google Tradutor, traduzindo línguas “mortas” diretamente para o inglês, mas consegue identificar as raízes de diversas línguas antigas.

Para trabalhos futuros, a equipe pretende expandir a decifração para além do ato de conectar textos a palavras relacionadas a uma linguagem já conhecida. Uma nova abordagem envolveria identificar o significado semântico das palavras, mesmo sem saber lê-las.

Fonte: Tecmundo

 

Facebook poderá traduzir até 100 idiomas sem usar inglês

O Facebook desenvolveu o primeiro modelo de tradução automática multilíngue, capaz de traduzir até 100 idiomas sem utilizar o inglês como intermediário. O sistema, batizado de M2M-100, utiliza inteligência artificial.

Segundo a assistente de pesquisa do Facebook, Angela Fan, isso é um importante passo em direção a um modelo universal que compreenda todos os idiomas em diferentes tarefas. A empresa ainda não divulgou informações de quando o modelo será implementado. Até o momento, a tecnologia é apenas um projeto de pesquisa.

Como o estudo foi realizado

Fonte:  Facebook/Divulgação 

Inicialmente, a equipe de pesquisadores coletou da internet 7,5 bilhões de pares de frases em 100 línguas diferentes, dando prioridade às traduções mais solicitadas pelos internautas.

Em seguida, os idiomas foram separados em 14 grupos, com base em semelhanças linguísticas, geográficas e culturais. Um desses grupos, por exemplo, inclui línguas comuns da Índia, como hindi, bengali e marata. Para facilitar o entendimento das pessoas, a equipe decidiu criar pontes de tradução.

No caso das línguas indianas, o hindi, bengali e tâmil serviram como intermediárias para as indo-arianas. Com essa técnica, a empresa diz que superou os sistemas centrados em inglês em 10 pontos na métrica BLEU, que avalia traduções automáticas, alcançado a marca de 20,1. 

Comparação entre o novo modelo de tradução, com 20,1 pontos na métrica BLEU; e o modelo atual, com apenas 16,7 pontos. Fonte:  Facebook/Divulgação 

“Ao traduzir, digamos, de chinês para francês, a maioria dos modelos multilíngues centrados em inglês treinam de chinês para inglês e de inglês para francês, porque os dados de treinamento em inglês estão amplamente disponíveis”, explicou Angela Fan. “Nosso modelo treina diretamente em dados chineses para franceses para preservar melhor o significado.”

Apesar de ainda não ter sido incorporado ao Facebook, onde usuários postam conteúdo em mais de 160 línguas, testes realizados pela equipe indicam que o modelo pode suportar uma grande variedade de traduções.

 

Mini- curso “Ensino de português língua de acolhimento: status e práticas” na XI Semana de Ciência e Tecnologia (SCT)

Este mini-curso tem por objetivo trazer para a autorreflexão os profissionais que atuam no ensino-aprendizagem de Português Língua de Acolhimento (PLAc) e/ou outros status do Português, focalizando a discussão das especificidades da área e suas relações com a prática por meio de um aprofundamento teórico-prático a partir das observações da experiência no curso de Português como Língua de Acolhimento do projeto de extensão Ensino-Aprendizagem Português Língua de Acolhimento (PLA), na Unesc, com as nacionalidade hatianas, ganesas, togolesas e nigerianas.

Público Alvo: Professores Voluntários de PLAc, acadêmicos de Letras e Pedagogia e profissionais da área de Educação e Políticas Públicas e Sociais.

Organização: PPGE/Letras/Programa de Ensino-aprendizagem de PLA.

 

Oct 28, 2020 – 08:00 – 12:00
Mais informações em: 

Conversatorio “Los pueblos indígenas de Brasil y su experiencia en el fortalecimiento de la lengua materna”

IPOL em Ação, não perca!

 

Conversatorio “Los pueblos indígenas de Brasil y su experiencia en el fortalecimiento de la lengua materna”

Fecha: Viernes 25 de septiembre de 2020
Hora: 17h00
Lugar: Plataforma Zoom
El Área de Letras y Estudios Culturales, y la Cátedra de Pueblos Indígenas de América Latina de la Universidad Andina Simón Bolívar invitan al conversatorio “Los pueblos indígenas de Brasil y su experiencia en el fortalecimiento de la lengua materna”.

En las últimas tres décadas, las Constituciones de los países del Abya Yala (América) incluyen en sus textos los “Derechos Colectivos de las Nacionalidades y Pueblos”. Similar situación tenemos con el Convenio 169 de la OIT, los Derechos Humanos de las Naciones Unidas, la Unesco, etc. Sin embargo, la situación de las lenguas es muy crítica y el nivel de debilitamiento es muy preocupante. Hoy las lenguas indígenas están al borde del desaparecimiento. Esta conferencia nos permitirá conocer la experiencia de los pueblos indígenas de Brasil, en su esfuerzo por evitar que sus lenguas desaparezcan.

Expositora
Ro Morello, coordinadora de IPOL Instituto de Investigação e Desenvolvimento em Política Linguística, Brasil.

Inscripciones
La participación en esta actividad es gratuita. Las personas interesadas en participar deben inscribirse en el siguiente formulario en línea. 

​Formulario de inscripción

Luego de la inscripción, recibirá un correo electrónico de confirmación con información para unirse al seminario web.​

Más información

https://www.uasb.edu.ec/web/guest/contenido?conversatorio-los-pueblos-indigenas-de-brasil-y-su-experiencia-en-el-fortalecimiento-de-la-lengua-materna-

Área de Letras y Estudios Culturales
Paola Ruiz, paola.ruiz@uasb.edu.ec

IPOL Pesquisa

Receba o Boletim

Facebook

Revista Platô

Visite nossos blogs

Clique na imagem

Clique na imagem

Visitantes

Arquivo