Google Drive atualiza sua tecnologia OCR para reconhecimento de mais de 200 idiomas

driveGoogle Drive atualiza sua tecnologia OCR para reconhecimento de mais de 200 idiomas

A Google possui um recurso no Drive que oferece reconhecimento de caracteres em arquivos de imagem, através da tecnologia bem conhecida como OCR (Optical Character Recognition). Ela é capaz de converter as palavras das imagens em arquivos de textos. Dessa forma, os documentos podem ser editados, indexados e encontrados por qualquer pessoa, desde que sejam disponibilizados publicamente.

A companhia de Mountain View agora atualizou esse recurso em sua plataforma, e divulgou a novidade em um post do seu blog dedicado às suas pesquisas, destacando a importância da tecnologia OCR para tornar informações importantes, muitas vezes disponíveis apenas em livros, revistas, panfletos e documentos históricos, cada vez mais acessíveis ao público geral. Afinal, muitas vezes textos impressos não podem ser facilmente encontrados para quem não possui acesso direto ao material físico. A empresa destaca que uma parte importante é a digitalização desses documentos, mas outro fator essencial é o reconhecimento em formato de texto.

A atualização do OCR no Google Drive se trata de uma expansão para suporte a todos os idiomas mais falados no mundo. São mais de 200 línguas, segundo a companhia, em mais de 25 sistemas de escrita. Essa tecnologia está disponível aos usuários em duas simples etapas:

1 – Envie um arquivo de texto digitalizado em formato de imagem ou PDF. Abaixo, vemos um exemplo de documento escrito em Híndi, que foi enviado ao Drive em formato PNG.

drive1

2 – Clique com o botão direito no documento, na interface do Drive, e selecione a opção “Abrir com” (Open With) > Google Docs.

drive2

Dessa forma, o Docs simplesmente abrirá o texto reconhecido através do OCR. Nem é necessário informar à aplicação qual é o idioma do documento; ele detectará automaticamente.

drive3

Atualmente, o OCR funciona melhor em digitalizações de alta resolução, com imagens limpas de ruídos, ou de algo que possa atrapalhar o reconhecimento dos caracteres. A Google afirma que está trabalhando para ampliar a performance em digitalizações de qualidade inferior, que normalmente acabam por alterar o texto no resultado final. A companhia sugere que os usuários testem sua tecnologia e envie feedbacks se o OCR da empresa está funcionando de acordo com o esperado.

O OCR do Google Drive também está disponível na versão do aplicativo para Android.

Fonte: tudocelular.com

IPOL Pesquisa
Receba o Boletim
Facebook
Revista Platô

Revistas – SIPLE

Revista Njinga & Sepé

REVISTA NJINGA & SEPÉ

Visite nossos blogs
Forlibi

Forlibi - Fórum Permanente das Línguas Brasileiras de Imigração

Forlibi – Fórum Permanente das Línguas Brasileiras de Imigração

GELF

I Seminário de Gestão em Educação Linguística da Fronteira do MERCOSUL

I Seminário de Gestão em Educação Linguística da Fronteira do MERCOSUL

Clique na imagem
Arquivo
Visitantes