Google Drive atualiza sua tecnologia OCR para reconhecimento de mais de 200 idiomas
Google Drive atualiza sua tecnologia OCR para reconhecimento de mais de 200 idiomas
A Google possui um recurso no Drive que oferece reconhecimento de caracteres em arquivos de imagem, através da tecnologia bem conhecida como OCR (Optical Character Recognition). Ela é capaz de converter as palavras das imagens em arquivos de textos. Dessa forma, os documentos podem ser editados, indexados e encontrados por qualquer pessoa, desde que sejam disponibilizados publicamente.
A companhia de Mountain View agora atualizou esse recurso em sua plataforma, e divulgou a novidade em um post do seu blog dedicado às suas pesquisas, destacando a importância da tecnologia OCR para tornar informações importantes, muitas vezes disponíveis apenas em livros, revistas, panfletos e documentos históricos, cada vez mais acessíveis ao público geral. Afinal, muitas vezes textos impressos não podem ser facilmente encontrados para quem não possui acesso direto ao material físico. A empresa destaca que uma parte importante é a digitalização desses documentos, mas outro fator essencial é o reconhecimento em formato de texto.
A atualização do OCR no Google Drive se trata de uma expansão para suporte a todos os idiomas mais falados no mundo. São mais de 200 línguas, segundo a companhia, em mais de 25 sistemas de escrita. Essa tecnologia está disponível aos usuários em duas simples etapas:
1 – Envie um arquivo de texto digitalizado em formato de imagem ou PDF. Abaixo, vemos um exemplo de documento escrito em Híndi, que foi enviado ao Drive em formato PNG.
2 – Clique com o botão direito no documento, na interface do Drive, e selecione a opção “Abrir com” (Open With) > Google Docs.
Dessa forma, o Docs simplesmente abrirá o texto reconhecido através do OCR. Nem é necessário informar à aplicação qual é o idioma do documento; ele detectará automaticamente.
Atualmente, o OCR funciona melhor em digitalizações de alta resolução, com imagens limpas de ruídos, ou de algo que possa atrapalhar o reconhecimento dos caracteres. A Google afirma que está trabalhando para ampliar a performance em digitalizações de qualidade inferior, que normalmente acabam por alterar o texto no resultado final. A companhia sugere que os usuários testem sua tecnologia e envie feedbacks se o OCR da empresa está funcionando de acordo com o esperado.
O OCR do Google Drive também está disponível na versão do aplicativo para Android.
Fonte: tudocelular.com