Ferramentas gratuitas de OCR para extrair texto de imagens - o melhor de
Se você estiver procurando extrair texto de uma imagem, a ferramenta OCR é o que você deve usar. Ferramentas de reconhecimento ótico de caracteres (OCR) digitalizar e extrair texto de imagens e permite que você faça quaisquer alterações necessárias.
Neste post, vou listar o melhores ferramentas gratuitas de OCR disponíveis para diferentes plataformas. Para fins de teste, alterei a formatação de alguns parágrafos de texto para uma fonte manuscrita bastante complicada e tirei uma captura de tela. Eu também tentei texto normal, mas essas ferramentas criaram resultados perfeitos.
Limitação do OCR
Antes de entrar nas ferramentas de OCR, é importante entender o que o OCR pode fazer por você e quais são suas limitações.
Se o texto dentro da imagem está desfocada ou não está em foco, a digitalização do OCR não funcionará corretamente e resultados não serão agradáveis em absoluto. Isso também é verdade para imagens com iluminação fraca e qualquer outro tipo de distorção. Nesse caso, o texto extraído será composto principalmente de caracteres aleatórios.
Eu também devo mencionar que tanto a máquina gerada quanto o texto manuscrito podem ser extraídos usando a tecnologia OCR. Embora a precisão do texto manuscrito possa não ser tão alta quanto a do texto gerado por máquina.
Além disso, existem vários tipos de OCR métodos utilizados por essas ferramentas e assim o precisão do texto extraído também depende do método usado.
OCR Ferramentas do Windows
FreeOCR
O FreeOCR é definitivamente a ferramenta de OCR mais fácil de usar que também oferece resultados agradáveis. Pode abra PDFs, gerencie a imagem, selecione a localização na imagem que você deseja digitalizar e até digitalizar documentos diretamente usando um scanner. Curiosamente, é cuma digitalização de documentos de várias páginas ao mesmo tempo, e você também pode escanear texto em vários idiomas.
Faça o download do FreeOCR
OCR para Word
Como o nome sugere, o OCR para o Word permite extrair texto das imagens e, em seguida, exportar texto para um arquivo de palavras. Embora não tenha feito um bom trabalho ao extrair texto da imagem de teste que estou usando, mas quando eu usei um pouco fácil de ler o texto ele fez um trabalho ainda melhor do que a ferramenta FreeOCR acima mencionada.
Download OCR para Word
Microsoft OneNote
Se você tiver o pacote do Microsoft Office, você já terá o Microsoft OneNote instalado. Caso contrário, você também pode baixá-lo separadamente gratuitamente. O OneNote também permite digitalizar imagens em suas anotações para extrair texto. Basta clicar com o botão direito na imagem e selecionar “Copie o texto da imagem”. O texto será copiado para a área de transferência e você poderá colá-lo onde desejar.
Faça o download do Microsoft OneNote
Ferramentas on-line de OCR
OCR on-line gratuito
Ferramenta on-line gratuita OCR permite extrair texto em até 46 idiomas e você pode obter os resultados como um arquivo de texto ou texto simples. Os resultados não foram muito ruins e poderiam ser editados com perfeição. Você terá que se inscrever se quiser acessar todos os idiomas e imagens em massa do OCR.
OCR livre
O OCR gratuito também é uma boa ferramenta se a imagem que você possui estiver abaixo do limite máximo de tamanho de arquivo de 6 MB. isto suporta até 29 idiomas e os resultados do exame OCR também foram muito bons.
OCR do Google Drive
O Google Drive também tem um sistema OCR incorporado para extrair texto de imagens. Se a imagem do texto estiver no Google Drive, clique com o botão direito nela e selecione documentos Google de Abrir com cardápio.
A imagem será aberto no Documentos Google como um novo documento e o texto extraído estará abaixo dele. Na minha experiência, a verificação do OCR do Google Drive cometeu muitos erros de ortografia, mas havia menos caracteres aleatórios, diferente de outras ferramentas de OCR. Você pode leia mais sobre isso do nosso post aqui.
Extensões do Chrome OCR
Se a imagem da qual você deseja extrair o texto for encontrada on-line, você pode usar algumas extensões de OCR úteis no Google Chrome para.
Copyfish
Copyfish permitirá que você selecione qualquer área dentro do seu navegador para escanear e use sua tecnologia OCR. Curiosamente, Copyfish pula todas as palavras que não entende completamente e só mostra aquele que extrai perfeitamente ou pelo menos fica muito perto. Mostrará a palavra digitalizada na cor laranja.
Projeto Naptha
Uma extensão muito legal que faz automaticamente todas as imagens nos sites editáveis e você pode selecioná-los para copiar seu texto. Eu não achei a extensão para funcionar bem em texto menor em imagens, mas funcionou perfeitamente no texto de tamanho grande com poucos problemas de formatação.
OCR Linux Tools
Tesseract OCR
Isto é um tecnologia OCR de código aberto que está sendo usado por muitas ferramentas de OCR, incluindo o FreeOCR que mencionei no início. Atualmente, está sendo gerenciado pelo Google e oferece extração de texto confiável.
Baixar Tesseract OCR
Cuneiforme
O Cuneiform também é uma ferramenta OCR de código aberto confiável que funciona para usuários do Linux. E é conhecido por trabalhe melhor para texto manuscrito em comparação com outras ferramentas OCR.
Eu não tive a chance de experimentar essas ferramentas no Linux, mas aqui está uma rápida comparação destas ferramentas OCR para te dar uma ideia.
Baixar Cuneiforme
OCR Mobile Tools
Fada do texto
O Text Fairy é um dos aplicativos OCR mais populares para Android totalmente gratuito e não exibe anúncios. Tem um editor confiável para editar o ponto de vista de texto e imagem e você pode extrair texto em até 50 idiomas.
Baixar Text Fairy para Android
Google Keep
O popular aplicativo de anotações do Google também tem uma ferramenta de OCR à mão embutida. Basta importar a imagem na nota e tocar no três pontos cardápio. No menu, selecione Agarre o texto da imagem e o Google Keep começará a digitalizar. Após a digitalização, o texto será mostrado à direita na nota.
Com o Google manter os resultados foram realmente surpreendentes para a minha imagem de teste e extraiu o texto com mais de 90% de precisão. Um deve tentar eu diria.
Baixar o Google Keep para Android | iOS
OCR em inglês
Uma ótima ferramenta de OCR para usuários de iOS que é completamente livre e oferece precisão confiável ao extrair texto. Embora contenha anúncios, mas você pode comprar o versão pro sem propaganda.
Baixar o OCR em inglês para iOS
Resumo
Deve-se ter em mente que a imagem que eu usei para testar era muito complexa, e é por isso que ferramentas falharam completamente ou os resultados não foram perfeitos. Na maioria dos casos, você não terá que lidar com imagens de texto complexas e seus resultados devem ser bons.
O Google Keep mostrou os melhores resultados para a imagem de teste Eu usei, mas isso não significa que é o melhor, pois ainda depende do tipo de imagem e método OCR.
Eu também vou recomendo que você confira o software OCR pago Abbyy Finereader se o acima não funcionou para você. É um software comercial que é muito mais poderoso do que qualquer uma dessas ferramentas gratuitas. O melhor de tudo, você pode experimentar a sua versão gratuita para ver se funciona bem para o seu arquivo de imagem de texto ou não.