Como extrair texto de imagens usando a linha de comando
É fácil ler uma imagem e puxar o texto você mesmo. Mas puxando dinamicamente o texto de uma foto é um pouco mais difícil, e felizmente, imgclip oferece uma solução bastante simples.
este ferramenta de linha de comando roda no terminal para Mac, Windows e Linux. Ele simplesmente leva um argumento para o arquivo de imagem junto com o idioma, então devolve o texto copiado para sua área de transferência.
Você pode instalar toda a biblioteca via npm e é um instalação bem simples. A coisa é apenas alguns KB grandes e vem com um arquivo JS que você pode procurar no GitHub.
Imgclip usa o Tesseract.js biblioteca para automatizar o processamento de imagens e puxar texto via OCR. É uma das mais poderosas bibliotecas de OCR até hoje, e é completamente open source como o imgclip.
Eu acho que estou muito impressionado com a qualidade e velocidade desta ferramenta. Realmente trabalha para puxe o texto exato e é uma das ferramentas mais simples de usar.
O comando imgclip deve ser correr diretamente no terminal, seguido pelo caminho relativo para a imagem. Você também pode adicionar quatro opções no final para personalizar a saída.
-h
,--Socorro
: informações de uso de saídas-V
,--versão
: gera o número da versão-eu
,--lang
: produz a linguagem do texto na imagem-p
,--impressão
: imprime o texto na imagem (em vez de copiar para a área de transferência)
No momento em que escrevo, o Tesseract suporta 65 idiomas com mais a caminho. O código que você anexa ao --lang
tag deve ser qualquer código usado nesses arquivos do Tesseract.
Por exemplo, -l eng
irá procurar a imagem para texto em inglês, enquanto -l jpn
irá procurar Texto em japonês e você pode até correr -l jpn_vert
procurar por texto em japonês orientado verticalmente.
Como o imgclip depende muito do Tesseract, você basicamente tem o poder de toda essa biblioteca à sua disposição.
Para iniciar, visite a página do GitHub e baixe uma cópia localmente, ou instale-a em um diretório específico via npm. Então, você pode executar a ferramenta no terminal como um aplicativo para analisar qualquer imagem que você quiser.
Ver imgclip em ação, confira este breve vídeo criado como uma demonstração do imgclip.