Pagina inicial » Kit de ferramentas » Como extrair texto de imagens usando a linha de comando

    Como extrair texto de imagens usando a linha de comando

    É fácil ler uma imagem e puxar o texto você mesmo. Mas puxando dinamicamente o texto de uma foto é um pouco mais difícil, e felizmente, imgclip oferece uma solução bastante simples.

    este ferramenta de linha de comando roda no terminal para Mac, Windows e Linux. Ele simplesmente leva um argumento para o arquivo de imagem junto com o idioma, então devolve o texto copiado para sua área de transferência.

    Você pode instalar toda a biblioteca via npm e é um instalação bem simples. A coisa é apenas alguns KB grandes e vem com um arquivo JS que você pode procurar no GitHub.

    Imgclip usa o Tesseract.js biblioteca para automatizar o processamento de imagens e puxar texto via OCR. É uma das mais poderosas bibliotecas de OCR até hoje, e é completamente open source como o imgclip.

    Eu acho que estou muito impressionado com a qualidade e velocidade desta ferramenta. Realmente trabalha para puxe o texto exato e é uma das ferramentas mais simples de usar.

    O comando imgclip deve ser correr diretamente no terminal, seguido pelo caminho relativo para a imagem. Você também pode adicionar quatro opções no final para personalizar a saída.

    1. -h, --Socorro: informações de uso de saídas
    2. -V, --versão: gera o número da versão
    3. -eu, --lang: produz a linguagem do texto na imagem
    4. -p, --impressão: imprime o texto na imagem (em vez de copiar para a área de transferência)

    No momento em que escrevo, o Tesseract suporta 65 idiomas com mais a caminho. O código que você anexa ao --lang tag deve ser qualquer código usado nesses arquivos do Tesseract.

    Por exemplo, -l eng irá procurar a imagem para texto em inglês, enquanto -l jpn irá procurar Texto em japonês e você pode até correr -l jpn_vert procurar por texto em japonês orientado verticalmente.

    Como o imgclip depende muito do Tesseract, você basicamente tem o poder de toda essa biblioteca à sua disposição.

    Para iniciar, visite a página do GitHub e baixe uma cópia localmente, ou instale-a em um diretório específico via npm. Então, você pode executar a ferramenta no terminal como um aplicativo para analisar qualquer imagem que você quiser.

    Ver imgclip em ação, confira este breve vídeo criado como uma demonstração do imgclip.