Extraia texto de imagens ou PDF digitalizado -

Imagens (em jpeg, jpg, bmp, gif, png, etc ...) e PDFs digitalizados tĂȘm uma coisa em comum: nĂŁo permitem selecionar, copiar e extrair o texto presente neles. Portanto, se vocĂȘ tiver um documento digitalizado ou uma imagem contendo um texto muito importante que vocĂȘ precisa modificar ou copiar, a Ășnica solução possĂ­vel Ă© fazer uso de um programa OCR.

Um programa de OCR Ă© uma ferramenta que possui uma tecnologia de reconhecimento Ăłptico de caracteres interna, uma tecnologia muito Ăștil para reconhecer e extrair texto de imagens ou PDF digitalizado. Um dos melhores programas nesta ĂĄrea Ă© definitivamente Elemento PDF, que jĂĄ vimos em funcionamento no guia sobre como extrair texto de um documento PDF.



PDFElement Ă© compatĂ­vel com computadores Windows e Mac e estĂĄ disponĂ­vel em uma versĂŁo “profissional” que inclui tecnologia OCR, Ăștil para extrair texto de imagens ou documentos digitalizados. Vamos ver abaixo como funciona e como Ă© simples extrair texto de imagens.

Como extrair texto de imagens ou PDF digitalizado

Etapa 1. Baixe e instale PDFElement no seu computador

Aqui estĂŁo os links de onde vocĂȘ pode baixar a versĂŁo demo totalmente gratuita:

Extraia texto de imagens ou PDF digitalizado - Extraia texto de imagens ou PDF digitalizado -

Depois de instalar e iniciar o programa, vocĂȘ verĂĄ a seguinte tela inicial:

Extraia texto de imagens ou PDF digitalizado -

Etapa 2. Importe a imagem digitalizada ou PDF

Clique no canto inferior esquerdo ABRIR ARQUIVO ... e selecione a imagem digitalizada ou o arquivo pdf. Para nossos testes e para este artigo, criamos especialmente uma imagem JPEG (via “Paint”) e colocamos algum texto dentro dela. Depois que a imagem foi carregada no programa, aqui está o que apareceu:



Extraia texto de imagens ou PDF digitalizado -

Passo 3. Executar função OCR

Como vocĂȘ pode ver na figura acima, o programa detecta automaticamente que se trata de uma imagem e pergunta se vocĂȘ deseja realizar o OCR para reconhecer o texto na imagem. Ao clicar em EXECUTAR OCR primeiro vocĂȘ terĂĄ que selecionar o idioma do texto e, em seguida, iniciar a varredura. Durante a varredura, este pop-up aparecerĂĄ informando que vocĂȘ deve esperar atĂ© que o procedimento seja concluĂ­do:


Extraia texto de imagens ou PDF digitalizado -

Passo 4. Extração de texto

ApĂłs o OCR, magicamente, todo o texto contido na imagem (ou no PDF digitalizado) serĂĄ "editĂĄvel" Ou seja, vocĂȘ pode copiĂĄ-lo, modificĂĄ-lo, excluĂ­-lo, destacĂĄ-lo, etc ...


Extraia texto de imagens ou PDF digitalizado -

Neste ponto, vocĂȘ pode salvar tudo em formato PDF ou em Word, Excel, PowerPoint (da seção INÍCIO basta clicar no Ă­cone do formato de saĂ­da desejado).

 

uma ferramenta online grĂĄtis? NĂŁo consigo baixar nada

  • Experimente: https://pdftotext.com/
    Mas nĂŁo sei se suporta PDFs digitalizados ...

  • vocĂȘ foi muito claro, vou experimentar o programa, depois vou relatar o resultado. Obrigado

  • Eu ainda nĂŁo experimentei vou te contar

  • Extraia texto de imagens ou PDF digitalizado -

    Adicione um comentĂĄrio do Extraia texto de imagens ou PDF digitalizado -
    ComentĂĄrio enviado com sucesso! Vamos analisĂĄ-lo nas prĂłximas horas.