Como converter imagem em texto editável usando OCR no Word
🔍 WiseChecker

Como converter imagem em texto editável usando OCR no Word

Você tem um documento digitalizado ou uma foto de texto que precisa editar no Word. Digitar manualmente é lento e sujeito a erros. O Word inclui um recurso de OCR integrado que extrai texto de imagens e o insere diretamente no documento. Este artigo explica como usar os comandos Inserir Imagem do Arquivo e Converter em Texto para transformar qualquer imagem em texto editável.

Principais conclusões: Converter imagens em texto editável no Word

  • Inserir > Imagem > Este Dispositivo: Insere a imagem no documento para que o Word possa analisá-la.
  • Clique com o botão direito na imagem > Tornar Texto Acessível (ou Converter em Texto): Aciona o mecanismo de OCR integrado do Word para extrair o texto.
  • Arquivo > Salvar Como > PDF (para digitalizações de alta qualidade): Usar um PDF intermediário pode melhorar a precisão do OCR em imagens densas ou de baixo contraste.

ADVERTISEMENT

Como funciona o recurso de OCR integrado do Word

O Word usa a tecnologia de Reconhecimento Óptico de Caracteres para identificar letras, números e símbolos em imagens raster como arquivos JPG, PNG e TIFF. O recurso faz parte do aplicativo de desktop Microsoft 365 e não está disponível no Word para a web ou em versões autônomas mais antigas, como Word 2016 ou 2019. Quando você insere uma imagem e usa o comando Converter em Texto, o Word escaneia a imagem, reconhece cada caractere e insere o texto resultante em um novo local no documento. A imagem original permanece inalterada. Para melhores resultados, use imagens com resolução de pelo menos 300 DPI, contraste claro entre texto e fundo e inclinação ou rotação mínimas.

Passos para converter uma imagem em texto editável no Word

Método 1: Usando o comando de OCR integrado

  1. Insira a imagem no Word
    Abra seu documento no Word. Vá para Inserir > Imagens > Este Dispositivo. Selecione o arquivo de imagem que contém o texto que deseja extrair. Clique em Inserir.
  2. Posicione a imagem
    Clique na imagem para selecioná-la. Use as opções de layout que aparecem ao lado da imagem para defini-la como Em Linha com o Texto. Isso garante que o comando OCR funcione corretamente.
  3. Clique com o botão direito na imagem
    Clique com o botão direito na imagem selecionada. No menu de contexto, procure a opção rotulada como Tornar Texto Acessível ou Converter em Texto. A redação exata depende da sua versão do Word e do canal de atualização. Se você vir Formatar Imagem ou Formatar Figura no topo, talvez seja necessário clicar na guia Formatar Imagem na faixa de opções e depois clicar em Converter em Texto no grupo Ajustar.
  4. Aguarde o processamento do OCR
    O Word analisa a imagem. Um indicador de progresso pode aparecer brevemente. Quando terminar, uma nova caixa de texto ou bloco de texto em linha aparece abaixo ou ao lado da imagem original. O texto extraído agora está editável.
  5. Revise e corrija erros
    Leia o texto extraído. O OCR não é perfeito. Corrija caracteres mal reconhecidos, pontuação ausente ou problemas de formatação, como quebras de linha que não correspondem à imagem original. Use o Localizar e Substituir (Ctrl+H) do Word para corrigir erros repetidos rapidamente.

Método 2: Usando um PDF intermediário para maior precisão

Se a imagem tiver layouts complexos, fontes pequenas ou baixo contraste, convertê-la para PDF primeiro pode melhorar a precisão do OCR. O mecanismo de reflow de PDF do Word geralmente lida melhor com documentos de várias colunas do que o OCR direto de imagem.

  1. Converta a imagem para PDF
    Abra a imagem em qualquer aplicativo que possa imprimir. Escolha Arquivo > Imprimir e selecione Microsoft Print to PDF como impressora. Clique em Imprimir e salve o arquivo como PDF.
  2. Abra o PDF no Word
    No Word, vá para Arquivo > Abrir > Procurar. Altere o filtro de tipo de arquivo para PDF (pdf). Selecione o arquivo PDF que você criou e clique em Abrir. O Word exibe uma mensagem informando que converterá o PDF em um documento editável. Clique em OK.
  3. Edite o texto convertido
    O Word insere o texto extraído em um novo documento. A imagem original não é mantida. Revise e corrija quaisquer erros de OCR conforme descrito no Método 1.

ADVERTISEMENT

O que fazer quando os resultados do OCR são ruins

O Word extrai apenas alguns caracteres ou texto sem sentido

Isso geralmente acontece quando a resolução da imagem é muito baixa ou o texto é altamente estilizado. Certifique-se de que a imagem tenha pelo menos 300 DPI. Se a imagem for uma captura de tela, aumente a resolução da tela antes de capturar. Evite imagens com fontes decorativas, marcas d’água ou texto sobre fundos complexos. Tente o Método 2 usando um PDF intermediário.

A opção Converter em Texto está esmaecida ou ausente

Este recurso requer uma assinatura do Microsoft 365. Não está disponível no Word 2021, Word 2019 ou versões de licença perpétua mais antigas. Se você estiver em uma versão do Microsoft 365, certifique-se de ter a atualização mais recente instalada. Vá para Arquivo > Conta > Opções de Atualização > Atualizar Agora. Se a opção ainda estiver ausente, a imagem pode estar em um formato que o Word não consegue processar. Converta a imagem para PNG ou JPG usando um editor de imagens e tente novamente.

O Word congela ou trava ao processar a imagem

Imagens grandes com mais de 20 MB podem fazer o Word travar. Reduza o tamanho da imagem antes de inseri-la. Use um editor de imagens para redimensionar a imagem para 2000 pixels no lado mais longo e salve como JPG com compressão. Em seguida, repita as etapas de OCR. Se o Word ainda travar, desative a aceleração gráfica de hardware: vá para Arquivo > Opções > Avançado > Exibição e marque Desativar aceleração gráfica de hardware. Reinicie o Word e tente novamente.

OCR direto de imagem vs. Reflow de PDF: Comparação de precisão

Item OCR direto de imagem no Word Reflow de PDF via Word
Arquivo de entrada JPG, PNG, TIFF, BMP PDF gerado a partir de imagem
Precisão em layouts simples Boa (coluna única, fontes claras) Muito boa
Precisão em layouts de várias colunas Ruim (frequentemente mescla colunas) Boa (preserva a ordem das colunas)
Mantém a imagem original Sim Não (a imagem é descartada)
Requer Microsoft 365 Sim Sim
Melhor para Formulários de página única, recibos, placas Documentos digitalizados de várias páginas, livros

Conclusão

Agora você pode extrair texto de imagens usando as ferramentas de OCR integradas do Word. Para imagens simples, use o comando Converter em Texto no menu de contexto. Para documentos complexos, converta a imagem em PDF primeiro e abra esse PDF no Word para obter melhor precisão. Após a extração, sempre revise o texto e use Localizar e Substituir para corrigir erros repetidos de OCR. Como dica avançada, ative o recurso Ler em Voz Alta (Revisão > Ler em Voz Alta) para ouvir o texto extraído sendo lido em voz alta, o que ajuda a detectar erros que você pode perder ao ler silenciosamente.

ADVERTISEMENT