Você precisa extrair dados de um PDF para o Excel, mas copiar e colar gera uma planilha bagunçada e inutilizável. PDFs são feitos para visualização, não para edição, o que dificulta a extração de tabelas estruturadas. Este artigo explica como usar a ferramenta Power Query do Excel para importar tabelas de PDF diretamente. Você aprenderá as etapas para obter dados limpos e formatados sem instalar nenhum software adicional.
Principais Pontos: Importar Tabelas de PDF para o Excel
- Dados > Obter Dados > De Arquivo > De PDF: Este é o método principal no Excel para Windows para conectar-se a um PDF e visualizar suas tabelas antes da importação.
- Editor do Power Query > Transformar Dados: Use esta interface para limpar colunas, remover linhas em branco e alterar tipos de dados após a importação inicial.
- Fechar e Carregar: Este comando final carrega a tabela limpa e transformada do PDF em uma nova planilha do Excel.
Usando o Power Query do Excel para Importar Dados de PDF
O Excel para Microsoft 365 e Excel 2021 incluem um mecanismo de transformação de dados chamado Power Query. Seu conector “De PDF” pode ler arquivos PDF e detectar tabelas dentro deles. A ferramenta interpreta a estrutura visual da página do PDF, identificando linhas e colunas com base em espaçamento e linhas. Em seguida, converte essa estrutura em uma tabela de dados que você pode editar antes de inseri-la em sua pasta de trabalho. Este método funciona melhor com PDFs criados a partir de programas de planilha ou banco de dados, pois possuem limites de tabela claros.
Você precisa de uma versão do Excel para Windows que inclua o Power Query. Este recurso está disponível no Excel para Microsoft 365, Excel 2021, Excel 2019 e Excel 2016. A opção “De PDF” não está disponível no Excel para Mac ou na versão web. O arquivo PDF deve estar armazenado em seu computador local ou em uma unidade de rede à qual você tenha acesso. PDFs protegidos por senha não podem ser lidos por este método.
Etapas para Importar e Limpar uma Tabela de PDF
Siga este processo para trazer uma tabela de um PDF para o Excel com a formatação correta.
- Iniciar a importação de dados
No Excel, vá para a guia Dados na faixa de opções. Clique em Obter Dados, passe o mouse sobre De Arquivo e selecione De PDF. Navegue até seu arquivo PDF e clique em Importar. - Selecionar a tabela correta
O painel Navegador será aberto mostrando uma lista de tabelas e páginas encontradas no PDF. Clique no nome de uma tabela para ver uma prévia à direita. Verifique se a prévia mostra os dados corretos. Marque a caixa de seleção ao lado da tabela desejada e clique em Transformar Dados. - Limpar os dados no Editor do Power Query
A janela do Editor do Power Query é aberta. Aqui você pode remover linhas extras de cabeçalho selecionando Início > Remover Linhas > Remover Linhas Superiores. Exclua colunas em branco clicando com o botão direito no cabeçalho da coluna e escolhendo Remover. Altere o tipo de dados de uma coluna clicando no ícone de tipo de dados ao lado do nome da coluna, como ABC para texto ou 123 para número inteiro. - Carregar a tabela limpa no Excel
Após fazer suas alterações, clique no botão Fechar e Carregar na guia Início. O Power Query será fechado e carregará a tabela final em uma nova planilha em sua pasta de trabalho do Excel.
Usando o Recurso Legado “Da Web” para PDFs Online
Se seu PDF estiver hospedado em um site público, você pode usar um método diferente. No Excel, vá para Dados > Obter Dados > De Outras Fontes > Da Web. Cole a URL direta do arquivo PDF. Isso pode abrir o PDF no painel Navegador, permitindo selecionar uma tabela. Este método é menos confiável que a opção direta De PDF e depende de como o servidor web hospeda o arquivo.
Erros Comuns e Desafios na Limpeza de Dados
Mesmo com o Power Query, as importações de PDF podem ter problemas. Conhecer esses problemas ajuda a corrigi-los rapidamente.
Dados Importados Estão Todos em Uma Única Coluna
Isso acontece quando o Power Query não consegue detectar separadores de coluna no PDF. No Editor do Power Query, selecione a coluna com todos os dados. Vá para a guia Transformar e clique em Dividir Coluna > Por Delimitador. Escolha um delimitador como espaço ou vírgula, ou selecione “Por número de caracteres” se os dados tiverem larguras fixas.
Números Importam como Texto ou Datas Estão Erradas
O Power Query às vezes adivinha tipos de dados incorretamente. Clique no ícone de tipo de dados ao lado do cabeçalho da coluna no Editor do Power Query. Escolha o tipo correto: Número Decimal, Número Inteiro ou Data. Para números teimosos em formato de texto, use Transformar > Substituir Valores para remover símbolos de moeda ou vírgulas antes de alterar o tipo.
Linhas de Cabeçalho Extras ou Células Mescladas no PDF
PDFs com layouts complexos podem confundir a importação. Na prévia do painel Navegador, se você vir linhas extras de título acima dos dados, não selecione a tabela. Em vez disso, selecione o item “Página”, que importa todo o conteúdo da página. Você pode então usar as ferramentas de filtro do Power Query para remover manualmente as linhas indesejadas.
Power Query vs. Copiar e Colar vs. Salvar Como
| Item | Power Query (Obter Dados de PDF) | Copiar e Colar | Salvar PDF como Excel (Conversor Online) |
|---|---|---|---|
| Estrutura dos Dados | Preserva a estrutura da tabela em colunas separadas | Frequentemente cola todos os dados em uma coluna | Resultados variam muito; frequentemente cria muitas células mescladas |
| Limpeza de Dados | Editor integrado para filtrar, alterar tipos e remover erros | Deve limpar manualmente no Excel após colar | Nenhuma edição antes da importação; erros são incorporados |
| Formatação | Traz dados brutos sem fontes ou cores do PDF | Pode trazer formatação de texto, mas quebra o alinhamento | Tenta manter o layout visual, o que prejudica a estrutura dos dados |
| Automação | A consulta pode ser atualizada se o PDF de origem for atualizado | Processo totalmente manual que deve ser repetido | Conversão manual única |
| Software Necessário | Excel para Windows (2016 ou mais recente) | Qualquer versão do Excel | Site ou serviço de terceiros |
Agora você pode importar tabelas de PDFs diretamente para o Excel usando o recurso Obter Dados. Isso fornece um conjunto de dados limpo pronto para fórmulas e tabelas dinâmicas. Para relatórios recorrentes, configure a consulta para atualizar clicando com o botão direito na tabela no Excel e selecionando Atualizar. Uma dica mais avançada é combinar vários PDFs de uma pasta usando Dados > Obter Dados > De Arquivo > De Pasta e depois anexar as consultas em uma tabela mestre.