Você vê caracteres ilegíveis ou incorretos ao importar um arquivo CSV no Power Query do Excel. Isso acontece porque a codificação de texto do arquivo não corresponde à codificação que o Power Query espera. O texto aparece como símbolos estranhos ou pontos de interrogação. Este artigo explica por que ocorrem incompatibilidades de codificação e fornece etapas para corrigi-las.
Você pode resolver o texto ilegível especificando a codificação correta do arquivo durante o processo de importação. A correção envolve alterar uma única configuração no Editor do Power Query. Você aprenderá a identificar a codificação certa e aplicá-la à sua fonte de dados.
Principais conclusões: corrigindo texto ilegível no Power Query
- Configurações da Fonte de Dados > Alterar Origem do Arquivo: Define a codificação de texto de um arquivo CSV antes de carregá-lo no Editor do Power Query.
- Editor do Power Query > Transformar Codificação do Arquivo: Corrige texto ilegível após o arquivo já ter sido carregado, reinterpretando os dados da coluna.
- UTF-8, Windows-1252, ISO-8859-1: Tipos comuns de codificação; selecionar o correto exibe os caracteres adequadamente.
Por que a codificação do arquivo CSV causa texto ilegível
Um arquivo CSV é um arquivo de texto simples. A codificação de texto é o conjunto de regras que mapeia cada caractere a um número específico para armazenamento. Codificações comuns incluem UTF-8, que suporta muitos caracteres internacionais, e Windows-1252, usada para idiomas da Europa Ocidental.
O Power Query, por padrão, geralmente assume que um arquivo usa uma codificação específica do sistema, como Windows-1252. Se o seu CSV foi salvo com uma codificação diferente, como UTF-8, os valores numéricos são interpretados incorretamente. Essa incompatibilidade resulta em texto ilegível, onde caracteres como “é” ou “ä” aparecem como “é” ou “ä”.
Identificando a origem do problema de codificação
O problema geralmente se origina do software que criou o arquivo CSV. Aplicativos como Bloco de Notas, exportações de banco de dados ou downloads da web podem salvar arquivos com várias codificações. Você pode não controlar a origem do arquivo, mas pode controlar como o Power Query o lê. Reconhecer padrões comuns de ilegibilidade pode ajudar a identificar a codificação correta a ser usada.
Etapas para alterar a codificação do arquivo durante a importação do CSV
O método mais eficaz é definir a codificação correta ao importar os dados pela primeira vez. Isso evita que texto ilegível apareça em sua consulta.
- Inicie a importação pela guia Dados
No Excel, vá em Dados > Obter Dados > De Arquivo > De Texto/CSV. Navegue até seu arquivo CSV e selecione-o. - Abra a caixa de diálogo de visualização do arquivo
Uma janela de visualização é exibida, mostrando o texto ilegível. Não clique em Carregar ainda. - Altere a configuração Origem do Arquivo
Na parte inferior da janela de visualização, localize o menu suspenso “Origem do Arquivo”. Pode estar exibindo “65001 : Unicode (UTF-8)” ou algo semelhante. Clique no menu suspenso. - Selecione uma codificação diferente
Escolha outra codificação na lista. Opções comuns para testar são “1252 : Europa Ocidental (Windows)” ou “ISO-8859-1 : Europa Ocidental (ISO)”. A visualização será atualizada instantaneamente. - Verifique se o texto está correto e carregue os dados
Confira a visualização. Se o texto parecer correto, clique em Carregar. Caso contrário, tente outra codificação no menu suspenso até que os caracteres sejam exibidos corretamente.
Corrigindo a codificação em um Power Query existente
Se você já carregou uma consulta com texto ilegível, pode corrigi-la dentro do Editor do Power Query.
- Abra o Editor do Power Query
Vá em Dados > Consultas e Conexões, clique com o botão direito na sua consulta e selecione Editar. - Transforme a codificação da coluna
Selecione a coluna com o texto ilegível. Vá para a guia Transformar. Clique no ícone do menu suspenso Tipo de Dados ao lado do nome da coluna na faixa de opções, não no cabeçalho. - Escolha “Usar Local…”
No menu suspenso, selecione Usar Local. Na caixa de diálogo que abrir, defina “Tipo de Dados” como Texto. Em seguida, use o menu suspenso “Local” para selecionar uma região que corresponda à codificação do seu arquivo, como “Inglês (Estados Unidos)” para Windows-1252. - Aplique e salve as alterações
Clique em OK. Os dados da coluna serão reinterpretados. Clique em Arquivo > Fechar e Carregar para aplicar as alterações à sua planilha.
Se alterar a codificação não corrigir o texto
O Power Query ainda exibe caracteres ilegíveis
Se você tentou todas as codificações comuns e o texto continua ilegível, o arquivo pode estar corrompido ou usar uma codificação muito rara. Tente abrir o arquivo CSV em um editor de texto simples, como o Bloco de Notas. No Bloco de Notas, vá em Arquivo > Salvar Como. Antes de salvar, observe o menu suspenso “Codificação” na parte inferior da caixa de diálogo Salvar Como. Isso mostra a codificação atual do arquivo. Salve uma cópia com uma codificação diferente, como UTF-8, e tente importar esse novo arquivo no Power Query.
Apenas algumas linhas ou colunas são afetadas
Codificação mista em um único arquivo é rara, mas possível. Isso geralmente acontece quando dados de diferentes fontes são combinados. A solução é dividir o processo de importação. Você pode precisar limpar o arquivo CSV de origem fora do Excel ou usar etapas avançadas do Power Query para tratar seções específicas com codificações diferentes.
Opções de codificação de texto no Power Query: uma comparação
| Item | UTF-8 | Windows-1252 | ISO-8859-1 |
|---|---|---|---|
| Melhor para | Texto internacional, dados da web, aplicativos modernos | Texto de sistemas Windows na Europa Ocidental e Américas | Sistemas e softwares mais antigos na Europa Ocidental |
| Suporte a caracteres | Extremamente amplo, suporta a maioria dos scripts globais | Limitado ao alfabeto latino com alguns símbolos extras | Semelhante ao Windows-1252, mas com pequenas diferenças |
| Padrão comum de ilegibilidade | Aspas inteligentes ou travessões aparecem como “ ou — | Caracteres como é, ñ ou € aparecem como é, ñ ou € | Padrões de ilegibilidade semelhantes ao Windows-1252 |
| Padrão no Power Query | Frequentemente o padrão para novas importações | Pode ser o padrão do sistema em algumas configurações do Windows | Normalmente não é o padrão |
Agora você pode importar arquivos CSV sem texto ilegível definindo a codificação correta do arquivo. Use o menu suspenso Origem do Arquivo na visualização de importação para a correção mais rápida. Para consultas existentes, use o recurso Transformar > Usar Local. Como dica avançada, você pode definir a codificação padrão para todas as importações futuras de CSV modificando as configurações regionais no Painel de Controle do Windows, o que influencia a detecção inicial do Power Query.