Você tem uma planilha com dados bagunçados e repetidos, difíceis de analisar ou atualizar. Isso acontece quando as informações são armazenadas em uma única tabela larga. Normalizar seus dados organiza-os em tabelas separadas e relacionadas para reduzir redundâncias. Este artigo explica a diferença entre tabelas planas e estruturadas e fornece etapas para normalizar seus dados no Excel.
Principais Conclusões: Normalizar Dados no Excel
- Converter em Tabela (Ctrl+T): Cria uma Tabela do Excel estruturada com filtragem automática e fórmulas que se ajustam ao adicionar novas linhas.
- Power Query (Dados > Obter Dados): Divide uma tabela plana em várias tabelas relacionadas e remove entradas duplicadas automaticamente.
- XLOOKUP ou ÍNDICE/CORRESP: Recria relacionamentos entre tabelas normalizadas ao pesquisar valores de uma coluna-chave.
Entendendo Tabelas Planas vs. Tabelas Estruturadas
Uma tabela plana, também chamada de tabela desnormalizada, contém todas as informações em uma única grade grande. Geralmente possui valores repetidos em várias colunas e linhas. Por exemplo, um registro de vendas pode listar o nome completo do cliente, endereço e detalhes do produto em cada linha de pedido. Essa repetição torna o arquivo maior e propenso a erros. Se o endereço de um cliente mudar, você precisa encontrar e atualizar cada linha desse cliente.
Uma tabela estruturada, ou modelo de dados normalizado, divide essas informações em tabelas menores e separadas. Uma tabela pode conter dados exclusivos de clientes, outra tabela detalhes de produtos, e uma terceira tabela registra apenas as transações, usando números de ID para vincular às outras tabelas. Essa estrutura é o princípio central do design de bancos de dados. O Excel suporta esse modelo por meio de recursos como Tabelas do Excel e o Modelo de Dados usado por Tabelas Dinâmicas.
O Objetivo da Normalização
O principal objetivo é eliminar redundância e dependência de dados. Cada informação deve ser armazenada em apenas um lugar. Isso torna seus dados mais consistentes, economiza espaço e simplifica atualizações. No Excel, a normalização prepara seus dados para análises avançadas com Tabelas Dinâmicas, Power Pivot e fórmulas, sem necessidade de limpeza manual.
Etapas para Normalizar uma Tabela Plana no Excel
A maneira mais eficaz de normalizar dados é usando o Power Query, uma ferramenta de transformação de dados integrada. O método a seguir divide uma tabela plana em várias tabelas relacionadas.
- Carregue sua tabela plana no Power Query
Selecione qualquer célula dentro do intervalo de dados planos. Vá para a guia Dados e clique em De Tabela/Intervalo no grupo Obter e Transformar Dados. Isso abre a janela do Editor do Power Query. - Identifique e extraia uma tabela de consulta
Procure colunas com dados categóricos repetidos, como Nome do Cliente ou Categoria do Produto. Selecione o cabeçalho da coluna de uma categoria. Vá para a guia Transformar e clique em Extrair Valores > Para Tabela. Clique em OK na caixa de diálogo. Isso cria uma nova consulta com apenas os valores exclusivos dessa coluna. - Adicione uma coluna de índice para criar uma chave
Com a nova tabela de valores exclusivos selecionada, vá para a guia Adicionar Coluna e clique em Coluna de Índice > De 1. Essa coluna numérica servirá como chave primária para vincular tabelas. - Substitua os valores originais pelos IDs de chave na tabela principal
Volte para a consulta da sua tabela plana original. Selecione a coluna com os dados repetidos que você acabou de extrair. Vá para a guia Início, clique em Mesclar Consultas. Na caixa de diálogo, selecione a consulta da tabela de consulta que você criou. Corresponda a coluna original à coluna de texto na tabela de consulta. Escolha a nova coluna de índice como saída e clique em OK. Expanda a nova coluna para mostrar apenas os valores do índice. Isso substitui texto como “Cliente A” por um número de ID como “1”. - Carregue as tabelas normalizadas de volta para o Excel
No Editor do Power Query, selecione cada consulta. Na guia Início, clique em Fechar e Carregar Para. Escolha carregar a tabela de fatos principal para uma planilha. Para as tabelas de consulta, selecione Apenas Criar Conexão e marque Adicionar estes dados ao Modelo de Dados. Isso as carrega no Modelo de Dados em segundo plano, onde os relacionamentos podem ser construídos. - Crie relacionamentos no Modelo de Dados
Vá para a guia Dados e clique em Gerenciar Modelo de Dados. Na janela do Power Pivot, vá para a Exibição de Diagrama. Arraste o campo de índice da sua tabela de consulta e solte sobre o campo de ID correspondente na sua tabela de fatos principal. Uma linha aparecerá, criando um relacionamento.
Normalizando com Fórmulas do Excel
Se você não puder usar o Power Query, pode simular a normalização usando fórmulas. Primeiro, crie manualmente tabelas separadas para suas categorias exclusivas. Em seguida, na sua tabela de transações principal, use a função XLOOKUP para trazer os números de ID. Por exemplo, se você tem uma tabela de Clientes com um ID e Nome, use =XLOOKUP([@Cliente], TabelaClientes[Nome], TabelaClientes[ID]) na sua tabela principal para converter nomes em IDs.
Erros Comuns ao Normalizar Dados
Não Criar uma Coluna de Chave Adequada
Um relacionamento requer um identificador exclusivo na tabela de consulta. Usar um campo de texto como nome de produto pode falhar se os nomes tiverem erros de digitação ou mudarem. Sempre crie uma coluna de ID numérica, como um Índice, que não mudará. Essa chave deve existir em ambas as tabelas para que o relacionamento funcione.
Esquecer de Atualizar Consultas Após Alterações
Os dados carregados via Power Query não são atualizados automaticamente. Se você alterar os dados de origem, deve atualizar as consultas. Clique com o botão direito em uma tabela resultante e selecione Atualizar, ou vá para a guia Dados e clique em Atualizar Tudo. Deixar de fazer isso deixará sua análise usando dados antigos e incorretos.
Supernormalizar Conjuntos de Dados Simples
Para conjuntos de dados muito pequenos e simples que não crescerão, criar várias tabelas pode adicionar complexidade desnecessária. Se você tem menos de 100 linhas e precisa apenas de classificação básica, uma única tabela plana formatada como Tabela do Excel (Ctrl+T) pode ser suficiente. A normalização oferece mais benefícios para dados que escalam ou precisam de relatórios complexos.
Tabelas Planas vs. Tabelas Estruturadas: Principais Diferenças
| Item | Tabela Plana | Tabela Estruturada (Normalizada) |
|---|---|---|
| Estrutura de Dados | Todos os dados em uma única planilha larga | Dados divididos em várias tabelas relacionadas |
| Redundância de Dados | Alta, com muitos valores repetidos | Baixa, cada fato armazenado uma vez |
| Processo de Atualização | Deve encontrar e editar cada instância de um valor | Editar uma vez na tabela de consulta |
| Tamanho do Arquivo | Maior devido à repetição | Geralmente menor |
| Melhor Caso de Uso | Listas simples, análise única | Dados escaláveis, bancos de dados, relatórios recorrentes |
| Ferramenta Principal do Excel | Intervalos de células básicos ou Tabelas do Excel | Power Query, Modelo de Dados, Tabelas Dinâmicas |
Agora você pode transformar uma tabela plana bagunçada em um modelo de dados estruturado e eficiente. Use o Power Query para automatizar o processo de divisão e limpeza, essencial para construir painéis dinâmicos. Para seu próximo projeto, tente criar uma Tabela Dinâmica a partir do seu novo Modelo de Dados para ver como é fácil resumir dados de várias tabelas relacionadas. Use a interface Gerenciar Modelo de Dados para visualizar e editar todos os relacionamentos de tabelas em uma única exibição de diagrama.