Você tem um documento do Word com fontes, cores, tabelas e imagens, mas precisa extrair apenas o texto bruto. Isso é comum ao exportar conteúdo para um editor de código, colar em um campo de texto simples ou preparar um arquivo para um sistema que não interpreta formatação rica. O Word inclui um formato de exportação dedicado Texto Puro que remove toda formatação, imagens e layout, preservando os caracteres de texto e as quebras de linha.
Este artigo explica como salvar um arquivo do Word como texto puro usando a caixa de diálogo Salvar Como. Você aprenderá quais configurações escolher, o que acontece com seu conteúdo durante a conversão e como evitar problemas comuns, como perda de quebras de linha ou caracteres distorcidos.
Principais Conclusões: Salvar um Documento do Word como Texto Puro
- Arquivo > Salvar Como > Texto Puro (txt): Remove toda formatação, imagens, tabelas e objetos incorporados; mantém apenas caracteres de texto e quebras de linha.
- Caixa de diálogo Conversão de Arquivo durante Salvar Como: Permite escolher a codificação de texto (padrão Windows, MS-DOS ou Unicode) e controlar o comportamento das quebras de linha.
- Colar Especial > Texto Não Formatado: Uma alternativa para copiar texto de um documento do Word sem salvar um arquivo separado.
Como Funciona a Exportação de Texto Puro no Word
Ao salvar um documento do Word como arquivo de texto puro, o Word descarta todos os elementos de formatação que não podem ser representados em um fluxo de texto simples. Isso inclui fontes, tamanhos, cores, negrito e itálico, sublinhado, tabelas, imagens, hiperlinks, cabeçalhos e rodapés, números de página e quaisquer objetos incorporados. O arquivo .txt resultante contém apenas os caracteres de texto, espaços, tabulações e quebras de linha.
O Word usa as marcas de parágrafo ativas e quebras de linha manuais para determinar onde as linhas terminam no arquivo de texto. Se o documento tiver quebras de seção ou coluna, elas são convertidas em quebras de linha. As quebras de página são ignoradas, pois o texto puro não tem conceito de páginas.
Você também controla a codificação de texto durante o processo de salvamento. A codificação determina como caracteres como letras acentuadas, símbolos e scripts não latinos são armazenados. Escolher a codificação errada pode produzir texto distorcido, portanto, este artigo aborda as opções seguras.
Passos para Salvar um Arquivo do Word como Texto Puro
- Abra o documento no Word
Inicie o Word e abra o documento que deseja converter. Verifique se o conteúdo está finalizado e se você não precisa de formatação na saída. - Abra a caixa de diálogo Salvar Como
Clique em Arquivo no canto superior esquerdo e selecione Salvar Como. Escolha um local como Este Computador ou OneDrive. - Selecione Texto Puro como tipo de arquivo
Na lista suspensa Salvar como tipo, role para baixo e escolha Texto Puro (txt). Não selecione Documento do Word (docx) ou qualquer outro formato. - Nomeie o arquivo e escolha um local
Digite um nome para seu arquivo de texto no campo Nome do arquivo. Navegue até a pasta onde deseja salvá-lo. - Clique em Salvar para abrir a caixa de diálogo Conversão de Arquivo
Pressione o botão Salvar. O Word exibe imediatamente a caixa de diálogo Conversão de Arquivo. Esta caixa de diálogo controla como o texto é codificado e como as quebras de linha são tratadas. - Escolha o tipo de codificação de texto
Na caixa de diálogo Conversão de Arquivo, em Codificação de texto, selecione uma destas opções:– Windows (Padrão): Usa a página de código ANSI da sua localidade. Melhor para inglês e idiomas da Europa Ocidental.
– MS-DOS: Usa a página de código OEM. Necessário se o arquivo de texto for usado em aplicativos DOS legados.
– Outra codificação: Abre uma lista de todas as páginas de código disponíveis. Escolha Unicode (UTF-8) se seu documento contiver caracteres de vários idiomas ou símbolos especiais. UTF-8 é a escolha mais segura para sistemas modernos.Selecione o botão de opção ao lado da codificação preferida.
- Defina o comportamento das quebras de linha
Na mesma caixa de diálogo, em Finalizar linhas com, escolha:– CR / LF (Windows): Adiciona uma quebra de linha (retorno de carro e alimentação de linha) em cada quebra de linha. Este é o padrão para arquivos de texto do Windows.
– CR (Mac): Adiciona apenas um retorno de carro. Use esta opção se o arquivo for aberto em sistemas Mac antigos.
– LF (Unix): Adiciona apenas uma alimentação de linha. Use esta opção se o arquivo for usado em Linux ou macOS moderno.Para a maioria dos usuários, CR / LF (Windows) é a escolha correta.
- Permita substituição de caracteres, se necessário
Marque a caixa Permitir substituição de caracteres se seu documento contiver caracteres que não podem ser representados na codificação escolhida. Quando marcada, o Word substitui caracteres não suportados pelo equivalente ASCII mais próximo. Por exemplo, um travessão se torna dois hífens. Deixe desmarcado se quiser que o Word alerte sobre caracteres não suportados. - Clique em OK para concluir a conversão
Pressione o botão OK. O Word cria o arquivo .txt e fecha a caixa de diálogo. O arquivo .docx original permanece inalterado.
Problemas Comuns ao Salvar como Texto Puro
Quebras de linha ausentes ou texto em um único parágrafo longo
Se o arquivo de texto resultante não mostrar quebras de linha, o documento original provavelmente usou quebras de linha manuais (Shift+Enter) em vez de marcas de parágrafo (Enter). O Word trata quebras de linha manuais como quebras suaves e pode não convertê-las em quebras de linha no arquivo de texto. Para corrigir isso, abra o documento original, pressione Ctrl+H para abrir Localizar e Substituir, pesquise por ^l (quebra de linha manual) e substitua por ^p (marca de parágrafo), depois repita o processo de Salvar Como.
Caracteres especiais ou letras acentuadas aparecem como texto distorcido
Isso acontece quando a codificação selecionada na caixa de diálogo Conversão de Arquivo não corresponde aos caracteres do seu documento. Salve o arquivo novamente e escolha Outra codificação e depois Unicode (UTF-8). UTF-8 suporta todos os caracteres e símbolos usados em documentos modernos. Se o arquivo precisar ser aberto em um aplicativo mais antigo que não suporta UTF-8, escolha a página de código que corresponde ao idioma do texto, como Europa Ocidental (Windows) para inglês ou francês.
Tabelas e listas perdem sua estrutura
O texto puro não tem conceito de tabelas, colunas ou listas com marcadores. O Word converte células de tabela em uma única linha de texto separada por tabulações. Listas com marcadores e numeradas perdem seus caracteres de marcador e números. Para preservar alguma estrutura, converta manualmente as tabelas em texto separado por tabulações no Word antes de salvar. Selecione a tabela, vá em Layout em Ferramentas de Tabela, clique em Converter em Texto e escolha Tabulações como separador.
Exportação de Texto Puro vs Outros Métodos para Remover Formatação
| Item | Salvar Como Texto Puro (txt) | Colar Especial > Texto Não Formatado |
|---|---|---|
| Tipo de saída | Novo arquivo .txt no disco | Texto colado em outro aplicativo (nenhum arquivo criado) |
| Formatação removida | Toda formatação, imagens, tabelas, cabeçalhos, rodapés | Toda formatação, imagens, tabelas, hiperlinks |
| Controle de quebra de linha | Escolher CR/LF, CR ou LF na caixa de diálogo Conversão de Arquivo | Usa as quebras de linha do texto copiado como estão |
| Controle de codificação | Escolher Windows, MS-DOS ou Unicode (UTF-8) | Usa a codificação padrão do aplicativo de destino |
| Melhor caso de uso | Criar um arquivo de texto permanente para arquivamento ou código | Colar rapidamente texto não formatado em um e-mail ou editor |
Agora você pode salvar qualquer documento do Word como texto puro sem formatação. Use o caminho Arquivo > Salvar Como > Texto Puro (txt) e escolha a codificação UTF-8 para obter o suporte mais amplo a caracteres. Se você só precisa copiar uma parte do documento, use Ctrl+Shift+V ou Colar Especial > Texto Não Formatado para colar sem formatação. Para conversões em lote, considere usar uma macro que percorra todos os arquivos .docx em uma pasta e salve cada um como .txt com codificação UTF-8.