Por que o Copilot no Word corta os rascunhos gerados
🔍 WiseChecker

Por que o Copilot no Word corta os rascunhos gerados

Você pede ao Copilot no Word para redigir um relatório, uma proposta ou um e-mail, e ele para no meio de uma frase ou parágrafo. O texto gerado é cortado abruptamente, deixando você com um rascunho incompleto. Esse corte acontece porque o Copilot tem um limite fixo de tokens de saída por geração e também respeita a janela de contexto do documento atual. Este artigo explica os limites técnicos que causam o corte, mostra como estender a saída gerada e lista outros cenários em que o Copilot para de escrever antes do fim.

Principais conclusões: Evitando o corte do Copilot no Word

  • Limite de tokens de saída do Copilot: O Copilot para de gerar após cerca de 2.000 tokens por solicitação, o que equivale a aproximadamente 1.500 palavras de texto simples.
  • Divisão do prompt: Divida sua solicitação em prompts sequenciais menores para obter rascunhos mais longos sem atingir o limite de tokens.
  • Janela de contexto do documento: O Copilot lê apenas os últimos 8.000 tokens do documento; arquivos muito longos fazem o modelo perder o contexto anterior e parar antes do fim.

Por que o Copilot no Word para de gerar no meio do rascunho

O Copilot é construído sobre um modelo de linguagem grande que processa texto em unidades chamadas tokens. Um token equivale a aproximadamente quatro caracteres em inglês, então uma palavra tem cerca de 1,3 tokens. Cada solicitação de geração do Copilot tem um limite máximo de tokens de saída. No Word, esse limite é de aproximadamente 2.000 tokens. Quando o modelo atinge esse limite, ele para de gerar e retorna o que produziu até o momento.

Limite de tokens por solicitação

O limite de 2.000 tokens se aplica a cada prompt individual enviado. Se você pedir ao Copilot para escrever um capítulo de 5.000 palavras, o modelo vai parar em cerca de 1.500 palavras. Isso não é um bug. É uma restrição de projeto que mantém os tempos de resposta baixos e impede que o modelo gere saídas muito longas e difíceis de editar. O limite é o mesmo no Word, Excel, PowerPoint e Outlook.

Janela de contexto do documento

O Copilot também lê o conteúdo do documento atual para entender o contexto. O modelo só consegue processar um número limitado de tokens do próprio documento. No Word, a janela de contexto é de cerca de 8.000 tokens. Se o documento já contém 7.000 tokens de texto, o Copilot tem apenas 1.000 tokens restantes para a resposta gerada. Isso causa o corte mesmo quando o limite de saída não foi atingido.

Impacto do tamanho do prompt

Seu próprio prompt consome tokens da janela de contexto. Um prompt longo e detalhado, com texto de exemplo, marcadores ou instruções de formatação, reduz o espaço disponível para o rascunho gerado. Por exemplo, um prompt de 500 tokens deixa apenas 1.500 tokens para a saída. O limite efetivo de saída diminui à medida que o prompt cresce.

Passos para obter rascunhos mais longos do Copilot no Word

Método 1: Divida sua solicitação em prompts sequenciais

Em vez de pedir o documento inteiro de uma vez, divida a solicitação em seções lógicas. Isso mantém cada prompt dentro do limite de tokens e permite construir o rascunho completo peça por peça.

  1. Prompt para a primeira seção
    Digite uma solicitação para a primeira parte do documento. Por exemplo: “Escreva o resumo executivo de um relatório de vendas trimestral. Inclua totais de receita e principais impulsionadores de crescimento.” O Copilot gera até 2.000 tokens para esta seção.
  2. Revise e aceite a saída
    Leia o texto gerado. Clique no botão Manter para inseri-lo no documento. O texto mantido passa a fazer parte do contexto do documento para o próximo prompt.
  3. Prompt para a próxima seção
    Posicione o cursor após o texto inserido. Digite um novo prompt para a seção seguinte. Exemplo: “Agora escreva o detalhamento regional para América do Norte e Europa. Use marcadores para cada região.” Cada prompt sequencial redefine o contador de tokens de saída, permitindo gerar outros 2.000 tokens.
  4. Repita até o rascunho estar completo
    Continue com prompts para cada seção subsequente. Este método produz um rascunho completo sem atingir o limite por solicitação.

Método 2: Reduza o tamanho do prompt

Encurte seu prompt para liberar tokens para a saída gerada. Remova exemplos, texto de amostra e instruções de formatação do prompt. Mantenha apenas as instruções essenciais.

  1. Remova texto de exemplo do prompt
    Em vez de dizer “Escreva uma introdução de três parágrafos como esta: [texto de exemplo]”, diga “Escreva uma introdução de três parágrafos.” O modelo não precisa do exemplo para entender a solicitação.
  2. Evite listar regras de formatação
    Não inclua instruções como “Use cabeçalhos em negrito, itálico para citações e listas numeradas.” Isso consome tokens sem melhorar o rascunho. Adicione a formatação manualmente após a geração.
  3. Use prompts de uma frase
    Mantenha cada prompt em uma ou duas frases. Prompts mais longos reduzem o orçamento de saída.

Método 3: Comece com um documento em branco

Se o documento atual for longo, o Copilot pode cortar porque a janela de contexto está quase cheia. Abra um novo documento em branco para a geração do Copilot e depois copie o resultado para o arquivo original.

  1. Abra um novo documento em branco
    Pressione Ctrl+N para criar um novo documento vazio no Word.
  2. Peça ao Copilot no documento em branco
    Digite sua solicitação. Como o documento tem zero tokens, o Copilot pode usar toda a janela de contexto de 8.000 tokens para seu prompt e a saída gerada.
  3. Copie o texto gerado
    Após o Copilot terminar, selecione o texto e pressione Ctrl+C. Volte ao documento original e cole com Ctrl+V.

Se o Copilot ainda cortar após a correção principal

Copilot retorna apenas uma frase ou algumas palavras

Isso geralmente acontece quando o prompt é muito longo e consome a maior parte da janela de contexto. Verifique o tamanho do prompt. Se ele tiver mais de 500 tokens, reduza para 100 tokens ou menos. Verifique também se o documento não está excedendo a janela de contexto de 8.000 tokens. Use um documento em branco para testar.

Copilot gera um rascunho que termina com uma frase incompleta

O modelo pode parar no meio de uma frase quando atinge o limite exato de tokens. Isso é normal. Para corrigir, posicione o cursor no final do texto cortado e digite um novo prompt dizendo “Continue de onde parou.” O Copilot gerará os próximos 2.000 tokens, completando a frase e adicionando mais conteúdo.

Copilot ignora a instrução “Escreva uma página inteira”

O Copilot não consegue seguir instruções de tamanho que excedam seu limite de tokens. Pedir para escrever 3.000 palavras não funcionará. Em vez disso, use o método de prompts divididos descrito acima. Gere cada seção separadamente e combine-as. O modelo produzirá um rascunho total que corresponde ao tamanho solicitado, mas apenas em vários prompts.

O corte ocorre no meio de uma tabela ou lista

Tabelas e listas consomem mais tokens por linha por causa dos caracteres de formatação. Uma tabela com cinco colunas e dez linhas pode usar 500 tokens ou mais. Se o Copilot cortar dentro de uma tabela, reduza o tamanho da tabela no prompt ou peça texto simples. Formate a tabela manualmente após a geração.

Comparação de saída: Copilot com corte vs. redação manual

Item Prompt único Prompts sequenciais
Saída máxima por solicitação ~2.000 tokens (1.500 palavras) Ilimitado em várias solicitações
Janela de contexto usada 8.000 tokens no total, incluindo documento e prompt Cada prompt redefine o contexto, então 8.000 tokens completos por solicitação
Impacto do tamanho do prompt Prompts longos reduzem os tokens de saída disponíveis Prompts curtos por seção maximizam a saída por solicitação
Impacto do tamanho do documento Documentos longos reduzem o contexto disponível para geração Documento em branco ou curto dá janela de contexto completa
Caso de uso típico Parágrafos curtos, e-mails, resumos Relatórios longos, propostas, capítulos

O corte do Copilot no Word não é uma falha da ferramenta. É uma limitação previsível causada pelo limite de tokens e pela janela de contexto. Ao dividir sua solicitação em prompts separados, reduzir o tamanho do prompt e começar com um documento em branco, você pode gerar rascunhos completos sem interrupções. Quando o corte ainda ocorrer, use o prompt “Continue” para estender a saída. Essas técnicas permitem trabalhar dentro dos limites do Copilot e produzir documentos completos.