Você pede ao Copilot no Word para redigir um relatório, uma proposta ou um e-mail, e ele para no meio de uma frase ou parágrafo. O texto gerado é cortado abruptamente, deixando você com um rascunho incompleto. Esse corte acontece porque o Copilot tem um limite fixo de tokens de saída por geração e também respeita a janela de contexto do documento atual. Este artigo explica os limites técnicos que causam o corte, mostra como estender a saída gerada e lista outros cenários em que o Copilot para de escrever antes do fim.
Principais conclusões: Evitando o corte do Copilot no Word
- Limite de tokens de saída do Copilot: O Copilot para de gerar após cerca de 2.000 tokens por solicitação, o que equivale a aproximadamente 1.500 palavras de texto simples.
- Divisão do prompt: Divida sua solicitação em prompts sequenciais menores para obter rascunhos mais longos sem atingir o limite de tokens.
- Janela de contexto do documento: O Copilot lê apenas os últimos 8.000 tokens do documento; arquivos muito longos fazem o modelo perder o contexto anterior e parar antes do fim.
Por que o Copilot no Word para de gerar no meio do rascunho
O Copilot é construído sobre um modelo de linguagem grande que processa texto em unidades chamadas tokens. Um token equivale a aproximadamente quatro caracteres em inglês, então uma palavra tem cerca de 1,3 tokens. Cada solicitação de geração do Copilot tem um limite máximo de tokens de saída. No Word, esse limite é de aproximadamente 2.000 tokens. Quando o modelo atinge esse limite, ele para de gerar e retorna o que produziu até o momento.
Limite de tokens por solicitação
O limite de 2.000 tokens se aplica a cada prompt individual enviado. Se você pedir ao Copilot para escrever um capítulo de 5.000 palavras, o modelo vai parar em cerca de 1.500 palavras. Isso não é um bug. É uma restrição de projeto que mantém os tempos de resposta baixos e impede que o modelo gere saídas muito longas e difíceis de editar. O limite é o mesmo no Word, Excel, PowerPoint e Outlook.
Janela de contexto do documento
O Copilot também lê o conteúdo do documento atual para entender o contexto. O modelo só consegue processar um número limitado de tokens do próprio documento. No Word, a janela de contexto é de cerca de 8.000 tokens. Se o documento já contém 7.000 tokens de texto, o Copilot tem apenas 1.000 tokens restantes para a resposta gerada. Isso causa o corte mesmo quando o limite de saída não foi atingido.
Impacto do tamanho do prompt
Seu próprio prompt consome tokens da janela de contexto. Um prompt longo e detalhado, com texto de exemplo, marcadores ou instruções de formatação, reduz o espaço disponível para o rascunho gerado. Por exemplo, um prompt de 500 tokens deixa apenas 1.500 tokens para a saída. O limite efetivo de saída diminui à medida que o prompt cresce.
Passos para obter rascunhos mais longos do Copilot no Word
Método 1: Divida sua solicitação em prompts sequenciais
Em vez de pedir o documento inteiro de uma vez, divida a solicitação em seções lógicas. Isso mantém cada prompt dentro do limite de tokens e permite construir o rascunho completo peça por peça.
- Prompt para a primeira seção
Digite uma solicitação para a primeira parte do documento. Por exemplo: “Escreva o resumo executivo de um relatório de vendas trimestral. Inclua totais de receita e principais impulsionadores de crescimento.” O Copilot gera até 2.000 tokens para esta seção. - Revise e aceite a saída
Leia o texto gerado. Clique no botão Manter para inseri-lo no documento. O texto mantido passa a fazer parte do contexto do documento para o próximo prompt. - Prompt para a próxima seção
Posicione o cursor após o texto inserido. Digite um novo prompt para a seção seguinte. Exemplo: “Agora escreva o detalhamento regional para América do Norte e Europa. Use marcadores para cada região.” Cada prompt sequencial redefine o contador de tokens de saída, permitindo gerar outros 2.000 tokens. - Repita até o rascunho estar completo
Continue com prompts para cada seção subsequente. Este método produz um rascunho completo sem atingir o limite por solicitação.
Método 2: Reduza o tamanho do prompt
Encurte seu prompt para liberar tokens para a saída gerada. Remova exemplos, texto de amostra e instruções de formatação do prompt. Mantenha apenas as instruções essenciais.
- Remova texto de exemplo do prompt
Em vez de dizer “Escreva uma introdução de três parágrafos como esta: [texto de exemplo]”, diga “Escreva uma introdução de três parágrafos.” O modelo não precisa do exemplo para entender a solicitação. - Evite listar regras de formatação
Não inclua instruções como “Use cabeçalhos em negrito, itálico para citações e listas numeradas.” Isso consome tokens sem melhorar o rascunho. Adicione a formatação manualmente após a geração. - Use prompts de uma frase
Mantenha cada prompt em uma ou duas frases. Prompts mais longos reduzem o orçamento de saída.
Método 3: Comece com um documento em branco
Se o documento atual for longo, o Copilot pode cortar porque a janela de contexto está quase cheia. Abra um novo documento em branco para a geração do Copilot e depois copie o resultado para o arquivo original.
- Abra um novo documento em branco
Pressione Ctrl+N para criar um novo documento vazio no Word. - Peça ao Copilot no documento em branco
Digite sua solicitação. Como o documento tem zero tokens, o Copilot pode usar toda a janela de contexto de 8.000 tokens para seu prompt e a saída gerada. - Copie o texto gerado
Após o Copilot terminar, selecione o texto e pressione Ctrl+C. Volte ao documento original e cole com Ctrl+V.
Se o Copilot ainda cortar após a correção principal
Copilot retorna apenas uma frase ou algumas palavras
Isso geralmente acontece quando o prompt é muito longo e consome a maior parte da janela de contexto. Verifique o tamanho do prompt. Se ele tiver mais de 500 tokens, reduza para 100 tokens ou menos. Verifique também se o documento não está excedendo a janela de contexto de 8.000 tokens. Use um documento em branco para testar.
Copilot gera um rascunho que termina com uma frase incompleta
O modelo pode parar no meio de uma frase quando atinge o limite exato de tokens. Isso é normal. Para corrigir, posicione o cursor no final do texto cortado e digite um novo prompt dizendo “Continue de onde parou.” O Copilot gerará os próximos 2.000 tokens, completando a frase e adicionando mais conteúdo.
Copilot ignora a instrução “Escreva uma página inteira”
O Copilot não consegue seguir instruções de tamanho que excedam seu limite de tokens. Pedir para escrever 3.000 palavras não funcionará. Em vez disso, use o método de prompts divididos descrito acima. Gere cada seção separadamente e combine-as. O modelo produzirá um rascunho total que corresponde ao tamanho solicitado, mas apenas em vários prompts.
O corte ocorre no meio de uma tabela ou lista
Tabelas e listas consomem mais tokens por linha por causa dos caracteres de formatação. Uma tabela com cinco colunas e dez linhas pode usar 500 tokens ou mais. Se o Copilot cortar dentro de uma tabela, reduza o tamanho da tabela no prompt ou peça texto simples. Formate a tabela manualmente após a geração.
Comparação de saída: Copilot com corte vs. redação manual
| Item | Prompt único | Prompts sequenciais |
|---|---|---|
| Saída máxima por solicitação | ~2.000 tokens (1.500 palavras) | Ilimitado em várias solicitações |
| Janela de contexto usada | 8.000 tokens no total, incluindo documento e prompt | Cada prompt redefine o contexto, então 8.000 tokens completos por solicitação |
| Impacto do tamanho do prompt | Prompts longos reduzem os tokens de saída disponíveis | Prompts curtos por seção maximizam a saída por solicitação |
| Impacto do tamanho do documento | Documentos longos reduzem o contexto disponível para geração | Documento em branco ou curto dá janela de contexto completa |
| Caso de uso típico | Parágrafos curtos, e-mails, resumos | Relatórios longos, propostas, capítulos |
O corte do Copilot no Word não é uma falha da ferramenta. É uma limitação previsível causada pelo limite de tokens e pela janela de contexto. Ao dividir sua solicitação em prompts separados, reduzir o tamanho do prompt e começar com um documento em branco, você pode gerar rascunhos completos sem interrupções. Quando o corte ainda ocorrer, use o prompt “Continue” para estender a saída. Essas técnicas permitem trabalhar dentro dos limites do Copilot e produzir documentos completos.