Por que resultados de pesquisa mostram documentos excluídos
🔍 WiseChecker

Por que resultados de pesquisa mostram documentos excluídos

Você pesquisa um documento no SharePoint e o vê nos resultados. Mas ao clicar no link, o arquivo sumiu. Você ou um colega o excluiu dias ou semanas atrás. Isso acontece porque a pesquisa do SharePoint não remove itens excluídos do índice imediatamente. O índice de busca é reconstruído em um agendamento, e documentos excluídos podem permanecer visíveis até o próximo rastreamento terminar.

O SharePoint usa um processo em segundo plano chamado rastreamento para escanear o conteúdo do site e construir um índice de busca. Quando você exclui um documento de uma biblioteca, o serviço de pesquisa não recebe uma notificação em tempo real na maioria das configurações. O item permanece no índice até que o rastreador execute novamente e detecte a exclusão. Este artigo explica por que documentos excluídos aparecem nos resultados de pesquisa e como removê-los mais rapidamente.

Principais conclusões: Por que documentos excluídos ainda aparecem na pesquisa do SharePoint

  • Central de administração do SharePoint > Pesquisa > Esquema de pesquisa: Mostra o agendamento de rastreamento e o status do índice do seu locatário.
  • Agendamento de rastreamento da fonte de conteúdo: Controla a frequência com que o índice de pesquisa é atualizado; o padrão pode ser de 15 minutos ou mais.
  • Rastreamento incremental vs. Rastreamento completo: O incremental captura a maioria das alterações; o completo reconstrói todo o índice e remove todas as entradas obsoletas.

ADVERTISEMENT

Por que o índice de pesquisa retém documentos excluídos

A pesquisa do SharePoint não sincroniza diretamente com eventos de exclusão de arquivos. O índice de pesquisa é um banco de dados separado que armazena metadados e conteúdo de itens rastreados. Quando você exclui um documento, o SharePoint remove o arquivo do banco de dados de conteúdo, mas o índice de pesquisa ainda mantém uma cópia dos metadados e do texto desse documento. O índice só é atualizado quando o serviço de pesquisa realiza um rastreamento.

O processo de rastreamento funciona em dois modos. Um rastreamento incremental verifica itens que mudaram desde o último rastreamento. Ele marca itens excluídos como removidos e os remove do índice. Um rastreamento completo reconstrói todo o índice do zero. Rastreamentos completos são mais lentos e usam mais recursos. Por padrão, o SharePoint Online executa rastreamentos incrementais a cada 15 minutos. O SharePoint on-premises pode ser configurado para qualquer intervalo, geralmente de 15 a 60 minutos. Se um documento foi excluído após o último rastreamento incremental, ele ainda aparecerá nos resultados de pesquisa até o próximo rastreamento.

Esquema de pesquisa e agendamento de rastreamento

O esquema de pesquisa define como o conteúdo é indexado e recuperado. Inclui propriedades gerenciadas, propriedades rastreadas e regras para fontes de conteúdo. O agendamento de rastreamento é configurado por fonte de conteúdo. Uma fonte de conteúdo define quais coleções de sites ou aplicativos web o rastreador examina. Se o agendamento de rastreamento for definido com um intervalo longo, documentos excluídos permanecem visíveis por mais tempo. No SharePoint Online, a Microsoft gerencia o agendamento de rastreamento, mas você pode solicitar uma atualização imediata do índice em certos cenários.

Lixeira e índice de pesquisa

Quando você exclui um documento, ele vai para a Lixeira do site. O documento ainda está acessível para usuários com permissões na Lixeira. A pesquisa continua indexando o documento até que ele seja removido completamente da Lixeira. Se o documento estiver na Lixeira de segundo estágio, ele ainda pode aparecer nos resultados de pesquisa. Somente após o período de retenção expirar e o documento ser excluído permanentemente é que o índice de pesquisa eventualmente o remove.

Passos para remover documentos excluídos dos resultados de pesquisa

Você pode tomar várias ações para remover documentos excluídos dos resultados de pesquisa. O método depende se você usa SharePoint Online ou SharePoint Server on-premises, e se tem permissões de administrador.

  1. Disparar um rastreamento incremental no SharePoint Server
    Se você tem SharePoint Server on-premises, vá para Central de Administração > Gerenciamento de Aplicativos > Gerenciar aplicativos de serviço. Clique no aplicativo de serviço de Pesquisa. Em Rastreamento, clique em Fontes de Conteúdo. Selecione a fonte de conteúdo que contém o site com documentos excluídos. Na faixa de opções, clique em Iniciar Rastreamento Incremental. O rastreamento removerá itens excluídos do índice após a conclusão.
  2. Solicitar um rastreamento completo no SharePoint Server
    Se o rastreamento incremental não limpar os itens, execute um rastreamento completo. Na mesma página de Fontes de Conteúdo, selecione a fonte de conteúdo e clique em Iniciar Rastreamento Completo. Um rastreamento completo reconstrói todo o índice. Isso leva mais tempo, mas garante que todos os documentos excluídos sejam removidos.
  3. Limpar o índice de pesquisa no SharePoint Online
    O SharePoint Online não expõe controles de rastreamento para administradores de locatário. Para forçar uma atualização, você pode reindexar a coleção de sites. Vá para Central de administração do SharePoint > Sites ativos. Selecione o site que contém os documentos excluídos. Clique em Configurações > Administração da coleção de sites > Pesquisa e disponibilidade offline. Em Reindexar site, clique em Reindexar. Isso dispara uma reindexação completa desse site. O processo pode levar várias horas.
  4. Excluir permanentemente documentos da Lixeira
    Abra o site onde o documento foi excluído. Clique em Lixeira na navegação à esquerda. Selecione o documento e clique em Excluir. Se o documento estiver na Lixeira de segundo estágio, clique em Lixeira de segundo estágio, selecione o documento e clique em Excluir. Excluir permanentemente o documento garante que o índice de pesquisa o remova no próximo rastreamento.
  5. Usar configurações de Pesquisa e disponibilidade offline
    No SharePoint Online, vá em Configurações do site > Pesquisa e disponibilidade offline. Em Indexar conteúdo do site, selecione Não para excluir o site dos resultados de pesquisa completamente. Esta é uma medida drástica e deve ser usada apenas para sites que não devem aparecer na pesquisa. Após alterar para Não, o conteúdo do site é removido do índice no próximo rastreamento.

ADVERTISEMENT

Se os resultados de pesquisa ainda mostrarem documentos excluídos após a correção principal

Resultado de pesquisa mostra um documento que foi excluído há meses

Se um documento excluído há meses ainda aparecer, o índice de pesquisa pode ter uma entrada obsoleta que não foi removida durante rastreamentos normais. Isso pode acontecer se a fonte de conteúdo foi pausada ou se o rastreador encontrou erros. No SharePoint Server, verifique o log de rastreamento para erros nessa fonte de conteúdo. No SharePoint Online, abra um ticket de suporte com a Microsoft. Forneça a URL do documento excluído e a URL da coleção de sites. A Microsoft pode remover manualmente o item do índice de pesquisa.

Documento excluído aparece na pesquisa, mas não na biblioteca

Este é o sintoma padrão de um rastreamento atrasado. Aguarde o próximo rastreamento incremental ser concluído. No SharePoint Online, você pode verificar o status do rastreamento na Central de administração do SharePoint > Pesquisa > Log de rastreamento. Se o rastreamento foi concluído recentemente e o item ainda está lá, execute uma reindexação conforme descrito no Passo 3.

Documento excluído aparece nos resultados de pesquisa para usuários externos

Usuários externos podem ver documentos excluídos nos resultados de pesquisa se o item foi compartilhado externamente antes da exclusão. O link do resultado de pesquisa falhará com um erro 404. Para evitar isso, remova as permissões de compartilhamento externo antes de excluir documentos. Após a exclusão, usuários externos ainda podem ver o resultado até que o rastreamento o remova. Os mesmos passos de reindexação se aplicam.

Item Rastreamento Incremental Rastreamento Completo
Descrição Examina itens que mudaram desde o último rastreamento Reconstrói todo o índice do zero
Velocidade Rápido, geralmente minutos Lento, pode levar horas
Remove documentos excluídos Sim, se o documento foi excluído após o último rastreamento Sim, remove todas as entradas obsoletas
Uso de recursos Baixo Alto
Quando usar Atualizações rotineiras Quando o rastreamento incremental falha ou o índice está corrompido

Agora você entende por que documentos excluídos persistem nos resultados de pesquisa. O índice de pesquisa é atualizado em um agendamento, não em tempo real. Para acelerar a remoção, dispare uma reindexação do site ou execute um rastreamento completo em ambientes on-premises. Sempre exclua permanentemente itens da Lixeira para garantir que o próximo rastreamento os remova. Para problemas persistentes, verifique o log de rastreamento ou entre em contato com o Suporte da Microsoft para limpeza manual do índice.

ADVERTISEMENT