Você carrega um arquivo PDF em uma biblioteca de documentos do SharePoint, mas ao pesquisar pelo título ou conteúdo, o SharePoint não retorna resultados. Esse problema ocorre porque o índice de pesquisa ainda não processou o arquivo, o PDF está bloqueado por regras de indexação ou o arquivo está armazenado em um local que a pesquisa não rastreia. Este artigo explica por que PDFs recém-carregados podem não aparecer nos resultados da pesquisa e fornece as etapas exatas que os proprietários do site devem seguir para verificar e corrigir o problema.
Principais Conclusões: Corrigir Pesquisa do SharePoint Não Encontra Arquivos PDF
- Central de administração do SharePoint > Pesquisa > Log de rastreamento: Verifique se o PDF foi rastreado e se ocorreram erros durante a indexação.
- Configurações do site > Pesquisa e disponibilidade offline: Garanta que a biblioteca de documentos esteja configurada para permitir que itens apareçam nos resultados da pesquisa.
- Propriedades do arquivo PDF: Confirme que o arquivo não está com check-out, não tem caracteres especiais no nome e tem menos de 150 MB.
Por que a Pesquisa do SharePoint Não Indexa um Novo PDF Imediatamente
O SharePoint usa um processo de rastreamento agendado para adicionar arquivos novos ou alterados ao seu índice de pesquisa. Quando você carrega um arquivo PDF, o serviço de pesquisa não o indexa em tempo real. O intervalo padrão de rastreamento incremental para SharePoint Online é de 1 a 15 minutos, mas rastreamentos completos podem levar horas. Se o PDF foi carregado nos últimos minutos, pode ser que ainda não tenha sido rastreado.
Além do tempo, vários motivos técnicos podem impedir que um PDF seja indexado:
Limites de Extração de Conteúdo de Arquivos PDF
A pesquisa do SharePoint usa um iFilter para extrair texto de arquivos PDF. Se o PDF for baseado em imagem digitalizada sem texto incorporado, o iFilter não consegue extrair nada e o arquivo não aparecerá em pesquisas de conteúdo. Além disso, arquivos PDF com mais de 150 MB ou com mais de 1.000 páginas são ignorados durante o rastreamento.
Configurações de Pesquisa no Nível da Biblioteca
Cada biblioteca de documentos tem uma configuração que controla se seus itens aparecem nos resultados da pesquisa. Se um proprietário ou administrador do site desativou a visibilidade de pesquisa para essa biblioteca, todos os arquivos dentro dela se tornam invisíveis para a pesquisa, independentemente do status do rastreamento.
Metadados e Permissões do Arquivo
A pesquisa do SharePoint respeita o corte de segurança. Se um usuário não tiver pelo menos permissão de Leitura no arquivo PDF, os resultados da pesquisa não mostrarão esse arquivo para esse usuário. Além disso, arquivos com certos valores de metadados — como um tipo de conteúdo excluído da indexação — serão ignorados.
Etapas para Diagnosticar e Corrigir Problemas de Pesquisa de PDF
Siga estas etapas em ordem para identificar por que um arquivo PDF específico não está aparecendo nos resultados da pesquisa do SharePoint.
- Verifique o log de rastreamento da pesquisa
Vá para Central de administração do SharePoint > Pesquisa > Log de rastreamento. Procure pela URL do arquivo PDF. Se o arquivo aparecer com o status “Sucesso”, o índice o contém. Se o status for “Erro” ou “Aviso”, clique na entrada para ver a mensagem de erro específica. Erros comuns incluem “O tipo de arquivo não é suportado” (para PDFs corrompidos) ou “Acesso negado” (problema de permissão). - Verifique a visibilidade de pesquisa da biblioteca
Navegue até a biblioteca de documentos que contém o PDF. Clique no ícone de engrenagem e selecione Configurações da biblioteca. Em Configurações gerais, clique em Pesquisa e disponibilidade offline. Certifique-se de que a opção “Permitir que itens desta biblioteca de documentos apareçam nos resultados da pesquisa?” esteja definida como Sim. Se estiver definida como Não, altere para Sim e clique em OK. - Force uma reindexação da biblioteca
Na mesma página de Configurações da biblioteca, clique em Configurações avançadas. Role até a seção Reindexar biblioteca de documentos e clique no botão Reindexar. Isso marca a biblioteca para um rastreamento completo durante o próximo ciclo de rastreamento agendado. Observe que isso não aciona um rastreamento imediato; apenas define um sinalizador para o próximo rastreamento incremental. - Verifique as propriedades do arquivo PDF
Selecione o arquivo PDF na biblioteca e clique no painel de informações (ícone i). Verifique se o arquivo não está com check-out para outro usuário. Verifique o nome do arquivo — remova caracteres especiais como &, %, # ou espaços. Renomeie o arquivo para um nome simples como relatorio.pdf, se necessário. Certifique-se de que o tamanho do arquivo seja inferior a 150 MB. - Teste com um tipo de arquivo diferente
Carregue um arquivo de texto simples (.txt) ou um documento do Word (.docx) na mesma biblioteca. Pesquise pelo seu conteúdo. Se o novo arquivo aparecer imediatamente, o problema é específico para PDFs. Se também não aparecer, o problema está nas configurações de pesquisa da biblioteca ou do site. - Solicite um rastreamento completo (apenas administrador do SharePoint)
Se você for um administrador do SharePoint, vá para Central de administração do SharePoint > Pesquisa > Gerenciar esquema de pesquisa. Clique na guia Agendamentos de rastreamento. Em Rastreamento completo, clique em Iniciar rastreamento completo. Isso pode levar várias horas, mas capturará todos os arquivos que foram perdidos anteriormente devido a erros.
Quando o PDF Ainda Não Aparece nos Resultados da Pesquisa
A pesquisa do SharePoint não encontra o conteúdo do PDF após a reindexação
Se o log de rastreamento mostrar sucesso, mas o conteúdo do PDF não aparecer na pesquisa, é provável que o PDF contenha imagens digitalizadas sem texto incorporado. A pesquisa do SharePoint não consegue extrair texto de imagens. Use um software de reconhecimento óptico de caracteres para converter o PDF digitalizado em um PDF pesquisável com texto selecionável e recarregue o arquivo.
Os resultados da pesquisa mostram o título do PDF, mas não o arquivo
Isso geralmente significa que o usuário que está realizando a pesquisa não tem permissão para visualizar o arquivo. Verifique as permissões do arquivo selecionando o PDF, clicando nas reticências (…) e depois em Gerenciar acesso. Certifique-se de que o usuário ou grupo tenha pelo menos permissão de Leitura. Se as permissões forem herdadas da biblioteca, verifique se as permissões da biblioteca não estão configuradas para restringir o acesso.
Arquivos PDF em subpastas estão ausentes na pesquisa
A pesquisa do SharePoint rastreia todas as subpastas por padrão, a menos que a biblioteca tenha sido configurada para excluir pastas específicas. Vá para Configurações da biblioteca > Configurações avançadas. Em Pesquisa, confirme se “Permitir que itens desta biblioteca de documentos apareçam nos resultados da pesquisa?” está definido como Sim. Se estiver, verifique as permissões de cada subpasta — uma pasta com herança quebrada e sem acesso de Leitura para a conta de pesquisa pode ocultar seu conteúdo.
Comportamento da Pesquisa de PDF: SharePoint Online vs SharePoint On-Premises
| Item | SharePoint Online | SharePoint On-Premises |
|---|---|---|
| Agendamento de rastreamento | Incremental a cada 1-15 min; rastreamento completo sob demanda | Configurável via Search Service Application; incremental padrão a cada 5 min |
| iFilter de PDF | Integrado; nenhuma instalação necessária | É necessário instalar o Adobe PDF iFilter ou equivalente de terceiros |
| Tamanho máximo de PDF indexado | 150 MB | Configurável; padrão 50 MB |
| Gatilho de reindexação | Configuração da biblioteca > Botão Reindexar | Rastreamento completo ou redefinição da fonte de conteúdo |
| Corte de segurança | Sempre aplicado | Sempre aplicado |
Proprietários de sites que trabalham com SharePoint on-premises também devem verificar se o iFilter de PDF está instalado e registrado corretamente. Sem ele, os arquivos PDF são tratados como arquivos binários e apenas o nome do arquivo e os metadados são indexados, não o conteúdo do texto.
Após concluir essas verificações, os proprietários do site podem determinar com segurança por que um arquivo PDF está ausente nos resultados da pesquisa e aplicar a correção adequada. A causa mais comum é o tempo — aguardar o próximo rastreamento incremental. Se o arquivo ainda não aparecer, verifique a configuração de visibilidade de pesquisa da biblioteca e o log de rastreamento em busca de erros. Para problemas persistentes com conteúdo de PDF não pesquisável, converta PDFs digitalizados para o formato pesquisável por texto usando software OCR antes de carregar.