Erro ‘Página Não Pode Ser Buscada’ do Perplexity para URL Específica
🔍 WiseChecker

Erro ‘Página Não Pode Ser Buscada’ do Perplexity para URL Específica

Quando você pede ao Perplexity para analisar ou resumir uma página web específica, pode ver a mensagem de erro “Page Cannot Be Fetched.” Esse erro significa que o Perplexity não conseguiu baixar o conteúdo da página do servidor. A causa geralmente é uma restrição do site, um problema de rede ou uma limitação na capacidade de rastreamento do Perplexity. Este artigo explica por que o erro ocorre, como corrigi-lo para a URL específica e o que fazer se o problema persistir.

Principais conclusões: Corrigindo o erro Page Cannot Be Fetched no Perplexity

  • Verifique o formato da URL: Certifique-se de que o link comece com http:// ou https:// e não contenha erros de digitação ou caracteres especiais.
  • Teste a URL em um navegador: Abra o link você mesmo para verificar se a página carrega e não está atrás de um login ou paywall.
  • Use o limite de rastreamento maior do Perplexity Pro: Contas Pro podem buscar páginas maiores — faça upgrade se você encontrar esse erro com frequência.

ADVERTISEMENT

Por que o Perplexity não consegue buscar uma URL específica

O Perplexity usa um rastreador automatizado para baixar o conteúdo de uma URL que você envia. O rastreador envia uma solicitação HTTP ao servidor do site e espera uma resposta bem-sucedida com texto HTML. Se o servidor recusar a solicitação, retornar um código de erro ou a página for muito grande, o Perplexity mostra o erro “Page Cannot Be Fetched”.

Os motivos técnicos mais comuns são:

Site bloqueia rastreadores automatizados

Muitos sites usam um arquivo robots.txt ou regras no servidor para bloquear bots. O rastreador do Perplexity pode ter o acesso negado. O servidor retorna um status 403 Forbidden ou 404 Not Found. Alguns sites também exigem renderização de JavaScript, o que o Perplexity não suporta.

Paywalls e portais de login

Páginas atrás de uma assinatura, formulário de login ou verificação de idade não podem ser buscadas. O rastreador não tem credenciais para contornar essas barreiras. Exemplos incluem sites de notícias com paywall medido e portais privados de empresas.

Limites de tamanho ou complexidade da página

O Perplexity tem um tamanho máximo de busca. Se a página for muito grande, contiver muitas imagens ou usar JavaScript pesado, o rastreador pode exceder o tempo limite ou se recusar a baixar todo o conteúdo. Contas gratuitas têm um limite menor do que contas Pro.

Problemas de rede ou DNS

Indisponibilidade temporária do servidor, registros DNS incorretos ou a URL apontando para um domínio inexistente podem causar falhas na busca. O erro pode aparecer para uma URL específica, mas não para outras no mesmo domínio.

Passos para diagnosticar e corrigir o erro de busca para uma URL específica

Siga estes passos em ordem. Pare quando o erro desaparecer.

  1. Verifique a URL em um navegador
    Abra a URL exata em um navegador padrão como Chrome ou Edge. Verifique se a página carrega corretamente e mostra conteúdo de texto. Se a página exibir um formulário de login, paywall ou tela em branco, o Perplexity não conseguirá buscá-la.
  2. Copie a URL sem caracteres extras
    Destaque a URL na barra de endereços do navegador e copie-a. Cole no Perplexity. Não inclua parâmetros de rastreamento, utm_source ou fragmentos a menos que necessário. Parâmetros extras podem confundir o rastreador.
  3. Use a versão https://
    Se a URL usar http://, mude para https://. Muitos sites forçam HTTPS e redirecionam solicitações http. O Perplexity pode não seguir o redirecionamento corretamente. Exemplo: mude http://exemplo.com/pagina para https://exemplo.com/pagina.
  4. Encurte a URL para o artigo principal
    Se a URL for muito longa ou contiver uma query string, tente remover tudo após o ponto de interrogação. Por exemplo, use https://exemplo.com/artigo em vez de https://exemplo.com/artigo?id=12345&ref=home. A URL mais simples geralmente funciona melhor.
  5. Teste com uma URL diferente no mesmo domínio
    Peça ao Perplexity para buscar uma página diferente do mesmo site. Se essa página funcionar, a URL original tem um bloqueio ou erro específico. Se nenhuma página do domínio funcionar, o site inteiro bloqueia o rastreador do Perplexity.
  6. Use o Perplexity Pro para páginas maiores
    Se a página for um artigo longo ou um PDF, faça upgrade para o Perplexity Pro. Contas Pro têm um limite de tamanho de busca maior e podem lidar com páginas mais complexas. Vá em Configurações > Assinatura para fazer upgrade.
  7. Cole manualmente o texto da página
    Se a URL não puder ser buscada, copie o conteúdo de texto da página no seu navegador. Cole diretamente no chat do Perplexity. Você pode então fazer perguntas sobre o texto colado. Isso contorna completamente a busca.

ADVERTISEMENT

Se o Perplexity ainda não conseguir buscar a URL após esses passos

Algumas URLs nunca serão buscáveis devido a restrições permanentes. Aqui estão os problemas persistentes mais comuns e como lidar com eles.

“Esta página está atrás de um login ou paywall”

O Perplexity não pode fazer login em sites. Se a página exigir uma assinatura paga ou uma conta gratuita, você deve visualizá-la você mesmo e colar o conteúdo manualmente. Exemplos: The Wall Street Journal, artigos exclusivos para membros do Medium, Google Docs privados.

“O site bloqueia todos os bots via robots.txt”

Alguns sites proíbem explicitamente todos os rastreadores. Você pode verificar isso visitando a URL seguida de /robots.txt. Por exemplo, https://exemplo.com/robots.txt. Se você vir “Disallow: /”, o site bloqueia todos os bots. O Perplexity respeita as regras do robots.txt. Sua única opção é colar o conteúdo manualmente.

“A página requer JavaScript para renderizar”

Sites modernos geralmente carregam conteúdo dinamicamente com JavaScript. O Perplexity não executa JavaScript. O rastreador vê apenas uma página em branco ou um spinner de carregamento. Para obter o conteúdo, abra a página em um navegador, aguarde a renderização completa, copie o texto e cole no Perplexity.

“A URL é um PDF ou arquivo de imagem”

O Perplexity pode buscar alguns PDFs, mas não todos. Arquivos de imagem como .jpg, .png e .gif não são suportados. Se você precisar de informações de um PDF, tente um link direto para o arquivo PDF. Se falhar, abra o PDF em um visualizador e cole o texto manualmente.

“O erro aparece aleatoriamente para a mesma URL”

Se a mesma URL funciona às vezes e falha em outras, o site pode ter problemas intermitentes de servidor. Tente novamente após alguns minutos. Se o problema persistir, use o método de colagem manual como uma solução alternativa confiável.

Perplexity Gratuito vs Pro: Limites de busca de URL

A capacidade de buscar URLs difere entre contas Gratuitas e Pro. A tabela abaixo resume as principais diferenças.

Item Perplexity Gratuito Perplexity Pro
Tamanho máximo da página Aproximadamente 500 KB de texto Aproximadamente 2 MB de texto
Número de buscas por dia Limitado a 5 buscas de URL a cada 4 horas Buscas de URL ilimitadas
Suporte a PDF PDFs básicos com menos de 1 MB PDFs maiores de até 10 MB
Prioridade na fila Prioridade padrão Prioridade mais alta para respostas mais rápidas
Modelo usado para análise GPT-3.5 ou equivalente GPT-4, Claude ou outros modelos avançados

Se você precisa buscar páginas grandes ou complexas com frequência, uma assinatura Pro reduz a chance de atingir os limites. Vá em Configurações > Assinatura para comparar planos.

Agora você pode diagnosticar e resolver o erro “Page Cannot Be Fetched” para qualquer URL específica. Comece testando a URL em um navegador e simplificando o link. Se a página estiver atrás de um paywall ou exigir JavaScript, copie o texto manualmente. Para páginas grandes ou buscas frequentes, considere fazer upgrade para o Perplexity Pro. Como próximo passo, verifique o arquivo robots.txt do site para confirmar se ele bloqueia todos os rastreadores. Esse conhecimento ajuda a prever quais URLs funcionarão antes de enviá-las.

ADVERTISEMENT