Se você usa a API do Perplexity para busca, pesquisa ou perguntas e respostas, precisa monitorar seu uso e custo. Sem rastreamento, você pode exceder seu orçamento ou atingir limites de taxa inesperadamente. Este artigo explica como visualizar o painel de uso da API, verificar créditos restantes e definir alertas de gastos. Você aprenderá as etapas exatas para rastrear o uso e controlar os custos no portal do desenvolvedor do Perplexity.
Principais Conclusões: Rastrear Uso e Custo da API do Perplexity
- Painel do Desenvolvedor > Uso: Veja total de requisições, tokens consumidos e custo por período de faturamento.
- Configurações > Faturamento > Alertas: Defina um limite mensal de gastos para evitar cobranças surpresa.
- Cabeçalhos de Resposta da API: Verifique créditos restantes em tempo real usando o cabeçalho
x-ratelimit-remaining.
Entendendo as Métricas de Uso e Faturamento da API do Perplexity
A API do Perplexity cobra com base no número de tokens processados. Tokens são unidades de texto de entrada e saída. Cada consulta consome tokens para a pergunta e a resposta gerada. O modelo de faturamento usa uma estrutura de pagamento conforme o uso. Você pré-paga por créditos que são deduzidos por requisição. O painel mostra três métricas principais: total de requisições, tokens de entrada e tokens de saída. Limites de taxa se aplicam por chave de API. Chaves do nível gratuito têm limites menores que chaves Pro ou Enterprise. O uso é reiniciado no início de cada ciclo de faturamento. Você pode ver todos esses dados no portal do desenvolvedor, na aba Uso.
O Que Conta como Token
Um token equivale aproximadamente a 0,75 palavras para texto em inglês. A API conta tanto tokens de prompt quanto tokens de conclusão. Tokens de prompt são o texto da sua consulta e quaisquer instruções do sistema. Tokens de conclusão são o texto da resposta do modelo. O custo total é a soma dos tokens de prompt multiplicados pela taxa de prompt mais os tokens de conclusão multiplicados pela taxa de conclusão. A taxa por token varia conforme o modelo. Por exemplo, o modelo Perplexity Sonar custa $0,001 por 1.000 tokens de prompt e $0,002 por 1.000 tokens de conclusão.
Limites de Taxa e Limitação
Cada chave de API tem um número máximo de requisições por minuto. Chaves do nível gratuito permitem 10 requisições por minuto. Chaves Pro permitem 100 requisições por minuto. Chaves Enterprise têm limites personalizados. Quando você excede o limite, a API retorna um código de status 429. Os cabeçalhos de resposta incluem o tempo até o reset do limite. O painel mostra o uso atual do limite de taxa em tempo real.
Passos para Visualizar o Uso da API no Painel do Desenvolvedor
O painel do desenvolvedor é o local principal para rastrear uso e custo. Você deve fazer login com a conta proprietária da chave de API.
- Abrir o Portal do Desenvolvedor do Perplexity
Acesse perplexity.ai/settings/api no seu navegador. Faça login com suas credenciais da conta Perplexity. - Navegar até a aba Uso
Na barra lateral esquerda, clique em Uso. A página exibe um resumo do seu período de faturamento atual. Você vê total de requisições, tokens usados e custo estimado. - Visualizar métricas detalhadas por chave de API
Se você tiver várias chaves de API, clique em Filtrar por Chave e selecione uma chave específica. O gráfico é atualizado para mostrar o uso apenas daquela chave. Cada linha mostra o nome da chave, total de requisições, tokens de prompt, tokens de conclusão e custo. - Verificar uso histórico
Clique no seletor de intervalo de datas no topo do gráfico. Selecione um intervalo personalizado ou escolha entre predefinições como Últimos 7 Dias ou Últimos 30 Dias. A tabela abaixo do gráfico lista cada dia com as mesmas métricas. - Exportar dados de uso
Clique no botão Exportar CSV acima da tabela. O arquivo contém todas as métricas para o intervalo de datas selecionado. Você pode abri-lo no Excel ou Google Sheets para análise adicional.
Definindo um Alerta de Gasto ou Limite Mensal
Para evitar cobranças inesperadas, você pode definir um alerta de gasto mensal ou um limite rígido. Alertas notificam você por e-mail quando um limite é atingido. Um limite rígido interrompe as requisições da API assim que o limite é alcançado.
- Ir para Configurações de Faturamento
No portal do desenvolvedor, clique em Configurações na barra lateral esquerda. Em seguida, clique em Faturamento. - Ativar alertas de gasto
Em Alertas de Gasto, clique em Adicionar Alerta. Dê um nome ao alerta, por exemplo “Aviso Mensal”. Defina o valor limite em USD. Escolha o método de notificação: apenas e-mail. Clique em Salvar. - Definir um limite mensal de gasto
Em Limite de Gasto, ative o interruptor para Ligado. Insira o valor máximo que deseja gastar por mês. Clique em Salvar. Quando o limite for atingido, a API retorna um erro 402 Payment Required para todas as requisições subsequentes até o próximo ciclo de faturamento. - Verificar se o limite está ativo
Atualize a página de Faturamento. A seção Limite de Gasto mostra o limite atual e o valor gasto até agora neste mês. O status exibe “Ativo” quando o limite está habilitado.
Rastreando o Uso em Tempo Real Através dos Cabeçalhos de Resposta da API
Toda resposta da API inclui cabeçalhos com seu uso atual e status do limite de taxa. Você pode analisar esses cabeçalhos em sua aplicação para monitorar o uso programaticamente.
- Enviar uma requisição de teste à API
Use qualquer cliente HTTP como curl ou Postman. Envie uma requisição POST parahttps://api.perplexity.ai/chat/completionscom sua chave de API no cabeçalho Authorization. - Verificar os cabeçalhos de resposta
Na resposta, procure por estes cabeçalhos:x-ratelimit-remaining— número de requisições restantes no minuto atual.x-ratelimit-reset— timestamp Unix de quando o limite de taxa será reiniciado.x-tokens-remaining— número de tokens restantes no seu período de faturamento atual.x-cost-total— custo total incorrido até agora no período de faturamento atual em USD. - Registrar os cabeçalhos no seu código
Em sua aplicação, capture o objeto de resposta e leia esses cabeçalhos. Armazene-os em uma variável ou registre-os em um arquivo. Use os valores para ajustar a frequência de requisições ou alertar sua equipe quando os tokens estiverem baixos.
Problemas Comuns com o Rastreamento de Uso da API
Painel de Uso Mostra Zero Requisições
Se o painel mostrar zero requisições, mas você fez chamadas à API, verifique se está visualizando a chave de API correta. O painel filtra por chave. Se você tiver várias chaves, selecione a chave que usou. Verifique também se o intervalo de datas inclui o horário das suas requisições. A visualização padrão é o período de faturamento atual.
Limite de Gasto Não Funciona
Se você definiu um limite de gasto, mas as requisições continuam após o limite, verifique se o limite está ativado. O interruptor deve estar em Ligado. Confirme também se o valor do limite é menor que o valor já gasto. Se o limite for maior que o gasto atual, as requisições não serão interrompidas. O limite se aplica à soma de todas as chaves de API da sua conta.
Cabeçalho de Limite de Taxa Mostra Valor Incorreto
O cabeçalho x-ratelimit-remaining diminui em um a cada requisição. Se você enviar várias requisições em paralelo, o cabeçalho pode não refletir a contagem real restante devido a condições de corrida. Use o cabeçalho x-ratelimit-reset para saber quando o limite será reiniciado. Para uma limitação de taxa precisa, implemente backoff exponencial no seu código.
Perplexity API Gratuito vs Pro: Limites de Uso e Custo
| Item | Nível Gratuito | Nível Pro |
|---|---|---|
| Requisições mensais | 1.000 | Ilimitado (pague por token) |
| Limite de taxa | 10 requisições por minuto | 100 requisições por minuto |
| Custo por token | Grátis até 1.000 requisições | $0,001 por 1.000 tokens de prompt |
| Acesso a modelos | Apenas Sonar | Sonar, Sonar Pro e modelos personalizados |
| Limite de gasto | Não disponível | Disponível |
Rastrear o uso e o custo da API do Perplexity é simples quando você usa o painel do desenvolvedor, as configurações de faturamento e os cabeçalhos de resposta. A aba Uso fornece uma visão clara dos tokens e gastos. Definir um limite mensal evita excedentes. Verificar os cabeçalhos de resposta permite monitorar o uso em tempo real a partir da sua aplicação. Comece revisando seu uso atual no painel e, em seguida, ative um limite de gasto para se manter dentro do orçamento.