Escolher o modelo certo da API Perplexity para sua aplicação pode ser confuso. A família Sonar inclui três níveis: Sonar, Sonar Pro e Sonar Reasoning. Cada modelo oferece profundidade de busca, capacidade de raciocínio e custo diferentes. Este artigo explica as diferenças entre esses três modelos, seus casos de uso ideais e como configurá-los em suas chamadas de API.
Você aprenderá as especificações técnicas, limites de taxa e preços de cada modelo. Também abordamos erros comuns que desenvolvedores cometem ao selecionar um modelo e como evitá-los. Ao final, você saberá exatamente qual modelo Sonar atende às necessidades do seu projeto.
Principais conclusões: Modelos Sonar da API Perplexity
- Sonar (Modelo Base): Rápido, baixo custo e raciocínio básico. Ideal para perguntas e respostas simples e recuperação de informações em tempo real.
- Sonar Pro: Desempenho equilibrado com raciocínio mais profundo e melhor atribuição de fontes. Adequado para relatórios de negócios e pesquisas.
- Sonar Reasoning: Raciocínio avançado com cadeia de pensamento e busca em múltiplas etapas. Projetado para análises complexas, depuração de código e consultas científicas.
Visão Geral dos Modelos Sonar: Capacidades e Especificações Técnicas
A Perplexity oferece três modelos de API na família Sonar. Cada modelo usa uma arquitetura subjacente e estratégia de busca diferentes. O modelo base Sonar é otimizado para velocidade. Ele executa uma única consulta de busca e retorna uma resposta concisa com raciocínio limitado. O Sonar Pro adiciona busca em múltiplas etapas e melhor citação de fontes. O Sonar Reasoning usa prompting com cadeia de pensamento para dividir perguntas complexas em várias subconsultas.
Todos os modelos suportam busca na web em tempo real. A principal diferença é a profundidade do raciocínio e o número de etapas de busca executadas. O Sonar pode realizar até 2 etapas de busca. O Sonar Pro realiza até 5. O Sonar Reasoning pode executar até 10 etapas de busca, dependendo da complexidade da consulta. Isso afeta diretamente o tempo de resposta e o consumo de tokens.
Os preços variam por modelo. O Sonar custa $0,005 por 1.000 tokens. O Sonar Pro custa $0,01 por 1.000 tokens. O Sonar Reasoning custa $0,02 por 1.000 tokens. As contagens de tokens incluem tokens de entrada e saída. O modelo de raciocínio usa mais tokens porque gera cadeias de raciocínio internas antes de produzir a resposta final.
Os limites de taxa também diferem. O modelo base Sonar tem um limite de taxa mais alto, de 100 requisições por minuto. O Sonar Pro é limitado a 50 requisições por minuto. O Sonar Reasoning é o mais restrito, com 20 requisições por minuto. Esses limites se aplicam ao nível padrão da API. Você pode solicitar limites mais altos através do plano empresarial da Perplexity.
Passos para Selecionar e Configurar o Modelo Sonar Correto
Antes de começar, você precisa de uma chave de API da Perplexity. Crie uma no painel da Perplexity em API Keys. Cada modelo tem um ID de modelo específico que você passa no corpo da requisição da API. Os IDs dos modelos são: sonar, sonar-pro e sonar-reasoning. As etapas a seguir mostram como configurar cada modelo em uma chamada de API padrão.
- Defina o parâmetro model na sua requisição de API
No seu cliente de API, adicione o campomodelao corpo da requisição. Para o modelo base Sonar, defina como"model": "sonar". Para o Pro, use"model": "sonar-pro". Para o Reasoning, use"model": "sonar-reasoning". Esta é a única alteração de parâmetro necessária. - Ajuste o parâmetro max_tokens para cada modelo
O Sonar normalmente precisa de menos tokens por resposta. Definamax_tokenscomo 512 para consultas simples. O Sonar Pro funciona bem com 1024 tokens. O Sonar Reasoning pode exigir até 2048 tokens para acomodar a cadeia de raciocínio interna. Monitore o uso de tokens no seu painel. - Ative o contexto de busca para melhores resultados
Todos os modelos Sonar suportam o parâmetrosearch_context. Defina comotruepara incluir resultados de busca na resposta. Para o Sonar Reasoning, este parâmetro é obrigatório para ativar a busca em múltiplas etapas. Sem ele, o modelo pode pular o processo de raciocínio. - Defina temperature e top_p para variação na saída
Para consultas factuais, usetemperature: 0.2etop_p: 0.9. Para tarefas criativas como brainstorming, aumente a temperatura para 0.7. O Sonar Reasoning funciona melhor com valores baixos de temperatura, pois precisa de raciocínio determinístico. - Teste com uma consulta de exemplo
Envie uma requisição de teste para cada modelo com a mesma pergunta. Compare o comprimento da resposta, a precisão e as citações de fontes. Use os metadados da resposta para ver quantas etapas de busca foram executadas. Isso ajuda a escolher o modelo certo para sua carga de trabalho.
Equívocos Comuns e Limitações dos Modelos Sonar
Sonar Pro Sempre Supera o Sonar Base
Isso não é verdade para todas as tarefas. Para consultas factuais simples, como clima atual ou preços de ações, o modelo base Sonar retorna a mesma resposta que o Pro. As etapas extras de busca no Pro adicionam latência e custo sem benefício. Use o modelo base para requisições de alto volume e baixa complexidade.
Sonar Reasoning Pode Lidar com Qualquer Consulta Complexa
O Sonar Reasoning é poderoso, mas tem limites. Ele não pode processar consultas que exigem dados proprietários ou bancos de dados privados. O modelo depende de resultados de busca na web pública. Se a informação não estiver indexada publicamente, a cadeia de raciocínio produzirá respostas incompletas. Além disso, as etapas de raciocínio não são visíveis para o usuário. Você vê apenas a saída final.
Limites de Token Mais Altos Sempre Dão Melhores Respostas
Definir um valor alto de max_tokens para o Sonar Reasoning não garante respostas melhores. O modelo pode gerar raciocínio excessivo que se repete. Isso desperdiça tokens e aumenta o custo. Comece com 1024 tokens e aumente apenas se perceber respostas truncadas.
Todos os Modelos Suportam os Mesmos Formatos de Saída
Sonar e Sonar Pro suportam modo JSON. O Sonar Reasoning não suporta modo JSON na versão mais recente da API. Se sua aplicação exigir saída JSON estruturada, use o modelo base ou Pro. O modelo de raciocínio retorna apenas texto simples.
Sonar vs Sonar Pro vs Sonar Reasoning: Principais Diferenças
| Item | Sonar | Sonar Pro | Sonar Reasoning |
|---|---|---|---|
| ID do modelo | sonar | sonar-pro | sonar-reasoning |
| Máx. etapas de busca | 2 | 5 | 10 |
| Raciocínio com cadeia de pensamento | Não | Limitado | Completo |
| Custo por 1.000 tokens | $0,005 | $0,01 | $0,02 |
| Limite de taxa (req/min) | 100 | 50 | 20 |
| Suporte a modo JSON | Sim | Sim | Não |
| Melhor para | Fatos rápidos, definições, dados ao vivo | Relatórios de negócios, resumos de pesquisa | Análise complexa, depuração, ciência |
Escolher o modelo certo da API Perplexity depende do seu caso de uso específico. Para aplicações de alto volume que precisam de respostas rápidas, use o modelo base Sonar. Para pesquisas profissionais com citações confiáveis, o Sonar Pro é o melhor equilíbrio entre custo e capacidade. Para tarefas analíticas profundas que exigem raciocínio em múltiplas etapas, o Sonar Reasoning oferece os resultados mais completos, mas com custo mais alto e limite de taxa menor. Comece com o modelo base e atualize apenas quando sua aplicação exigir mais profundidade de raciocínio. Monitore seu uso de tokens e a qualidade das respostas para otimizar seus gastos com a API.