O fim do 'all-you-can-eat': agentes mudam a economia das assinaturas de IA

Entercast Consulting·

No dia 14 de maio, a Axios resumiu em uma frase o que o mercado de IA vinha sussurrando há meses: "as assinaturas 'all-you-can-eat' de IA podem não sobreviver à era dos agentes". A reportagem registrava um movimento da Anthropic — colocar o uso de ferramentas externas de agentes em um medidor de créditos separado, mesmo para clientes pagos — e o contra-ataque imediato da OpenAI, que no mesmo dia liberou o Codex gratuitamente dentro do app do ChatGPT no iOS e Android. A leitura do mercado é direta: o modelo de assinatura plana, pilar da era do chatbot, está sob pressão estrutural na era dos agentes.

A tese não é nova entre operadores, mas as decisões dos últimos dias deram a ela um peso empírico difícil de ignorar. Anthropic e OpenAI, líderes do segmento, estão fazendo apostas opostas sobre como precificar o uso intensivo de IA — e o que está em jogo afeta diretamente o orçamento de tecnologia das empresas brasileiras que estão começando a rodar agentes em produção.

O movimento da Anthropic: agentes em medidor separado

A Anthropic anunciou que voltará a permitir o uso de ferramentas externas de agentes nos planos pagos do Claude — mas atrás de um medidor de créditos próprio, descolado da assinatura mensal. Segundo a Axios, a decisão reflete uma realidade operacional: agentes consomem volumes de tokens muito superiores aos do uso conversacional, e absorver esse custo dentro de uma mensalidade fixa estava se tornando economicamente inviável.

O contexto importa. Dias antes, em 6 de maio, a empresa havia dobrado os limites de uso do Claude Code para os planos Pro, Max, Team e Enterprise por assento, e aumentou em até 1.500% os limites de input por minuto na API Tier 1, segundo nota oficial publicada no site da Anthropic. Para suportar essa expansão, a empresa fechou um acordo com a SpaceX para usar a capacidade do data center Colossus 1 — mais de 300 megawatts e cerca de 220 mil GPUs NVIDIA. Ou seja: a Anthropic está expandindo capacidade, mas separando claramente o que cabe dentro da assinatura e o que precisa ser cobrado à parte.

O movimento da OpenAI: Codex grátis no mobile como isca

No mesmo 14 de maio, a OpenAI tomou a direção contrária. O Codex, ferramenta de codificação assistida da empresa, passou a estar disponível dentro do app do ChatGPT no iOS e Android — inclusive para usuários do plano gratuito, conforme noticiado por Engadget e TechCrunch. Sam Altman complementou no X que novos clientes corporativos terão dois meses de uso gratuito de Codex.

Vale entender o que o app mobile faz e o que não faz. Ele atua como intermediário: o desenvolvedor não roda código no celular, mas pode acompanhar tarefas iniciadas no Codex desktop, aprovar comandos, trocar de modelo e disparar novas execuções. Por enquanto, o app móvel só conecta com a versão macOS do Codex desktop; suporte a Windows foi prometido sem data. A jogada é clara: a OpenAI está tentando atrair os "power users" de codificação assistida que a Anthropic acaba de incomodar com a nova política de créditos.

Por que agentes quebram a economia das assinaturas

A diferença entre chat e agente, do ponto de vista de custo, é de ordem de magnitude. Uma conversa com chatbot consome dezenas a poucas centenas de milhares de tokens. Um agente que lê arquivos, navega em codebases, executa testes e itera sobre resultados consome milhões de tokens por sessão, muitas vezes em paralelo. O modelo "pague uma mensalidade e use à vontade" foi desenhado para o primeiro cenário, não para o segundo.

Há também um efeito Pareto agressivo: uma fração pequena de usuários intensivos consome a maior parte dos recursos. Quando o uso médio era moderado, esse desequilíbrio ainda era absorvido pelo bolso da plataforma. Com agentes, o usuário intensivo pode consumir, sozinho, o equivalente a centenas de assinaturas. As decisões da Anthropic refletem essa matemática: separar o uso de agentes em um meter próprio é a forma mais limpa de alinhar custo e preço sem onerar quem usa o Claude apenas como chat.

O contraponto: assinatura ainda faz sentido para muita gente

É importante não cair na narrativa fácil de que "o modelo de assinatura morreu". Para uso conversacional, geração de texto, resumo de documentos e tarefas individuais de produtividade, a assinatura plana continua sendo o formato mais simples e previsível para o usuário e para a empresa. Tanto Anthropic quanto OpenAI mantêm planos por assento que cobrem confortavelmente esses cenários, e a própria Anthropic dobrou os limites do Claude Code justamente para evitar atritos com o usuário típico.

O que está acontecendo é uma bifurcação de pricing: assinaturas para uso interativo, créditos consumíveis para uso agentic. É um movimento parecido com o que aconteceu na nuvem na década passada, quando o modelo de licenças anuais conviveu com o consumo elástico por hora ou por chamada. A IDC, em relatório recente, projeta que até 2028 cerca de 70% dos fornecedores de software terão refatorado seu pricing para métricas baseadas em consumo, resultados ou capacidade organizacional — e o setor de IA está apenas adiantando esse movimento.

O que líderes brasileiros devem fazer

Empresas brasileiras que estão entrando agora na era dos agentes precisam revisar premissas de orçamento que foram herdadas do mundo dos chatbots. Algumas frentes que merecem atenção imediata:

  • Mapear o uso atual por perfil: quantos colaboradores usam IA como chat e quantos usam como agente. A diferença de custo entre os dois grupos pode ser de uma ou duas ordens de magnitude.
  • Modelar o TCO por caso de uso, não por usuário. Um único agente rodando em pipeline contínuo pode justificar um plano consumível dedicado, enquanto cinquenta analistas conversacionais cabem confortavelmente em assinaturas por assento.
  • Evitar lock-in em um único provedor, especialmente quando as estruturas de pricing estão em transição. Multimodelo passa a ser também uma estratégia de risco financeiro, não só técnico.
  • Negociar contratos com cláusulas de revisão: com Anthropic e OpenAI ajustando políticas a cada poucas semanas, contratos anuais rígidos podem envelhecer mal.

Conclusão

A briga entre Anthropic e OpenAI sobre como cobrar pelo uso intensivo de IA não é apenas um detalhe comercial — é o desenho da próxima fase de monetização do setor. Para empresas brasileiras, o recado é prático: tratar IA agentic como custo de infraestrutura variável, não como software de assinatura. Quem entrar nessa fase com a mentalidade do chatbot vai descobrir, na fatura, que a era do "all-you-can-eat" tem um limite. Quem chegar preparado vai conseguir capturar o ganho de produtividade dos agentes sem ser surpreendido pelo custo.

Esta matéria foi publicada em 15 de maio de 2026. Siga a Entercast para não perder as próximas atualizações.