Em 3 de abril de 2026, a ServiceNow informou que o Now Assist atingiu trajetória de US$ 1 bilhão em receita anual recorrente. O número impressiona, mas o mecanismo que o gerou é o que importa: a empresa não vendeu mais licenças por usuário. Vendeu trabalho concluído. O produto que chegou a esse patamar cobra por "Assist Tokens" — unidades de trabalho executado pela IA em fluxos de RH, TI e atendimento ao cliente. O cliente paga pela tarefa resolvida, não pelo acento ocupado.
Run rate de IA generativa em software corporativo (abril 2026)
ServiceNow Now Assist run rate
Salesforce Agentforce run rate
Prêmio Pro Plus sobre licença padrão
Bill McDermott, CEO da ServiceNow, vinha sinalizando essa transição desde 2024. Em abril de 2026, ela deixou de ser estratégia e virou receita verificável. O tier Pro Plus, com prêmio de 25% a 40% sobre a versão padrão, teve adoção massiva entre empresas da Fortune 500 no primeiro trimestre. Isso sugere que executivos estão dispostos a pagar mais por automação de ponta a ponta do que por assistência pontual.
A camada de infraestrutura
Enquanto isso acontece na camada de aplicação, a Microsoft moveu uma peça relevante na base. Em 2 de abril, Mustafa Suleyman, CEO da recém-criada unidade Microsoft AI, anunciou três modelos proprietários: MAI-Transcribe-1, MAI-Voice-1 e MAI-Image-2. O Transcribe-1 opera com 50% do custo de GPU de modelos comparáveis e supera o Whisper-large-V3 da OpenAI e o Gemini 3.1 Flash da Google no benchmark FLEURS para transcrição multilíngue. O custo por hora de áudio processado é de US$ 0,36.
MAI-Transcribe-1: performance e custo
do custo de GPU de modelos comparáveis
por hora de áudio processado
A leitura óbvia é que a Microsoft está reduzindo sua dependência da OpenAI. A leitura mais relevante para quem opera software corporativo é outra: a Microsoft está criando modelos específicos para tarefas de alto volume porque o custo de inferência em escala deixou de ser detalhe técnico e virou variável de competitividade. Um call center que transcreve dois milhões de atendimentos por mês não compra inteligência artificial. Compra custo por hora de áudio. A diferença entre US$ 0,36 e US$ 0,70 por hora, nessa escala, é decisão de CFO, não de CTO.
O que muda no contrato
Quando a unidade de compra muda de "licença anual por usuário" para "custo por tarefa executada", o processo de avaliação, aprovação e renovação muda junto. Gestores que ainda negociam software em modelo tradicional vão encontrar fornecedores cada vez menos dispostos a oferecer previsibilidade de custo fixo em troca de volume de assentos. A pressão vai na direção inversa: o fornecedor quer que o cliente cresça em consumo de tokens conforme a IA executa mais trabalho.
Para o cliente, isso resolve o problema do ROI da IA — você paga pela produtividade real gerada. Mas cria um risco diferente: consumo difícil de prever e contratos que ficam mais caros à medida que a automação avança. Empresas que reduzem headcount porque a IA absorveu parte do trabalho podem descobrir que o custo do software cresceu proporcionalmente, porque a IA que substituiu as pessoas agora fatura por token. A conta pode fechar, mas exige gestão ativa do consumo, o que a maioria das organizações ainda não tem capacidade de fazer.
Risco não tão óbvio
Reduzir headcount em proporção à automação pode não gerar economia líquida se o custo de tokens acompanhar o volume de trabalho absorvido. A conta fecha apenas com governança ativa de consumo.
Governança para o próximo ciclo
Quem já implementou IA em processos corporativos reconhece o padrão: os primeiros projetos geram entusiasmo, os seguintes geram atrito nos contratos. A transição para modelos de consumo vai acelerar esse atrito. A discussão que costumava acontecer no momento da renovação anual vai passar a acontecer mensalmente, conforme os tokens são consumidos. Organizações que não investirem agora em governança de consumo de IA vão repetir o ciclo que viveram com cloud computing em 2015: adoção rápida, fatura surpresa, revisão forçada.
O que isto implica na prática
- • O modelo por token resolve a justificativa de ROI da IA mas cria um custo variável que acompanha o sucesso da automação.
- • A capacidade de monitorar e controlar consumo de tokens em tempo real deixa de ser detalhe técnico e vira competência de gestão.
- • Contratos baseados em resultado tendem a se tornar a norma; quem ainda negocia apenas por assento perde poder de barganha.
A diferença entre US$ 0,36 e US$ 0,70 por hora de áudio, em escala, é decisão de CFO, não de CTO.