Tô lendo muito sobre gastos e precificação de IA hoje. 🤓 A mensagem de mais um artigo do @Gartner_inc sobre o tema é muito verdadeira:
As propostas de preços para IA são opacas, inconsistentes e cada vez mais difíceis de comparar. O resultado é a incerteza em relação à previsibilidade de custos, à geração de valor e à escalabilidade. Isso não é mais uma questão de compras, mas sim de governança financeira. Sem uma maneira consistente de interpretar os preços da IA, as empresas correm o risco de perder a previsibilidade de custos, desalinhar gastos e valor e de não compreender o verdadeiro impacto econômico da adoção da IA.
Segundo um estudo recente do @Gartner_inc , os mercados de serviços de IA criarão muitas oportunidades em 2026.
Da lista apresentada, dois eu considero especialmente relevantes:
- Serviços de dados prontos para IA.
- IA em serviços.
Estudando mais sobre pricing de IA percebi que o preço do contrato nem sempre é o que mais importa.
O que define a conta real é a combinação de três camadas: como você se compromete (modelo comercial), o que gera custo (modelo de precificação) e as métricas que fazem isso escalar (métricas da precificação).
#IA nem sempre estoura o orçamento por execução ruim. Estoura por estrutura mal compreendida.
Tá aí uma frase do @diogo_rib que faz muito sentido:
A pergunta certa não é "como o agente pede aprovação?". É "como eu defino, antecipadamente, o que ele pode e não pode fazer, e como detecto quando ele sai dessa fronteira?".
https://t.co/n2fe0Mk29J
Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast—much faster than the policy process was built to handle. The essay lays out where I think the technology is now, and the action needed to close the gap: https://t.co/Lh6PWae178
Do nada, lembrei da célebre frase que me foi dita há anos pelo @RR_listening : "O mundo fala inglês, a empresa fala finanças." 🙂
Em tempos de IA, isso é ainda mais relevante. A tecnologia é fantástica, mas quais problemas reais ela está resolvendo e que resultado isso produz? Não dá para esquecer dessas perguntas.
Fiz um teste inicial para comparar o Opus 4.8 com o Fable 5.
Disparei a mesma tarefa em ambos os modelos, simultaneamente, usando minha LLM-Wiki.
Os dois gastaram praticamente o mesmo tempo para executar a tarefa, mas o custo do Fable 5 foi o dobro.
Em termos de resultados, foram bem parecidos, mas o Opus 4.8 formatou melhor a saída.
Não fiquei muito impressionado nesse primeiro teste, mas foi algo mais simples. Como a promessa é que o Fable 5 seja melhor em tarefas mais complexas e longas, vou testá-lo em desafios mais exigentes para tirar minhas conclusões.
Introducing Claude Fable 5: a Mythos-class model that we’ve made safe for general use.
Its capabilities exceed those of any model we’ve ever made generally available.
Atualizei meu Windsurf para o Devin Desktop. Confesso que eu estava usando mais o Codex CLI e o Claude Code (CLI). Vou fazer alguns experimentos.... Fiquei curioso. 👀
Introducing Devin Desktop: the next generation of Windsurf
Manage fleets of local and cloud agents from one surface
Support for any ACP-compatible agent
With a full IDE for when you need to jump into the code
Definitivamente, a IA mudou o processo de desenvolvimento de software. Mas, como tudo é muito recente, ainda há vários debates em aberto.
Parece haver consenso de que, neste momento, temos mais desafios no processo de upstream (produto) do que no de downstream (tecnologia/engenharia), mas vejo muito foco na "passagem de bastão" entre essas disciplinas.
Na minha visão, nem sempre esse é o principal gargalo, é preciso olhar o processo todo, desde os mecanismos de discovery para identificar onde estão as reais fricções.
This question applies perfectly to AI token spend too.
Tons of tokens get burned on prompts and outputs, but the real measure isn’t volume; it’s the actual value produced.
Smart investment, high-quality reasoning, and real efficacy matter way more than just generating more text.