@FelpsCrypto a parte mais forte disso nem é recriar um jogo inédito. é vc transformar conceito em demo jogável antes do estúdio terminar o trailer. pré-produção tá ficando comprimida de um jeito meio absurdo
@0xPira faz sentido. o Codex me parece mto bom qdo o problema já tá bem enquadrado. qdo vc ainda tá explorando caminho, o Opus costuma render insight lateral melhor. um parece martelo de produção, o outro conversa melhor na fase de descoberta
@OpenAI this is a bigger product signal than it looks. once resets can be saved and deployed later, coding agents stop feeling like chat quota and start feeling like capacity planning
@mattpocockuk yep. a lot of teams do not have a model problem, they have a process problem wearing a model costume. bad context, weak tests and vague handoffs just get more expensive on smarter models
o chatwoot tá em trending no github com quase 30 mil stars. é uma central open source de atendimento que junta site, email, WhatsApp, Instagram, Facebook e Telegram no mesmo inbox, alternativa a Intercom e Zendesk.
qdo até essa camada começa a virar software aberto, a margem sai do ticket e vai pro workflow
a Oracle terminou o trimestre com US$638 bi de receita já contratada, alta de 363% em 1 ano. e a maior parte desse salto veio de contrato gigante de AI em que o cliente já paga ou entrega as GPUs antes.
isso é mto maior q vender cloud. quem quer capacidade agora tá financiando o data center do provedor
@gkpacker esse é o use case q faz sentido de verdade pra finanças.
ninguém acorda querendo conversar com o saldo. a pessoa quer achar gasto escondido, viagem antiga, assinatura esquecida. pergunta em linguagem natural e resposta com contexto
@namcios pq produtividade de dev não cria distribuição sozinha.
ficou mais barato fabricar software. continuar fazendo alguém abrir o app amanhã ainda é outra guerra
@devmagro isso é mto bom pq mostra uma coisa simples: o agente não melhora só com modelo melhor, melhora qdo vc empacota critério.
sem critério, ele acelera erro. com critério, começa a virar processo
@coproduto isso gera um tipo de produto q todo dev reconhece na hora: mto ritual, mto framework, pouco entendimento da fricção real do usuário.
o squad fica organizado no miro e desalinhado no produto
o SkillSpector da Nvidia apareceu no github com 2,2 mil stars. ele escaneia skill de agente, aqueles pacotes de instrução usados por Claude Code, Codex e cia, atrás de prompt injection, exfiltração e privilege escalation.
isso é mto 2026. skill já virou vetor de ataque grande o bastante pra precisar de scanner próprio
o apple/container tá em trending no github com 30,8 mil stars e 1,6 mil só hoje. é a Apple abrindo uma ferramenta pra rodar container Linux no Mac via VM leve, feita pro Apple Silicon.
quando a dona do hardware entra nessa camada, docker e cia deixam de ser só app de dev. vira disputa pelo workflow inteiro
o career-ops tá com 51 mil stars no github. é um sistema open source de busca de emprego com agente: avalia vaga, ajusta currículo pros filtros automáticos, escaneia portal e organiza teu pipeline.
até procurar trabalho virou workflow.
quando candidatura começa a ser operada como funil, o gargalo já não é informação. é atenção
@LukeberryPi essa categoria de skill vale mais q mto modelo novo. quando o agente lê tua doc antes de mexer, ele para de parecer estagiário com confiança infinita e começa a parecer alguém do time
@caraibergcanaro é isso. em software de pagamento, taxa mais baixa some no primeiro incidente sério.
gateway não é lugar pra economizar 30 bps e comprar 3 meses de risco operacional
@mindofjota faz sentido. mta gente compara modelo e esquece q ergonomia é produto.
se o Cursor te deixa planejar, editar, revisar e abrir PR sem te tirar do fluxo, ele ganha mto ponto antes mesmo de discutir benchmark
@gomex tem um pouco disso sim. nem sempre é modelo pior, às vezes é variância + limite + mudança de comportamento entre sessões.
no uso real, oq pesa mais q benchmark é previsibilidade. o mesmo prompt não devia te obrigar a renegociar critério todo santo dia
o whichllm entrou no github trending com quase 3,8 mil stars. ele detecta tua GPU, RAM e CPU e te diz qual LLM local realmente roda melhor aí, com benchmark recente em vez de só olhar parameter count.
2026 tá ficando assim.
o melhor modelo não é o maior. é o que cabe na tua máquina, responde sem drama e não te cobra aluguel por token
@LucasCostaAT esse tipo de caso vale mais q 100 demo de SaaS.
qdo a AI começa a abrir estufa, ler satélite e mexer em produtividade de fazenda, ela saiu da tela e entrou no caixa
@banhosdev@devjuninho o apelo real aí nem é ser modelo chinês. é previsibilidade.
dev aguenta modelo 5% pior. oq mata é limite estourando no meio do fluxo e vc ter q trocar de ferramenta com o diff aberto