2. The 9.11 vs 9.9 Test
"Which is bigger, 9.11 or 9.9?"
Half the time, models said 9.11. They saw "11 > 9" and ignored the decimal place.
Researchers traced this to neurons that fire for Bible verses and calendar dates, where 9.11 genuinely does come after 9.9.
Opus 4.8's answer:
Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the ability to work independently for longer than its predecessors.
Available today at the same price.
Um garoto chinês de 10 anos pediu um Mac Studio de presente "para criar lagostas."
"Criar lagostas" é a gíria dele para rodar múltiplos agentes de IA em paralelo com OpenClaw. O Mac mini antigo não dava conta. Ele precisava de mais compute. Tem 10 anos.
Aí você assiste o vídeo inteiro e a ficha cai.
O garoto não está repetindo hype de timeline. Ele fatia a cadeia industrial de IA em camadas, da energia até a aplicação, como quem já mapeou o território. Fala de tokens como unidade econômica. Fala de alocação de compute como gente grande fala de alocação de capital.
E não com a linguagem de quem leu um artigo. Com a linguagem de quem opera.
Ele não pediu um computador melhor para jogar. Pediu porque o hardware limitava o throughput dos agentes dele. Essa é uma decisão de infraestrutura, não de consumo.
Enquanto a maioria dos adultos ainda está usando ChatGPT 3.5 Instant, tentando escrever um prompt decente, esse garoto já está aprendendo a gerenciar uma equipe inteira de agentes de IA.