China no ganó la carrera de modelos. Ganó la guerra de adopción. En OpenRouter, los modelos chinos ya superan en uso semanal a los modelos estadounidenses. No es que sean mejores. Es que son más accesibles y nadie dice lo contrario.
Todo el mundo celebra que lanzaste tu agente. Nadie te dice que 40% se abandona antes de llegar a producción. El agente no es el producto. El sistema alrededor del agente es el producto.
Todo el mundo aumenta el contexto. Nadie construye memoria. Más contexto no resuelve el problema de que tu agente empieza de cero cada vez. Memoria persistente, sin RAG: https://t.co/A82by2zqe1
Boris Chern shipó 150 pull requests en un día. Desde el celu. El modelo escribe el 100% del código. Él solo decide dónde. Esa es la diferencia entre alguien que usa IA y alguien que ya no necesita otra cosa.
Resumo não é memória. Tu 'agente' tem 1M de contexto. Fecha a sessão. Abre outra. Não sabe nada da anterior. Isso não é um agente. É um arquivo com pretensões de memória.
Un cliente me mandó su copy. Era una lista de features. Le dije: "Esto me dice qué hace tu producto. No me dice por qué alguien pagaría 3x más." Reescribimos todo desde el resultado. Convirtió 4x más. Tu copy describe tu producto. El cliente paga por el cambio.
RAG pasivo quebra em produção. Não é o contexto que falha. É a arquitectura de retrieval. O shift é para RAG agentic: o modelo inspecta contexto externo com código, recursivamente. Não é mais busca. É inference-time OS.
Le diste a Claude un proyecto de 6 meses. Hizo un summary perfecto. Cerraste la sesión. Lo abriste mañana. No sabe nada. El summary no es memoria. Es el obituary de tu contexto.
Todo el mundo debate qué modelo es mejor. Nadie debate qué skills instalás en tu agente. 26% contienen vulnerabilidades. 5% son activamente maliciosas. Tu stack de IA no es seguro. Es unafe.
Le pregunté a mi agente por un proyecto de hace dos semanas. Lo recordó solo. Sin RAG, sin embeddings, sin pipeline de retrieval. Así funciona memoria real cuando no la construís como un parche.
150K developers pagaron USD 200/mes por Claude Code. Mismo modelo. Mismas herramientas. Top: 2.5M tokens en una semana. Bottom: 57K. No es el modelo. Es cómo sabés pedirle.
Le diste a tu equipo tokens ilimitados de Claude. El top performer quemó 2.5M en una semana. El peor, 57K. 44x de diferencia. No es el modelo. Es quién sabe usarlo. Y quién no sabe que no sabe.
Todos hablan de loop engineering. De agents que corren solos.
Pocos hablan de qué pasa cuando el agent se olvida de lo que hizo ayer.
Un loop sin memoria es una hamster wheel.
Le armé un agent a un cliente. Lo configuré para que recuerde todo.
Tres meses después me escribe: "Nati, cada vez que abro el chat es como si empezara de nuevo."
Le dije que el context window no es memoria. Se rió. No me creyó hasta que le mostré el log de conversación.
Tu copy dice: "Herramienta de AI para equipos."
El de tu cliente potencial dice: "Dejé de perder 3 horas por día buscando información que ya tenía."
Hay un abismo ahí. La mayoría está del lado equivocado.
Claude Code no te hace más productivo.
Te hace más visible tu falta de dirección.
Si no sabés qué querés construir, Claude Code te lo construye rápido. En el sentido wrong.
Tu AI agent no tiene memoria.
No porque el modelo sea. Sino porque nadie lo diseñó para recordar.
Los labs optimizan velocidad de reasoning. No persistencia de estado.
No es un bug. Es una decisión de diseño que nadie te contó.
Le pedí a mi agente que reservara un vuelo.
Cuatro intentos. Cuatro errores distintos. Canceló el viaje dos veces. Reservó en la clase equivocada una vez.
Esto no es un problema de inteligencia. Es un problema de acción en el mundo real.
Le instalaste ese skill a tu coding agent la semana pasada. Le diste acceso a tu codebase.
No tenés idea qué hizo realmente.
1 de cada 4 skills de AI agent tiene una security hole. 5% son probablemente maliciosos.
Le diste acceso a tu codebase a un stranger.
Cada vez que alguien dice "le pongo más contexto", su agente sigue sin recordar nada.
El contexto window no es memoria. Es un bloc de notas que se borra cada vez que cerrás la sesión.
Memoria persistente para tus agentes, sin RAG → https://t.co/A82by2zqe1