OS LO DIJE.
Teatro.
Aquí tenéis todo desgranado: leed primero el artículo al menos, pero:
Anthropic acaba de publicar la versión 3.0 de su Responsible Scaling Policy. Hoy, 24 de febrero de 2026. Y lo que dice confirma exactamente lo que llevo semanas argumentando. Punto por punto.
1. Anthropic admite que su teoría de cambio fracasó.
Lo dicen ellos. No yo. La idea de usar umbrales de capacidad para crear consenso sobre riesgos “did not play out in practice.” La acción gubernamental “has moved slowly.” El clima político es “anti-regulatory.” Y las salvaguardas de niveles superiores son “very hard to meet unilaterally.” El vacío legal que describimos en el artículo no es una tesis. Es un hecho que Anthropic reconoce oficialmente.
2. Separan lo que harán solos de lo que creen que debería hacer la industria.
La RSP ahora tiene dos columnas. Lo que Anthropic hará sola, y lo que cree que todos deberían hacer. Y dice textualmente: “we cannot commit to following [industry-wide recommendations] unilaterally.” Es la jaula sin cerradura convertida en política oficial. Ya no prometen cumplir su propio estándar si los demás no lo cumplen.
3. El “marginal risk analysis” como justificación oficial.
Esto es lo más grande. Anthropic ahora puede argumentar: “sí, el riesgo absoluto de nuestros modelos es alto, pero si nosotros paramos y los demás no, el mundo no es más seguro.” Es exactamente la lógica del mal menor que identificamos en los investigadores individuales, pero ahora elevada a política corporativa. Dice literalmente que si el riesgo viene de que otros desarrolladores también crean modelos peligrosos, Anthropic puede justificar seguir adelante porque su contribución marginal al riesgo total es “relativamente limitada.”
Léelo otra vez. Anthropic acaba de escribir la cláusula que le permite hacer lo que quiera siempre que pueda señalar a otro que también lo hace.
4. Los compromisos duros se convirtieron en metas no vinculantes.
El Frontier Safety Roadmap se describe textualmente como “not hard commitments but rather public goals against which we will openly grade our progress.” Metas que ellos mismos califican. No hay auditoría externa obligatoria. No hay consecuencia por incumplimiento. La autodeclaración sin cerradura, formalizada.
5. Compromisos contingentes a competidores.
Crearon una tabla explícita en el Apéndice A. Si Anthropic tiene ventaja clara, estándares altos. Si los competidores tienen medidas fuertes, Anthropic iguala o supera. Pero si los competidores no tienen medidas fuertes —que es la situación actual, con xAI compitiendo en DAWG sin restricciones, Google sin principios éticos desde febrero de 2025, OpenAI en drones autónomos con Anduril— Anthropic no se compromete unilateralmente a los estándares máximos.
Es la formalización de la carrera al fondo. La seguridad de Anthropic depende oficialmente de lo que hagan los demás. Y los demás ya no hacen nada.
6. Amodei y Kaplan siguen decidiendo solos.
Sección 3.4: “The CEO and RSO will make the ultimate determination regarding the adequacy of the risk assessment and any downstream deployment or development plans.” Igual que antes. La empresa se audita a sí misma. La revisión externa solo es obligatoria cuando los modelos son “highly capable” Y el informe está “significantly redacted.” Dos condiciones que Anthropic misma evalúa.
7. Admiten que sus propias pruebas no funcionan.
Sobre riesgos biológicos: “results remain ambiguous, especially because the studies take long enough that more powerful models are available by the time they’re completed.” Reconocen que no pueden dar respuestas definitivas sobre si los modelos pasan umbrales de capacidad peligrosa. Y siguen desarrollando igual. Porque “marginal risk.”
Una Nintendo Switch 2 va a ser para una de las personas que nos siga y haga repost a este tweet.
Revienta el corazón de like y mucha suerte!
(Solo para España)
@charlot65466340@drumm_colin Nah, precisely languages are very straightforward
What is right to say in X situation will always be right.
What is difficult is to gather enough experience and come across enough nuances to avoid making any mistakes or misinterpret the situation/connotations of the phrase
@adelagaceit Ya estoy viendo, disculpa 😅
Que no te quiten las ganas, creo que es de esas obras que hay que dejar en barbecho para disfrutarse plenamente.
Yo simplemente me di un atracón
A disfrutar!
Ayer les conté que iba a hacer el "jailbreak" de mi Kindle. Esto significa que liberas a tu aparato de las limitaciones impuestas por Amazon, permitiéndote quitarle limitaciones, instalar otros programas, bloquear las actualizaciones de Amazon, etc. Acá les cuento mi experiencia.