FABLE 5 CAME BACK NERFED.
We re-ran the July 1st version of Claude Fable 5 on BridgeBench.
The results are brutal:
Debugging: 86.2 → 25.9
Refactoring: 73.6 → 38.4
Hallucination: 75.9 → 61.7
The new guardrails are kicking in on way too many tasks and falling back to Opus 4.8.
This is not the model that got banned.
Anthropic owes everyone an explanation.
Hotovo a podáno. Moje interpelace na ministra dopravy ve věci postupu ČR u systému Tesla FSD Supervised. Osm konkrétních otázek: odkud je číslo, jakou pozici ČR zaujme, jaké jsou termíny. Stát má rozhodovat podle správných dat a s otevřenými kartami. 🏴☠️
@thsottiaux@riadbenguella I am suffering with Claude. Interrupting in the middle of final response. Then to recover takes the whole 5h limit to finish the last response.
A když už jste tady, tak dávám vědět, že tady malému Hugovi zbývají necelé tři hodiny na to, aby vybral 37 500 Kč na elektrický vozík.
Zatím má vybranou pětistovku... https://t.co/EdLJ8I4OAE
Looking forward when FSD technology gets into busses. It's so stupid to be driven with someone who cannot drive smoothly, but there is no one better to do that...