BREAKING: GLM-5.2 is now 1st on Design Arena.
With an Elo of 1360, GLM-5.2 has jumped ahead of the now unavailable Claude Fable 5.
And it's open weights.
This is an improvement of 4 positions and 27 Elo points to achieve one of the highest Elo scores in our code categories since Design Arena started.
Huge congratulations to the @Zai_org on the release!
当前的 AI,连一个杯子都还没"真懂"。
极客公园「今夜科技谈」这期,Aether AI 创始人黄碧薇教授(@huang_biwei)举了个特别戳的例子:
让今天的视频生成模型去"抓一个杯子" 手还没真碰到,杯子自己就飞起来了。
画面看着挺顺,但它只学到了"相关性",没学到"因果"。它知道"手靠近杯子,杯子常常会动",却不知道"为什么动、我这一抓会发生什么"。
这就是下一代 AI 的关键分野:
聊天里说错一句,改了就行;可一旦进入物理世界,机器人、自动驾驶、生物医药:一个变量算错,后果是真实的。
所以问题不是把世界"预测得更像",而是"理解世界为什么这样运行"。
这正是因果世界模型(Causal World Model)想解决的事:让 AI 不只识别表象,更理解机制。
🔗 完整对谈值得一听:极客公园「今夜科技谈」· 因果大模型:下一场 AI 范式之争?
https://t.co/ao0oRtY3Ly
Aether AI | 黄碧薇教授 | Causal World Models for Real-World Intelligence | https://t.co/0Vddq3auoG