🚨你以为模型越大越安全? 恰恰相反。
第一起大规模 AI 泄露,不是会不会发生,是什么时候发生。
CMU 教授和 OpenAI 董事做的"灰天鹅"刚拿了 4000 万美元 A 轮。他们发现一个反直觉的事实:模型变大,能力会涨,但"抗忽悠"的本事不会自己涨——你不专门训它,它就是不安全。他们甚至训出了破解大模型比人类高手还快的越狱 AI。
最危险的是给 AI 装上手脚那一刻:能读外部网页、能碰你的私人数据、还能把数据发出去。三样凑齐,一封藏了指令的邮件,就能让你的 AI 助手把机密拱手送人——这种人类绝不会上的当,顶尖模型今天还在上。
叫"灰天鹅",就是说这事所有人都看得见要来,只是还没动手去防。