最近在研究 AI 的“自我进化”路径,特别是 RLAIF (Reinforcement Learning from AI Feedback)。
我们常说数据是瓶���,其实“人类老师”才是最大的瓶颈。传统的 RLHF 太依赖人类标注,不仅贵,而且价值观很难统一。
现在的趋势(如 Anthropic 的 Constitutional AI)正在改变规则:
人类不再手把手教 AI 做题,而是制定一部“宪法” (Constitution)——也就是一套核心原则(如无害、有用)。
AI 基于这套宪法以及庞大的人类知识库,自己生成答案、自我批判 (Critique)、自我修正 (Revise)。
最后用 AI 生成的高质量数据来提升自己。
未来,当最强的人类研究员都无法评估AI的思想时,Agent的自我迭代似乎是唯一解。而我们只能希望我们规定的“内化的宪法”能让它保持对齐。🤔
AI 的终极形态,或许就是一场无限的自我博弈。
#AI #AGI #MachineLearning
🎉AzukiArt ✘ ChinaChic NFT FREE MINT GIVEAWAY🎉
🀄️🀄️5 whitelist spots!🀄️🀄️
To Enter:
1.Follow @ChinaChic_NFT & @Azuki_Art & @Supers6061
2. Like + RT tag 3 friends
48hrs