ABD’de bir müşteri, 612 dolarlık restoran hesabına yalnızca 9 dolar bahşiş bıraktığını ve Amerikada tip kültürünün bir saçmalık olduğunu savundu:
“Bahşiş kuralları sanki değiştirilemezmiş gibi davranılıyor. 612 dolarlık bir yemek hesabım vardı ve bir anda sırf toplam tutar yüksek diye 120 dolardan fazla bahşiş bırakmam bekleniyordu. Masaya aynı tabaklar taşındı, aynı içecekler dolduruldu, masada aynı süre geçirildi ama nedense garsonun kazancını menü fiyatları belirliyor. 9 dolar bahşiş bıraktım, bu da birkaç saatlik hizmet için gerçek bir para. Ancak sanki yazılı olmayan bir kuralı çiğnemişim gibi ortamın havası bir anda değişti. Ardından müdür yanıma gelip ‘sektör standartlarından’ bahsetmeye başladı. Daha pahalı bir yemek sipariş etmek ne zamandan beri daha fazla emek harcandığı anlamına geliyor? 50 dolarlık bir yemek yerine 20 dolarlık bir yemek söylersem tabak bir anda daha mı ağır oluyor? İyi hizmet aldığımda bahşiş veririm ancak restoran daha pahalı olduğu için bahşişin otomatik olarak yüzdelik bir ek ücrete dönüşmesi gerektiğini düşünmüyorum. Sizce bu adil mi, yoksa artık buna o kadar alıştık ki sorgulamayı mı bıraktık?” dedi.
INTRODUCING SKILL RSI: Recursive Self Improvement for Agent Skills
Recursive self-improvement is usually a thought experiment. This one runs on your laptop. Skill RSI improves Codex Agent Skills by treating each loop like an experiment. It researches the domain ontology, maps what “good” means, deconstructs the current champion, tests a focused challenger against it, and only promotes the new version when the evidence holds up. You can start from a new goal or upload an existing skill as the baseline. Standalone or Codex plugin. Repo link in the comments. There's a copy-pastable command to give to Codex to have it install the whole setup for you, so you can get started right away.
We just released MAI-Code-1-Flash, a 5B-active small model. The team just finished this from a pretrained model to VSC and Copilot CLI production within a few weeks, so proud of their achievements. More details are here https://t.co/jx85ssYAea and a bigger model is on the way.
SpaceX has almost finished writing V1.0 of an in-house AI training stack in C that exact-maps to 220k GB300s with 800G NICs, making heavy use of pipeline parallelism and getting as close to bare metal as possible.
The potential speed improvement vs JAX for large training runs is over an order of magnitude.
AI 行业发展到了新阶段
最近海内外都开始有一些反思的声音出现了:
1. model+harness才是产品(而不会吃掉一切)
2. 完全自动化就是在骗自己,珍贵的东西都无法完全自动化,离不开人的参与
3. 慢工出细活的耐心,是AI时代的新奢侈品,欲速则不达,慢就是快
4. AI 的成本支出很大,算 ROI 有时候不如人