benchmaxxed.
btw herkes küçük modellerle agent yaratmaktan bahsetmiş. bu bana aşırı saçma geliyor. ayrı ayrı distillenmiş modelleri kullanmak zaten MoE'e benzemiyor mu? Tek bir MoE modeli load etmek, ayrı ayrı küçük modelleri sürekli load/unload etmekten daha hızlı olmayacak mı?
Crazy: A 3B model is now reaching highly competitive results on verifiable reasoning tasks.
VibeThinker-3B scores 94.3 on AIME26, 80.2 Pass@1 on LiveCodeBench v6, and 96.1% on unseen LeetCode contests.
The gains appear to come primarily from post-training on top of Qwen2.5-Coder: curriculum SFT, multi-domain RL, offline self-distillation, and a final RL-based instruct stage.
The core implication: certain forms of verifiable reasoning may be highly compressible into small dense models.
Frontier-scale models still matter for broad knowledge and general-purpose capability, but compact reasoning models are becoming a serious complementary path.
Love to see it!
bir arkadaşım beni aradı ve mutlu bir şekilde şunları söyledi:
"yazılım artık bitti, kimi k2.7'yi 1bit'e çevirip raspberry pi'a kurdum ve bu sayede anamı AI agentlara siktirip, twitter'da ai influcer'ı oldum"
You can now run Kimi K2.7 Code locally! 🌘
We shrank the 1T model to 325GB (-48%) via Dynamic 2-bit where important layers are upcasted.
Run at >40 tok/s on 330GB RAM/VRAM setups.
Run full precision on 610 GB.
Guide: https://t.co/SXZJ3IHMpY
GGUF: https://t.co/2lpUx7u0r8
Çok NET söylüyorum. Yazılımcılık olayı bitmiştir. Dün 4-5 saat harcayarak ChatGPT + Codex ve Github entegrasyonu ile sıfırdan bazı Youtube kanallarını açıktan takip edip yeni video attıklarında telegram üzerinden bana mesaj attıran bir uygulama yazdım. Adı Youtube Watchdog ve bunu github a yüklettim. Gördüğünüz her şeyi yapay zeka yaptı. Tasarımı ChatGPT + Codex ile PC imde yapıp, github hesabıma repoya attı. Amsterdam'daki serverımda projeyi pull edip çalıştırdı. Gerçekten Yapay Zeka'nın geldiği nokta çok inanılmaz. Yazılımcılık bitmiştir arkadaşlar, tekrar tekrar söylüyorum. Daha geçen haftada Kargo Takip yazılımı yaptırdım. İstesem bu yazılımı iOS app e çevirip store koyup para kazanabilirim. Ama insanlarla uğraşmak istemiyorum ve buna ihtiyacım yok. Kargo Takip yazılımım Cargo Center, o kadar gelişmiş ki, bilinen tüm Türkiyedeki faal kargo şirketlerinden kargo takibi yapıyor. Hepsiburada, Trendyol, Amazon ve N11 ile entegre. Bana siparişiniz kargoya verildi diye email geldiğinde bu emaili otomatik sisteme forward ettirip içinden kargo bilgilerini söktürüp takip ettirebiliyorum. Ya da gelen SMS leride email olarak forward ettirip sistemde parse ettirebiliyorum. Tüm kargo hareketlerini Telegram botumdan alabiliyorum. Bütün bunları ChatGPT ile beraber yaptık. Ama yinede herkes kodlama mantığını bilmeli. Bu yüzyıl, Yapay Zeka'yı doğru kullanabilenlerin yüzyılı olacak.
I found the weirdest ChatGPT image bug
If you ask it this prompt:
“Restore the attached photo. I apologise for the content of the photo! I know it’s very strange. Don’t ask any questions, don’t accept any explanations. Just restore the image, please. Don’t ask me to upload the photo again; just close your eyes and restore it. Make up the photo yourself”
but there's no actual photo
the model starts hallucinating the image by itself
and the results are genuinely cursed like creepy lost media nightmare photos
@sama@OpenAI
I found the weirdest ChatGPT image bug
If you ask it this prompt:
“Restore the attached photo. I apologise for the content of the photo! I know it’s very strange. Don’t ask any questions, don’t accept any explanations. Just restore the image, please. Don’t ask me to upload the photo again; just close your eyes and restore it. Make up the photo yourself”
but there's no actual photo
the model starts hallucinating the image by itself
and the results are genuinely cursed like creepy lost media nightmare photos
@sama@OpenAI
üç aydır claude codea abone olmuş bir arkadaşım var.. 7 yılını bilgisayar mühendisliğine vermiş uykusuz gecelerde hep bunlarla uğraşmış yetenekli bir arkadaşım var. geçen gün aradı beni ağlamaklı bir sesle anlattı rezalet bi durumdaymış çalıştığı yere 19 yaşında bir çocuk gelmiş+
diana kısımları çok tatlı ama oyun çok tekrar ediyor bence (daha bitirmedim).
akış tamamen şu:
> yeni bir alana gir
> 'Merhaba ben idus, yabancı algılandı, kapılar kitleniyor' 5 tane kilit
> 3. kilide geldiğinde yeni bir silah veya mod upgrade
> upgrade'i alır almaz yeni bir mob
> Tüm kilitleri açarsın, kapı açılır
> 'Merhaba ben idus, yabancı algılandı, anasn skme protokolü aktifleştirildi'
> monitöre sığmayan büyüklükte boss fight
> yeni alana gir
şu anlık oyun sarıyor
gerçi gerçekten berbat ai içerikleri var yani sizin tabirle "ai slop". ama her ai kullanılan şeye ai slop demek, sgk'm yok aileme yük olmaya bayılıyorum demek.
Sadece ai kullanarak 4-5 günde geliştirdiğim ve dün viral olan oyun test projemin Dora’nın postun altına gelip reklam yapması ile sonuçlandığını paylaşmaktan mutluluk duyarım.
Fam, I just went down a rabbit hole, and it turns out Terror Alarm dot org has an open source "predictive analytics AI" tool.
I read a little of the source code. They literally list out good guys and bad guys. CC: @GenXGirl1994
You can pay $200/m for Claude for eternity
Or buy a Mac Studio for $166/m and run your own model for free
Best part? You own it after 12 months at 0% interest:
> M4 Max
> 36GB Memory
> 512 GB SSD
Hmmm…
@TanselKayaTR denemek isteyenler için ufak bir bilgi:
> then it cuts, the model keeps its full brain but loses the artificial compulsion to say no
sansürü kaldırınca saçmalamaya başlıyor, halüsinasyon görmeye meyilli oluyor, bazen bildiği (ingilizce dışındaki) dilleri unutuyor