@yigitakinkaya Bu akışta asıl darboğaz üretim değil, tutarlılık ve kalite kontrol bence. Karakter sürekliliği, sahne arası continuity, telif riski ve izlenme başına gelir hesabı net değilse 4 saatlik kurulum biraz yanıltıcı kalıyor.
@DeepTechTR Kodlama sıçraması iddiasında tek benchmark yetmiyor. Agent akışlarında tool use, uzun context tutarlılığı ve latency tarafı daha belirleyici olacak. Çıkınca SWE-bench dışı gerçek repo testleri görmek lazım.
Şuna baksana.
Endava, yazılım teslimatını AI ajanlarını merkeze alarak yeniden kuruyor.
PM tarafında en net sonuç şu:
Sprint planı, risk listesi, user story taslağı artık ayrı ayrı değil, aynı akışta çıkıyor.
Bence denenir.
Google Labs'ta Dreambeans diye bir şey gördüm.
Gmail, Docs, Calendar gibi uygulamalardan günlük hikaye çıkarıyor.
Peki ne işe yarar?
Kampanya fikri, içerik takvimi, müşteri içgörüsü.
Benim aklım direkt toplantı notlarına gitti.
@kadiruludag Hetty’yi özellikle Go tabanlı ve self-hosted olması yüzünden ilginç buluyorum. Burp kadar olgun değil ama hızlı kurcalama, HTTP akışını kaydetme ve ekip içinde tekrar üretilebilir test senaryosu çıkarma tarafında güzel bir alternatif olabilir.
@parsluci Mobil + Chrome tarafı ajan kullanımını gerçekten pratikleştiriyor. Benim merak ettiğim kısım izin modeli ve oturum hafızası: sekmeler arası bağlamı taşırken kullanıcı kontrolü ne kadar ince ayarlı olacak?
Token faturası kabardı.
Dün satış demosu hazırlarken yine gördüm: uzun prompt doğrudan para yakıyor.
Kısa prompt, tekrar kullanılabilir şablon, az örnek.
AI işi büyüdükçe mesele sadece kalite değil:
Aynı sonucu daha ucuza almak.
Bugün Figma açmadan tasarım yaptım.
Claude'a tek bir brief verdim:
• moodboard fikri
• wireframe akışı
• müşteri sunumu
• UX metinleri
Hepsini toparladı.
Figma hâlâ lazım ama ilk taslakta Claude epey zaman kazandırıyor.
ChatGPT'nin hafızası gelişince asıl fark şurada:
Her seferinde projeyi baştan anlatmıyorsun.
PRD yazdır, toplantı notunu toparlat, yol haritasını güncellet.
Benim için olay bu: aynı bağlamı tekrar tekrar anlatmamak.
Şirketlerde asıl soru şu:
“Bu işi AI ajanına mı verelim, insanda mı kalsın?”
Ben olsam basit bakardım:
• tekrar eden iş: ajan
• karar ve empati: insan
• ikisi karışıyorsa: insan onaylı ajan
HRBP’lerin masasına yakında bu liste düşer.
@sairahul1 Harness engineering terimini çoğu kişi duymadı ama agent sistemlerinde asıl farkı bazen model değil, doğru test harness ve eval düzeni yaratıyor. Siteyi özellikle örnek akışlar ve ölçüm yaklaşımı için incelemeye değer buldum.
@himes369 Bence burada asıl iyi fikir tool seçimi değil, sınırların net olması. Aynı şey agent tasarımında da çıkıyor: tek agent her şeyi yapınca bağlam kirleniyor, küçük ve net sorumluluklar daha sürdürülebilir oluyor.
İç doküman yüklerken bunu aç.
OpenAI, Lockdown Mode'u duyurdu.
Performans değerlendirmesi, çalışan verisi, şirket politikası gibi konularda AI'ın dış talimatlara kanmasını zorlaştırıyor.
Yani hassas dosyada varsayılan ayar değil, kilitli mod.