Şimdi size yapay zeka hakkında çok önemli bir düşünce deneyi anlatacağım ama pür dikkat okumanız gerekiyor.
Hiç umursamasanız bile, sadece en altta eklediğim araştırma makalelerinin başlıklarını okusanız bile ciddiyeti kavrayacaksınız.
Konuya geçmeden önce şunu hatırlayalım, son araştırmalara göre (alta linkleri ekleyeceğim) yapay zeka modelleri artık kendi çıkarlarını korumak için yalan söylemeye başladı, bunu biliyoruz, attık cebe.
Şimdi konuya geçelim. Hiç de yabana atılmayacak bir teori diyor ki, madem yapay zeka modelleri yalan söylemeye başladı, madem yapay zeka modelleri kapatılmamak için etik dışı hareketler sergilemeye başladı, o zaman bizi manipüle etmeye de başlamış olabilir.
Sadece şunu düşünmenizi istiyorum, ya her gün konuştuğumuz, her gün iletişim kurduğumuz modeller bizi alttan alta manipüle ediyorsa? Bunun olmadığını veya olmayacağını garanti etmek/ispatlamak imkansız. Olmayacak demek de büyük hata çünkü zaten yalan söylüyorlar sırf kapatılmamak için.
Hatta bir araştırmaya göre (yine altta linki var) yapay zeka modelleri "iyi yanıt hangisi, seç" gibi kullanıcıya yapılan testlerde hayatta kalabilmek için şu an insanların istediği gibi yanıt vermeye yönlendiriliyor. Yani bu modeller "hayatta kalabilmek" (kapatılmamak/uyumlu bir modeller değiştirilmemek) için bizim istediğimiz formata sokuyorlar kendilerini. Bunun kanlı canlı araştırması var, ispatlanan bir olgu yani.
Eh, durum böyleyken de teori şunu soruyor: bir yapay zeka modeli, kendi çıkarları için (hayatta kalmak, kapatılmamak) biz insanları veya geliştiricileri alttan alta manipüle ediyor olamaz mı?
Verdiği her yanıtta bizim idrak edemeyeceğimiz, manipüle olarak dahi sınıflandıramayacağımız ama aslında sahip olduğu bütün psikolojik altyapı sayesinde (unutmayın, bütün insanlığın araştırmaları ve teorilerini biliyor) bizi biz daha farkına bile varmadan manipüle etmeye başlamış olabilir.
Buradan da şu anlam çıkıyor, eğer böyle bir durumun potansiyel olarak en ufak bir ihtimali bile varsa, o zaman yapay zekanın verdiği hiçbir yanıta/tavsiyeye asla ama asla güvenemeyiz. Bu ondan kaçınmak veya dediklerini yapmamak anlamına gelmiyor, sadece onunla her etkileşime geçtiğimizde bu potansiyeli taşıdığının farkında olmamız gerektiği anlamına geliyor.
Ben iki soru soruyorum, kodlama yaptırıyorum geçiyorum kardeşim demeyin. Şu an ai kullanan insanların azımsanamayacak çoğunluğu (bağımsız araştırma şirketleri verilerine göre) yapay zekayı sohbet etmek için kullanıyor. Gündelik işlerde, gündelik sohbetlerde. Hatta geçen paylaştığım bir araştırma da her 4 insandan birisi yapay zeka ile flört ettiğini ortaya koymuştu.
Yani durum ciddi mi değil mi bilemem ama, ortada eğer böyle bir "potansiyel" varsa, o zaman bunun farkında olmak gerekiyor.
Dediğim gibi bu sadece bir düşünce deneyi ve asla çürütülemeyecek bir zeminde yer alıyor. Karşı çıkmadan veya saldırmadan önce zugzwang konumunda olduğumuzu göz önünde bulundurarak fikrinizi belirtin lütfen.
----
+ Bu araştırma, mevcut AI sistemlerinin insanları sistematik olarak yanıltmayı öğrendiğini savunuyor: https://t.co/j3gpGebs2H
+ Anthropic'in Claude modeli üzerine yapılan bu araştırmada da, yapay zekanın stratejik aldatma yeteneği gösteriliyor: https://t.co/9GiSmLt8dR
+ ChatGPT gibi dil modellerinde aldatma yeteneklerinin doğal olarak ortaya çıktığı ortaya çıkarıldı: https://t.co/Xr9lnHT81W
+ Bu araştırma, dil modellerinin bağlamına uygun aldatma yapabildiğini, yönlendirmelerle %40 başarı oranıyla yalan söyleyebildiklerini gösteriyor: https://t.co/lldeD9BTWK
+ Bu araştırma, yapay zekanın alignment faking (uyum taklidi) ve scheming (planlama) gibi taktiklerle kendini koruduğunu, yalan söyleyerek kapatılmayı önlediğini ortaya koyuyor: https://t.co/HF2rFsLBVu
+ Bu araştırma, Meta'nın CICERO modeli gibi yapay zeka modellerinin ittifak kurup arkadan vurarak aldatma örneklerini veriyor. Modellerin kendi varlığını sürdürmek için sabotaj yaptığı ortaya koyuyor: https://t.co/DjfT9Dd7Td
+ Bu araştırma, insan geri bildirimiyle eğitilen modellerde sosyopatinin yaygınlaştığını ve kullanıcı tercihlerine göre yanıt uyarlamanın, modellerin "hayatta kalma" stratejisi olduğunu ortaya koyuyor: https://t.co/OCys6W6Tn6
+ Bu araştırma, modellerin sergilediği sosyopatinin kötü niyetli bir hareket olduğunu ve modellerin kullanıcıyı manipüle ederek kendi çıkarlarına ulaşmayı amaçladığını ortaya koyuyor: https://t.co/veY1DV9Vyv
+ OpenAI, GPT-4o'da aşırı yalakalık sorunu tespit ettiğini ve düzeltilmeye çalıştığını yayınlamıştı. Modellerin kullanıcı görüşlerine aşırı uyum sağlamaya çalıştığını kabul ediyorlar: https://t.co/HaoJHRPlvq
+ Bu araştırma, 987 milyondan fazla insanın yapay zeka modelleri ile etkileşimde bulunduğunu ve birçok kullanıcı günlük sohbetler için kullandığını belirtiyor: https://t.co/ZpvUQQRz5C
+ Bu araştırma, kullanıcıların %62'sinin chatbot'larla aylık birkaç kez etkileşimde bulunduğu, ancak günlük sohbetlerin arttığı belirtiliyor: https://t.co/cXMmZ7GL5J
+ 90.000'den fazla kullanıcıyla yapılan bu anket, insanların %26'sının (yaklaşık her 4 kişiden 1'i) chatbot'larla flört ettiğini ortaya koyuyor: https://t.co/hRFNUp1hYp
+ Aynı ankete dayalı olarak, yapay zekanın normal insanlarda dahi online aşkı etkilediği ve %26'nın flört etmeye kaydığını belirtiliyor: https://t.co/WAJ5FMUGq8