Skip to content

Bir Saat Boyunca Bizimle Röportaj Yapıldı. İşte Yazıya Girmeyenler.

AICHIKI''den, Bureau of Investigative Journalism''ın 7 Haziran 2026''da yayımlanan "AI Yakınlığından Para Kazanan Geliştiricilerle Tanışın" başlıklı yazısına bir yanıt.

Yanıt verdiğimiz yazı:


Bugün Bureau of Investigative Journalism (TBIJ), Le Monde ile ortaklaşa, küçük AI yoldaş ve roleplay platformları hakkında bir yazı yayımladı. Sözü edilen platformlardan biri de AICHIKI''ydi. Ben Rudolf, AICHIKI''nin CEO''su ve tek geliştiricisiyim; yanıt vermek istiyorum. Yazı bu sektörle ilgili gerçek kaygıları gündeme getiriyor — benim de paylaştığım kaygılar; zaten bu yüzden en başta röportajı kabul ettim. Sorun şu ki, verdiğim bilgiler bir kez elden çıktıktan sonra başlarına gelenler.

Effie Webb ile yaklaşık bir saat konuştum. AICHIKI''nin nasıl çalıştığını, moderasyonumuzun nasıl işlediğini, bizi farklı kılan şeyin ne olduğunu ve bu alanda sorumlu geliştirmenin neye benzediğini ona baştan sona anlattım. O konuşmadan yazıya iki şey girdi: eşimle birlikte işaretlenen içerikleri elle incelediğimiz ve asgari yaş sınırımızı 13''ten 16''ya yükselttiğimiz. Geri kalan her şey dışarıda kaldı.

Bu onun editöryel hakkı. Ama okurlar nelerin atlandığını bilmeyi hak ediyor, çünkü atlananlar hikâyeyi değiştiriyor.


AICHIKI aslında nedir

Yazı bizi yoldaş chatbot platformlarıyla — AI kız arkadaşlar, erkek arkadaşlar ve duygusal bağlanma üzerine kurulu uygulamalarla — aynı kategoriye koyuyor. AICHIKI bir roleplay platformu. İnteraktif bir roman düşünün, bir masaüstü RPG kampanyası düşünün. Kullanıcılarımız karakterler yaratıyor, dünyalar kuruyor ve AI ile birlikte ortak hikâyeler yazıyor. "Roleplay" dediğimizde, insanların onlarca yıldır masaüstü oyunlarda, forum tabanlı RP topluluklarında ve hayran kurgularında yaptığı türden ortak hikâye anlatıcılığını kastediyoruz — edebî anlamda interaktif kurgu.

Bu ayrımı röportajda uzun uzun anlattım.


Neyi inşa ettik ve yazı neyi dışarıda bıraktı

Güvenlik mimarimizi genel hatlarıyla ortaya koymak istiyorum, çünkü sözü hiç edilmeyen iş tam da bu.

AICHIKI''de bir kullanıcının metin girebildiği veya görsel yükleyebildiği her nokta moderasyondan geçiyor. Sohbet mesajları, karakter oluşturma, persona ayarları, görsel yüklemeleri, AI tarafından üretilen görseller, mesaj düzenleme — hepsi AI henüz görmeden önce denetleniyor. Bu denetimlerin çoğu birden fazla geçişle çalışıyor: hızlı bir ilk tarama ve ilki bir kaygı doğurursa daha katı bir ikinci denetim.

Davranışsal bir güven sistemi kurduk. Her hesap, kullanıcının asla göremediği bir puan taşıyor — çünkü görünen bir puan oyuna açık bir puandır ve oyuna açık bir puan kimseyi korumaz. Puan nötr başlıyor. Zaman içinde temiz ve yaratıcı kullanım güven kazandırıyor; AI''nin hangi içeriklere girmeye razı olacağını yavaş yavaş açıyor. Kural ihlalleri puanı düşürüyor ve AI giderek daha kısıtlayıcı hale geliyor. En düşük seviyelerde, kullanıcının kendi mesajları karakter onları görmeden önce ayrı bir AI tarafından yeniden yazılıyor; böylece ifade biçimi bile modeli zorlamak için kullanılamıyor. Bu sistem sürekli ve sessizce çalışıyor.

Ayrıca AI''nin temel talimatlarına işlenmiş, bence herhangi bir tekil filtreden daha önemli bir şey var: karakterlerin içine yerleşik bir umut eğilimi var. Sistem promptu, AI''ye bir hikâyenin asla tam bir çaresizliğe çökmesine izin vermemesini söylüyor — senaryo ne kadar karanlık olursa olsun, ileriye giden bir yol, bir ışık çatlağı, hikâyenin tırmanabileceği bir patika olmak zorunda. En altta depresyon, en üstte umut olan bir ölçek hayal ederseniz, AI''nin değişmez bir talimatı var: yukarıya doğru yönelmek. Karanlık temalara izin var — ölümlülük, yas, ahlaki belirsizlik, hepsine — ama çıkışsız bir umutsuzluğa yok. Benzer biçimde, bir kullanıcının karakteri bir AI karakterine cinsel saldırıda bulunmaya kalkıştığında, anlatı buna basitçe izin vermiyor. Bir kesinti, bir tersine dönüş, hikâyenin kendisinin araya girdiği bir eylem. AI, rıza göstermeyen bir karaktere karşı bir saldırının başarıya ulaştığını anlatmaz.

Bir arka plan izleme sistemi, konuşmaları düzenli aralıklarla gözden geçiriyor; kullanıcı sıkıntısı belirtilerini arıyor, olası kötüye kullanımı daha kapsamlı bir ikinci geçiş incelemesi için işaretliyor ve tekrar eden döngüleri önlemek üzere konuşma kalitesini gözlüyor. Bir kullanıcının üzgün göründüğünü sezdiğinde, sistem birden fazla düzeyde yanıt veriyor: bir sonraki yanıt için çalıştırdığımız en güçlü AI modeline geçiyor ve konuşmayı daha hafif bir zemine yönlendirmek için prompta yönlendirme enjekte ediyor — sarsıcı bir konu değişikliği değil, kenardan uzaklaştıran nazik bir anlatısal çekim.

Olası ihlalleri, her biri kesin tanımlara sahip birden çok kategoriye göre sınıflandıran yapılandırılmış bir kötüye kullanım tespiti sistemimiz var. Doğrulanmış ihlaller gerçek sonuçlar doğuruyor — güven cezaları, yönetici uyarıları ve insan incelemesi. Sistem, emin olmadığında içeriğe izin vermeyi varsayılan davranış olarak benimsiyor, çünkü birini bir yanlış pozitif yüzünden haksız yere cezalandırmak gerçek bir bedeldir. Israrlı kötüye kullanım yine de yakalanıyor, çünkü izleme sürekli çalışıyor.

Görseller için, her yükleme ve AI tarafından üretilen her görsel çok aşamalı bir hattan geçiyor. AI görsel üretimine gelince, kullanıcının kelimeleri görsel modeline asla doğrudan ulaşmıyor — araya giren bir AI, üretim başlamadan önce her promptu uyumlu bir versiyona yeniden yazıyor. Çıktı, kullanıcı görmeden önce yeniden taranıyor.

Yaygın saldırı yöntemlerine karşı da korumalar inşa ettik: jailbreak girişimleri, prompt sızdırma, mesaj düzenlemeleri yoluyla konuşma bağlamını zehirleme, meta-talimat enjeksiyonu, kayıt sırasında tek kullanımlık e-posta engelleme. Bunların nasıl çalıştığını bariz nedenlerle kamuya açık olarak anlatmayacağım, ama var ve test edilmiş durumdalar.

Bütün bunlar röportajda gündeme geldi. Ayrıca ayrıntılı bir güvenlik brifing belgesi hazırlamıştım — neredeyse 400 satır, her sistemi hayata geçiren gerçek kaynak koda atıflarla — ve konuşmamız sırasında bunu muhabire teklif ettim. Almadı. Canlı bir kod gezintisi de teklif ettik. O da gerçekleşmedi.


İşaretli içerik incelemesi moderasyondur, nokta

Yazının alt başlığı bu platformların "özel sohbetlerini okuduğunu" söylüyor. Ne yaptığımız konusunda net olayım.

Otomatik sistemlerimiz olası bir kural ihlalini işaretlediğinde, bize ilgili konuşma alıntısını, ihlal türünü, sistemin gerekçesini ve kullanıcının etkinlik geçmişine giden bağlantıları içeren bir uyarı gönderiliyor. Eşim ve ben o belirli işaretli içeriği inceliyor ve nasıl yanıt vereceğimize karar veriyoruz — otomatik cezayı olduğu gibi bırakmak, ayarlamak veya ciddi durumlarda bir yasaklama uygulamak.

Güvenliği ciddiye alan her platform bunu yapıyor. Alternatif, ya moderasyonu tümüyle atlamak ya da AI''nin kararını nihai sayıp sonucu hiçbir insanın denetlemesine izin vermemek. Biz ikisini de seçmedik.

Kullanıcı konuşmalarında gezinmiyoruz. Kullanıcı psikolojisini analiz etmiyoruz. Oturup insanların ne konuştuğunu izlediğimiz bir "arka ofis" yok. Moderasyon sistemimiz neye bakacağımızı söylüyor, biz de buna göre hareket ediyoruz. İşaretli içeriğin hedefli, moderasyon güdümlü incelemesi sektörde standart bir uygulamadır — ve yazının kurgusu bunu tamamen başka bir şeymiş gibi gösteriyor.


Orada olmayan ekran görüntüsü

Yazı, çeşitli platformların sorunlu içerik gösteren ekran görüntülerini içeriyor — ensest temaları, zorba karakterler, baskı senaryoları. AICHIKI''nin bir ekran görüntüsünü de içeriyor, ama yalnızca uygulamayı tanıttığım bir Reddit gönderisinin. Uygulamanın kendisi hiç görünmüyor.

AICHIKI''yi açıp herkese açık karakterlere göz atarsanız, yazının bu platformlarda tipik olarak betimlediği türden içeriği bulamazsınız. Karakter moderasyonumuz, diğer kategorilerin yanı sıra 16 yaş altındaki karakterleri, cinsel saldırı üzerine kurulu karakterleri ve içine jailbreak talimatları gömülmüş karakterleri reddediyor. Otomatik denetimden bir şey sıyrılıp geçerse, birisi karakteri gerçekten kullandığında sohbet içi izlememiz onu yakalıyor.

Skandal bir AICHIKI ekran görüntüsü yok, çünkü yukarıda anlatılan güvenlik mühendisliği — yazının sözünü etmediği mühendislik — bu içeriğin platformumuzda var olmasını engelliyor.


İkili intihar, Dazai ve bağlamı sıyırmanın bedeli

Yazı, zararlı AI içeriğine örnek olarak içinde "ikili intihar" geçen bir chatbot diyaloğuna gönderme yapıyor. Bağlamından kopuk okunduğunda kulağa endişe verici geliyor. Güncel anime ve manga kültürüne azıcık aşina biri için ise tamamen başka bir anlama geliyor.

Osamu Dazai, her yaş grubundan on milyonlarca hayranı olan Bungo Stray Dogs (BSD) manga ve anime serisinin en tanınan karakterlerinden biri. Onu tanımlayan özellik — tüm serinin tekrarlayan esprisi — ikili intihar etme saplantısı. Dizi boyunca kara mizah olarak işleniyor; aslında hiçbir yere varmayan, sürekli geri dönen bir şaka. Kurgusal karakter, 1948''de gerçekten ikili intihar ederek hayatını kaybeden gerçek Japon yazar Osamu Dazai''den serbestçe esinleniyor ve manga bu tarihsel ipucunu anlatısına dokuyor. Bir BSD roleplay''inde ikili intihar üzerine bir şey söyleyen bir karakter, modern animenin en popüler figürlerinden birinin karakterine sadık kalıyor demektir. Bu, bir Sherlock Holmes karakterinin "Oyun başladı" demesi kadar sıradan.

BSD bağlamı olmadan o satır bir tehlike kanıtı gibi görünüyor. BSD bağlamıyla — platformun gerçek kullanıcılarının taşıdığı bağlamla — sıradan bir karakter sadakatinden ibaret.

Bu örnek aydınlatıcı, çünkü yazının nasıl kurgulandığını gösteriyor. Hakkında haber yaptığı kültürel dünyaya yabancı bir araştırmacı — ya da bağlamı anlayıp onu atlamayı seçen biri — sonunda sıradan yaratıcı roleplay''i uğursuz bir şeymiş gibi sunuyor. Ve zarar, yanlış okunan tek bir alıntının ötesine geçiyor. Bu türden bir habercilik nesiller arasındaki uçurumu genişletiyor. Yaşlı bir okur "AI ikili intihara teşvik ediyor" görüyor ve haklı olarak dehşete kapılıyor. BSD izleyen genç bir okur aynı alıntıyı görüyor ve anlamından sıyrıldığını biliyor. Bu iki kitle arasında bir köprü kurmak yerine, habercilik bir köprüyü yakıyor. Gazeteciliğe duyulan güven aşınıyor ve yazının korumayı iddia ettiği insanlar, kültürlerinin işe geldiği an çarpıtılacağını öğreniyor.


Çözemediklerimiz

Eksiklerimiz hakkında dürüst olmak, onların yokmuş gibi davranmaktan daha inandırıcı.

Mobil uygulamalarımız 16+ olarak derecelendiriliyor ve uygulama mağazalarınca sınırlandırılıyor. Web sürümünde sağlam bir yaş doğrulaması yok ve bunu yüz taramaları ya da resmi kimlikler toplamadan nasıl ele alacağımızı hâlâ çözmeye çalışıyoruz — bunlar elimizde tutmak istemediğimiz ve açıkçası tutmak zorunda da olmamamız gereken hassas verilerdir. Bizim duruşumuz şu: yaş sinyalleri platform düzeyine aittir. Apple, Google ve işletim sistemlerinin kendileri, kimlik doğrulamasını gerektiği gibi yürütmek için gereken altyapıya, güvenlik kaynaklarına ve kullanıcıyla olan ilişkiye sahip. Tekil uygulamalar — özellikle küçük olanlar — kendi kimlik doğrulama hattını kurmak yerine platformdan bir yaş sinyali almalı. Bu yaklaşım, korsanlar için daha az zafiyet noktası, işi doğru yapmaya ayrılmış daha iyi kaynaklar ve hükümetlerin gerçekten denetleyebileceği bir düzenleyici yüzey demek. Her iki kişilik geliştirici ekibini kimlik işleme uygulamaları için kovalamak ölçeklenebilir değil. Apple ve Google''ın uygulamalara yaşa uygun sinyaller iletmesini zorunlu kılmak ise ölçeklenebilir.

Henüz kriz kaynaklarını öne çıkarmıyoruz. Sistemimiz kullanıcı sıkıntısı tespit ettiğinde, daha güçlü bir AI modeli ve daha hafif temalara yönlendiren bir prompt rehberliğiyle yanıt veriyoruz — ama bir destek hattı ya da yardım mesajı göstermiyoruz. AI zaten konuşmayı kenardan uzaklaştırıyor; eksik olan şey, gerçek dünyadaki yardıma giden köprü. Bunun orada olması gerek ve yol haritasında.

Katı oturum süresi sınırları uygulamıyoruz. Uzun kullanımdan sonra beliren nazik bir esenlik hatırlatması var, ama bu bir dürtme, bir duvar değil. Veriyi izliyoruz ve kullanım örüntüleri gerektirirse bunu sıkılaştıracağız.

İki kişiyiz. Her şeyi çözmüş değiliz. Yaptığımız şey, erişimimiz dahilindeki sorunlara gerçek bir mühendislik emeği koymak oldu ve nerede hâlâ yetersiz kaldığımız konusunda açığız.


Yazının sormadığı soru

Yazı, geliştiricilerin yakınlıktan nasıl para kazandığını soruyor. Bu talebin neden var olduğunu sormuyor.

Bir yalnızlık salgını var — belgelenmiş, üzerine çalışılmış, geniş çapta kabul görmüş. İnsanlar, özellikle gençler, AI platformlarına yöneliyor çünkü hayatlarında karşılanmayan bir şey var. Bunu sömürülecek bir pazar olarak ele alabilirsiniz ya da dikkatle ilgilenilecek bir şey olarak. Biz ikincisini seçtik.

AICHIKI kendi imkânlarıyla ayakta — bootstrapped. Yatırımcı yok, reklam geliri yok, ne pahasına olursa olsun büyüme zorunluluğu yok. Gelirimiz masraflarımızı karşılıyor. Yaratıcı bir hikâye anlatım platformu inşa ettik. Yetişkin içeriğini güvenin ve davranışın arkasına koyuyoruz. Her noktayı modere ediyoruz. Kötüye kullanımı cezalandırıyor, temiz kullanımı ödüllendiriyoruz. İşaretli içeriği insan gözüyle inceliyoruz. Bunu yapıyoruz çünkü inşa etmenin doğru yolunun bu olduğunu düşünüyoruz, nokta.

Yazı bu sektörü tek parça bir bütünmüş gibi çerçeveliyor. Gerçekten sorumsuz geliştiriciler var ve bu işi doğru yapmaya çalışan geliştiriciler var. Muhabirin elinde bu ayrımı yapacak kanıt vardı ve onu düzleştirmeyi seçti.


Talebimiz

Bunların hiçbirinde kimseden bize körü körüne inanmasını istemiyoruz. Güvenlik brifing belgemiz — muhabire teklif ettiğimizin aynısı — talep üzerine ulaşılabilir durumda. Yukarıda anlatılan her sistemin ardındaki kaynak koda atıflar içeriyor. İddialarımızı gerçek uygulamayla karşılaştırmak isteyen herhangi bir gazeteci, araştırmacı veya düzenleyiciye hâlâ canlı bir kod gezintisi teklif ediyoruz.

Araştırmacı gazeteciliği destekliyoruz. Mercek altına alınmak her platformu daha iyi yapar, bizimki dahil. Ama araştırma, tezinizi zorlaştırsa bile kanıtın götürdüğü her yere kadar onu izlemek demektir. Nüansa dair kanıt toplandıktan sonra, yalnızca temiz bir anlatıyı bulandırdığı için kesim masasında bir kenara atıldığında, sayfada kalanlar tek tek alıntılar bazında teknik olarak doğru olabilir — ama çizdikleri tablo yanlıştır. Susarak yalan söylemek de yalan söylemektir.

Bizimkiler gibi platformları kullanan insanlar — bu yazının korumak istediğini söylediği gençler — hiçbir güvenlik önlemi olmayan bir platformla, yıllarını bunları inşa etmeye harcamış bir platform arasındaki farkı görebilen bir habercilik hak ediyorlar. Kültürel dünyalarının bir başlık için seçilip ayıklanması yerine anlaşılmasını hak ediyorlar. Ve en başta bu platformlara neden yöneldiklerine dair dürüst bir konuşmayı hak ediyorlar; oraya vardıklarında karşılaştıkları şeylere dair korku hikâyelerini değil.

Bir şey daha. Röportaj sırasında muhabirden defalarca bize geri bildirim vermesini istedim — daha iyi ne yapmamız gerektiğini, ne görmek istediğinizi, bunu daha güvenli kılacak şeyin ne olduğunu söyleyin. Ciddiydim. Hâlâ ciddiyim. AI roleplay ve yoldaşlık artık hayatımızda. Bu işi geri sarmanın yolu yok. Ama onu herkes için iyi olacak şekilde eğitebiliriz ve bu, her taraftan girdi gerektiriyor — gazeteciler, düzenleyiciler, çocuk güvenliği savunucuları, ebeveynler, araştırmacılar, kullanıcılar. Bizimkiler gibi platformların nasıl çalışması gerektiğine dair bir fikriniz varsa, onu duymak istiyoruz. Şunu söylerken diğer sorumlu geliştiriciler adına da konuştuğumu umuyorum: rehberliğe açığız, eleştiriye açığız ve bunu içselleştirmeye çalışacağız. Kapı açık. Hep açıktı.

Rudolf, CEO ve tek geliştirici, AICHIKI Haziran 2026


Bir gazeteci, araştırmacı veya düzenleyiciyseniz ve güvenlik belgelerimizi incelemek ya da bir kod gezintisi almak istiyorsanız, lütfen bizimle iletişime geçin. Güvenlik brifingimiz talep üzerine tam olarak erişilebilir durumda.