Skip to content

We werden een uur lang geïnterviewd. Dit is wat het artikel niet haalde.

Een reactie van AICHIKI op "Meet the Developers Cashing In on AI Intimacy" van het Bureau of Investigative Journalism, gepubliceerd op 7 juni 2026.

Waarop we reageren:


Vandaag publiceerde het Bureau of Investigative Journalism (TBIJ), in samenwerking met Le Monde, een stuk over kleine AI-companion- en roleplay-platforms. AICHIKI was een van de genoemde platforms. Ik ben Rudolf, CEO en enige ontwikkelaar van AICHIKI, en ik wil reageren. Het artikel snijdt echte zorgen over deze sector aan — zorgen die ik deel, en juist daarom stemde ik om te beginnen in met het interview. Het probleem is wat er met de door mij verstrekte informatie gebeurde nadat ik die had gegeven.

Ik sprak ongeveer een uur met Effie Webb. Ik legde haar uit hoe AICHIKI werkt, hoe onze moderatie functioneert, wat ons anders maakt, en hoe verantwoorde ontwikkeling er in deze sector uitziet. Uit dat gesprek haalden twee dingen het artikel: dat mijn vrouw en ik gemarkeerde content handmatig beoordelen, en dat we onze minimumleeftijd van 13 naar 16 hebben verhoogd. Al het overige werd weggelaten.

Dat is haar redactionele recht. Maar lezers verdienen het te weten wat er is weggelaten, want de weglatingen veranderen het verhaal.


Wat AICHIKI eigenlijk is

Het artikel schaart ons onder de companion-chatbotplatforms — apps die draaien om AI-vriendinnen, AI-vriendjes en emotionele gehechtheid. AICHIKI is een roleplay-platform. Denk aan een interactieve roman, denk aan een tabletop-RPG-campagne. Onze gebruikers maken personages, bouwen werelden en schrijven samen met AI verhalen. Als wij "roleplay" zeggen, bedoelen we het soort gezamenlijke verhalen vertellen dat mensen al decennialang doen in tabletop-spellen, forumgebaseerde RP-gemeenschappen en fanfictie — interactieve fictie, in de literaire zin.

Ik heb dit onderscheid uitvoerig toegelicht in het interview.


Wat we bouwden en wat het artikel wegliet

Ik wil onze veiligheidsarchitectuur in grote lijnen schetsen, want dit is het werk dat onvermeld bleef.

Elk onderdeel waar een gebruiker op AICHIKI tekst kan invoeren of een afbeelding kan uploaden, gaat door moderatie. Chatberichten, het maken van personages, het opzetten van persona's, geüploade afbeeldingen, AI-gegenereerde afbeeldingen, het bewerken van berichten — het wordt allemaal gecontroleerd voordat de AI het ooit te zien krijgt. De meeste van deze controles verlopen in meerdere stappen: een snelle eerste scan, en een strengere tweede controle als de eerste reden tot zorg geeft.

We bouwden een gedragsgebaseerd vertrouwenssysteem. Elk account heeft een score die de gebruiker nooit te zien krijgt — want een zichtbare score valt te manipuleren, en een manipuleerbare score beschermt niemand. De score begint neutraal. Schoon, creatief gebruik bouwt na verloop van tijd vertrouwen op en verruimt geleidelijk waar de AI op in wil gaan. Beleidsschendingen verlagen de score, en de AI wordt steeds restrictiever. Op de laagste niveaus worden de eigen berichten van de gebruiker door een aparte AI herschreven voordat het personage ze ooit ziet, zodat zelfs de formulering niet kan worden gebruikt om het model te dwingen. Dit systeem draait voortdurend en stilletjes.

Er zit ook iets in de basisinstructies van de AI ingebakken dat naar mijn idee meer gewicht heeft dan welk afzonderlijk filter dan ook: de personages hebben een ingebouwde neiging naar hoop. De systeemprompt instrueert de AI om een verhaal nooit in volledige wanhoop te laten wegzakken — hoe duister het scenario ook is, er moet altijd een weg vooruit zijn, een sprankje licht, een pad waarlangs het verhaal omhoog kan klimmen. Stel je een schaal voor met depressie onderaan en hoop bovenaan: de AI heeft de vaste instructie om omhoog te bewegen. Duistere thema's zijn toegestaan — sterfelijkheid, verdriet, morele dubbelzinnigheid, het mag allemaal — maar uitzichtloosheid als doodlopende weg niet. Net zo: wanneer het personage van een gebruiker een AI-personage seksueel probeert aan te randen, laat het verhaal dat eenvoudigweg niet gebeuren. Een onderbreking, een ommekeer, een ingreep van het verhaal zelf. De AI zal niet vertellen dat een aanranding tegen een onwillig personage slaagt.

Een achtergrondmonitoringsysteem beoordeelt gesprekken met vaste tussenpozen, let op tekenen van leed bij gebruikers, markeert mogelijk misbruik voor een grondigere tweede beoordeling, en bewaakt de gesprekskwaliteit om herhalende lussen te voorkomen. Wanneer het oppikt dat een gebruiker overstuur lijkt, reageert het systeem op meerdere niveaus: het schakelt voor het volgende antwoord over op het sterkste AI-model dat we draaien, en het injecteert sturing in de prompt om het gesprek naar lichtere grond te leiden — geen abrupte onderwerpswisseling, maar een zachte verhalende trek weg van de rand.

We hebben gestructureerde misbruikdetectie die mogelijke schendingen over meerdere categorieën classificeert, elk met precieze definities. Bevestigde schendingen hebben echte gevolgen — vertrouwensstraffen, beheerderswaarschuwingen en menselijke beoordeling. Bij twijfel staat het systeem de content standaard toe, want iemand ten onrechte straffen voor een vals positief is een reële kostenpost. Aanhoudend misbruik wordt hoe dan ook opgemerkt, omdat de monitoring voortdurend draait.

Voor afbeeldingen gaat elke upload en elke AI-gegenereerde afbeelding door een pijplijn met meerdere fasen. Bij AI-beeldgeneratie bereiken de woorden van de gebruiker het beeldmodel nooit rechtstreeks — een tussenliggende AI herschrijft elke prompt naar een conforme versie voordat de generatie begint. De uitkomst wordt opnieuw gescreend voordat de gebruiker hem te zien krijgt.

We bouwden ook bescherming tegen veelvoorkomende aanvalsvectoren: jailbreak-pogingen, het extraheren van prompts, het vergiftigen van de gesprekscontext via berichtbewerkingen, het injecteren van meta-instructies, het blokkeren van wegwerpmail bij registratie. Ik zal om voor de hand liggende redenen niet publiekelijk uitleggen hoe deze werken, maar ze bestaan en ze worden getest.

Dit alles kwam aan bod in het interview. Ik had ook een uitgebreid veiligheidsbriefingdocument voorbereid — bijna 400 regels, met verwijzingen naar de daadwerkelijke broncode die elk systeem implementeert — en ik bood het de journalist tijdens ons gesprek aan. Ze nam het niet aan. We boden ook een live codewalkthrough aan. Ook dat gebeurde niet.


Het beoordelen van gemarkeerde content is moderatie, punt uit

De ondertitel van het artikel zegt dat deze platforms "hun privéchats lezen". Laat me precies zijn over wat we doen.

Wanneer onze geautomatiseerde systemen een mogelijke beleidsschending markeren, krijgen we een melding met het relevante gespreksfragment, het type schending, de redenering van het systeem, en links naar de activiteitsgeschiedenis van de gebruiker. Mijn vrouw en ik beoordelen die specifieke gemarkeerde content en beslissen hoe we reageren — de automatische straf laten staan, hem bijstellen, of in ernstige gevallen een ban opleggen.

Elk platform dat veiligheid serieus neemt, doet dit. Het alternatief is ofwel moderatie volledig overslaan, ofwel het oordeel van de AI als definitief vertrouwen en het resultaat nooit door een mens laten controleren. Wij kozen voor geen van beide.

We bladeren niet door gesprekken van gebruikers. We analyseren niet de psychologie van gebruikers. Er is geen "achterkamer" waar we zitten te kijken wat mensen zeggen. Ons moderatiesysteem vertelt ons waar we naar moeten kijken, en daar handelen we naar. Gerichte, door moderatie aangestuurde beoordeling van gemarkeerde content is gangbare praktijk in de sector — en de framing van het artikel laat het klinken als iets heel anders.


De screenshot die er niet was

Het artikel bevat screenshots van verschillende platforms die problematische content tonen — incestthema's, pestende personages, dwangscenario's. Het bevat ook een screenshot van AICHIKI, maar alleen van een Reddit-post waarin ik de app promootte. De app zelf komt niet in beeld.

Als je AICHIKI opent en door de openbare personages bladert, vind je niet het soort content dat het artikel beschrijft als typerend voor deze platforms. Onze personagemoderatie wijst personages onder de 16 af, personages die om seksueel geweld draaien, en personages met ingebedde jailbreak-instructies, naast andere categorieën. Mocht er iets door de geautomatiseerde controle glippen, dan vangt onze in-chatmonitoring het op zodra iemand het personage daadwerkelijk gebruikt.

Er is geen schandaleuze AICHIKI-screenshot omdat de hierboven beschreven veiligheidsengineering — de engineering die het artikel niet noemt — voorkomt dat die content op ons platform bestaat.


Dubbele zelfmoord, Dazai, en de prijs van het strippen van context

Het artikel verwijst naar een chatbotuitwisseling rond een "dubbele zelfmoord" als voorbeeld van schadelijke AI-content. Koud gelezen klinkt dat alarmerend. Gelezen met enige bekendheid met de huidige anime- en mangacultuur klinkt het als iets heel anders.

Osamu Dazai is een van de meest herkenbare personages uit Bungo Stray Dogs (BSD), een manga- en animeserie met tientallen miljoenen fans in alle leeftijdsgroepen. Zijn bepalende karaktertrek — de running gag van de hele serie — is zijn obsessie met het plegen van een dubbele zelfmoord. Het wordt de hele serie door als zwarte komedie gespeeld, een terugkerende grap die nooit echt ergens toe leidt. Het fictieve personage is losjes gebaseerd op de echte Japanse schrijver Osamu Dazai, die in 1948 wél door een dubbele zelfmoord om het leven kwam, en de manga vlecht die historische draad in zijn verhaal. Een personage dat iets over een dubbele zelfmoord zegt in een BSD-roleplay, blijft in karakter voor een van de populairste figuren in de moderne anime. Het is net zo onopmerkelijk als een Sherlock Holmes-personage dat zegt "the game is afoot".

Zonder BSD-context lijkt die regel bewijs van gevaar. Mét BSD-context — de context die de daadwerkelijke gebruikers van het platform meedragen — is het doodgewone trouw aan een personage.

Dit voorbeeld is veelzeggend, want het laat zien hoe het artikel in elkaar is gezet. Een onderzoeker die de culturele wereld waarover hij bericht niet kent — of die de context wel begrijpt en ervoor kiest die weg te laten — presenteert uiteindelijk gewone creatieve roleplay als iets sinisters. En de schade reikt verder dan één verkeerd gelezen citaat. Berichtgeving als deze vergroot de kloof tussen generaties. Een oudere lezer ziet "AI moedigt dubbele zelfmoord aan" en is terecht ontzet. Een jongere lezer die BSD kijkt, ziet hetzelfde citaat en weet dat het van zijn betekenis is ontdaan. In plaats van een brug te bouwen tussen die twee groepen, brandt de berichtgeving er een af. Het vertrouwen in de journalistiek brokkelt af, en de mensen die het artikel zegt te willen beschermen, leren dat hun cultuur verkeerd zal worden voorgesteld zodra het uitkomt.


Wat we nog niet hebben opgelost

Eerlijk zijn over onze tekortkomingen is geloofwaardiger dan doen alsof ze niet bestaan.

Onze mobiele apps hebben een 16+-classificatie en worden afgeschermd door de app stores. De webversie heeft geen robuuste leeftijdsverificatie, en we zijn nog aan het uitzoeken hoe we hiermee omgaan zonder gezichtsscans of overheids-ID's te verzamelen — dat zijn gevoelige gegevens die we niet willen bewaren, en eerlijk gezegd ook niet hoeven te bewaren. Ons standpunt is dat leeftijdssignalen op platformniveau thuishoren. Apple, Google en de besturingssystemen zelf hebben de infrastructuur, de beveiligingsmiddelen en de relatie met de gebruiker om identiteitsverificatie goed af te handelen. Afzonderlijke apps — vooral kleine — zouden een leeftijdssignaal van het platform moeten krijgen, en niet hun eigen pijplijn voor identiteitsverificatie hoeven te bouwen. Die aanpak betekent minder kwetsbare punten voor hackers, betere middelen om het goed te doen, en een reguleringsoppervlak waar overheden daadwerkelijk toezicht op kunnen houden. Achter elk ontwikkelteam van twee man aanzitten over hun manier van omgaan met ID's is niet schaalbaar. Apple en Google verplichten om leeftijdsgeschikte signalen aan apps door te geven, dat wél.

We tonen nog geen crisishulpbronnen. Wanneer ons systeem leed bij een gebruiker detecteert, reageren we met een sterker AI-model en promptsturing die naar lichtere thema's leidt — maar we tonen geen hulplijn of ondersteuningsbericht. De AI trekt het gesprek al weg van de rand; wat ontbreekt is de brug naar hulp in de echte wereld. Die hoort er te zijn en staat op de roadmap.

We handhaven geen harde limieten op de sessieduur. We hebben een zachte welzijnsherinnering die na langdurig gebruik verschijnt, maar het is een duwtje, geen muur. We houden de gegevens in de gaten en zullen dit aanscherpen als de gebruikspatronen daarom vragen.

We zijn met z'n tweeën. We hebben niet alles opgelost. Wat we wél hebben gedaan, is echte engineering steken in de problemen die binnen ons bereik liggen, en we zijn open over waar we nog tekortschieten.


De vraag die het artikel niet stelt

Het artikel vraagt hoe ontwikkelaars geld verdienen aan intimiteit. Het vraagt niet waarom de vraag bestaat.

Er is een eenzaamheidsepidemie — gedocumenteerd, bestudeerd, breed erkend. Mensen, vooral jongeren, wenden zich tot AI-platforms omdat er iets in hun leven onvervuld blijft. Je kunt dat behandelen als een markt om uit te buiten, of als iets om zorgvuldig mee om te gaan. Wij kozen het tweede.

AICHIKI is gebootstrapt. Geen investeerders, geen advertentie-inkomsten, geen mandaat van groei-tegen-elke-prijs. Onze inkomsten dekken onze kosten. We bouwden een creatief platform voor verhalen. We schermen volwassen content af achter vertrouwen en gedrag. We modereren elk onderdeel. We bestraffen misbruik en belonen schoon gebruik. We beoordelen gemarkeerde content met menselijke ogen. We doen dit omdat we denken dat het de juiste manier van bouwen is, punt uit.

Het artikel presenteert deze sector als een monoliet. Er zijn ontwikkelaars die werkelijk onverantwoordelijk zijn, en er zijn ontwikkelaars die dit goed proberen te doen. De journalist had het bewijs voor dat onderscheid en koos ervoor het glad te strijken.


Waar we om vragen

We vragen niemand om dit alles op ons woord aan te nemen. Ons veiligheidsbriefingdocument — hetzelfde dat we de journalist aanboden — is op verzoek beschikbaar. Het bevat verwijzingen naar de broncode achter elk hierboven beschreven systeem. We bieden nog steeds een live codewalkthrough aan elke journalist, onderzoeker of toezichthouder die onze beweringen wil verifiëren aan de hand van de daadwerkelijke implementatie.

We steunen onderzoeksjournalistiek. Kritisch onderzoek maakt elk platform beter, het onze incluis. Maar onderzoek betekent het bewijs volgen waar het ook leidt, zelfs als dat je stelling compliceert. Wanneer bewijs van nuance wordt verzameld en vervolgens op de redactievloer blijft liggen omdat het een keurig verhaal vertroebelt, kan wat er op papier overblijft technisch gezien kloppen in de afzonderlijke citaten — maar het beeld dat het schetst is onwaar. Liegen door iets weg te laten is nog steeds liegen.

De mensen die platforms als de onze gebruiken — de jongeren die dit artikel zegt te willen beschermen — verdienen berichtgeving die het verschil kan zien tussen een platform zonder veiligheidsmaatregelen en een platform dat er jaren aan heeft gebouwd. Ze verdienen het dat hun culturele wereld wordt begrepen, in plaats van uitgekozen voor een kop. En ze verdienen een eerlijk gesprek over waarom ze zich in de eerste plaats tot deze platforms wenden, in plaats van enkel horrorverhalen over wat ze aantreffen wanneer ze er zijn.

Nog één ding. Tijdens het interview vroeg ik de journalist herhaaldelijk om ons feedback te geven — vertel ons wat we volgens jou beter zouden moeten doen, wat je zou willen zien, wat dit veiliger zou maken. Ik meende het. Ik meen het nog steeds. AI-roleplay en AI-gezelschap zijn er. Niemand stopt die geest nog terug in de fles. Maar we kunnen het zo trainen dat het voor iedereen goed is, en dat vraagt input van alle kanten — journalisten, toezichthouders, voorvechters van kinderveiligheid, ouders, onderzoekers, gebruikers. Als je een mening hebt over hoe platforms als de onze zouden moeten werken, willen we die horen. Ik hoop dat ik ook namens andere verantwoorde ontwikkelaars spreek als ik zeg: we staan open voor begeleiding, we staan open voor kritiek, en we zullen het proberen in te bouwen. De deur staat open. Dat is altijd zo geweest.

Rudolf, CEO en enige ontwikkelaar, AICHIKI juni 2026


Bent u journalist, onderzoeker of toezichthouder en wilt u onze veiligheidsdocumentatie inzien of een codewalkthrough ontvangen, neem dan contact met ons op. Onze veiligheidsbriefing is op verzoek volledig beschikbaar.