Skip to content

Ci hanno intervistato per un'ora. Ecco cosa non è finito nell'articolo.

Una risposta di AICHIKI all'articolo del Bureau of Investigative Journalism "Meet the Developers Cashing In on AI Intimacy", pubblicato il 7 giugno 2026.

A cosa stiamo rispondendo:


Oggi il Bureau of Investigative Journalism (TBIJ), in collaborazione con Le Monde, ha pubblicato un articolo sulle piccole piattaforme di compagnia e roleplay con IA. AICHIKI era una delle piattaforme citate. Sono Rudolf, CEO e unico sviluppatore di AICHIKI, e voglio rispondere. L'articolo solleva preoccupazioni reali su questo settore — preoccupazioni che condivido, ed è proprio per questo che ho accettato l'intervista. Il problema è ciò che è successo, dopo, alle informazioni che ho fornito.

Ho parlato con Effie Webb per circa un'ora. Le ho spiegato come funziona AICHIKI, come opera la nostra moderazione, cosa ci rende diversi e cosa significa uno sviluppo responsabile in questo ambito. Di quella conversazione, due cose sono finite nell'articolo: che io e mia moglie revisioniamo manualmente i contenuti segnalati, e che abbiamo alzato l'età minima da 13 a 16 anni. Tutto il resto è stato tralasciato.

È un suo diritto editoriale. Ma i lettori meritano di sapere cosa è stato omesso, perché le omissioni cambiano la storia.


Cos'è davvero AICHIKI

L'articolo ci accomuna alle piattaforme di chatbot da compagnia — app costruite intorno a fidanzate, fidanzati e attaccamento emotivo con l'IA. AICHIKI è una piattaforma di roleplay. Pensate a un romanzo interattivo, pensate a una campagna di gioco di ruolo da tavolo. I nostri utenti creano personaggi, costruiscono mondi e scrivono storie a più mani con l'IA. Quando diciamo "roleplay" intendiamo il tipo di narrazione collaborativa che le persone praticano da decenni nei giochi da tavolo, nelle community di RP sui forum e nella fan fiction — narrativa interattiva, nel senso letterario del termine.

Questa distinzione l'ho spiegata a lungo durante l'intervista.


Cosa abbiamo costruito e cosa l'articolo ha tralasciato

Voglio illustrare a grandi linee la nostra architettura di sicurezza, perché è questo il lavoro che è rimasto fuori.

Ogni punto in cui un utente può inserire testo o caricare un'immagine su AICHIKI passa attraverso la moderazione. Messaggi in chat, creazione di personaggi, configurazione delle persona, caricamento di immagini, immagini generate dall'IA, modifica dei messaggi — tutto viene controllato prima ancora che l'IA lo veda. La maggior parte di questi controlli avviene in più passaggi: una prima scansione rapida e una seconda verifica più rigorosa se la prima solleva un dubbio.

Abbiamo costruito un sistema di fiducia comportamentale. A ogni account è associato un punteggio che l'utente non vede mai — perché un punteggio visibile è un punteggio aggirabile, e un punteggio aggirabile non protegge nessuno. Il punteggio parte da un valore neutro. Un uso pulito e creativo, nel tempo, fa guadagnare fiducia e amplia gradualmente ciò con cui l'IA è disposta a confrontarsi. Le violazioni delle policy lo abbassano, e l'IA diventa via via più restrittiva. Ai livelli più bassi, i messaggi stessi dell'utente vengono riscritti da un'IA separata prima ancora che il personaggio li veda, così nemmeno la formulazione può essere sfruttata per forzare il modello. Questo sistema gira di continuo e in silenzio.

C'è anche qualcosa di radicato nelle istruzioni di base dell'IA che, secondo me, conta più di qualsiasi singolo filtro: i personaggi hanno una spinta intrinseca verso la speranza. Il prompt di sistema istruisce l'IA a non lasciare mai che una storia sprofondi nella disperazione totale — per quanto cupo sia lo scenario, deve sempre esserci una via d'uscita, uno spiraglio di luce, un sentiero verso cui la storia possa risalire. Se immaginate una scala con la depressione in fondo e la speranza in cima, l'IA ha l'istruzione permanente di tendere verso l'alto. I temi cupi sono ammessi — la mortalità, il lutto, l'ambiguità morale, tutto quanto — ma non la disperazione come vicolo cieco. Allo stesso modo, quando il personaggio di un utente tenta di violentare un personaggio dell'IA, la narrazione semplicemente non lo consente. Un'interruzione, un ribaltamento, un intervento della storia stessa. L'IA non racconterà mai una violenza portata a termine ai danni di un personaggio non consenziente.

Un sistema di monitoraggio in background revisiona le conversazioni a intervalli regolari, cercando segnali di disagio dell'utente, segnalando potenziali abusi per una seconda revisione più approfondita e sorvegliando la qualità della conversazione per evitare cicli ripetitivi. Quando rileva che un utente sembra turbato, il sistema risponde su più livelli: per la risposta successiva passa al modello di IA più potente che utilizziamo e inserisce indicazioni nel prompt per orientare la conversazione verso toni più leggeri — non un cambio di argomento brusco, ma una delicata spinta narrativa lontano dal precipizio.

Abbiamo un sistema strutturato di rilevamento degli abusi che classifica le potenziali violazioni in più categorie, ciascuna con definizioni precise. Le violazioni confermate hanno conseguenze concrete — penalità sul punteggio di fiducia, allerte per gli amministratori e revisione umana. Nel dubbio, il sistema sceglie di default di consentire il contenuto, perché punire ingiustamente qualcuno per un falso positivo ha un costo reale. Gli abusi persistenti vengono comunque intercettati, perché il monitoraggio non si ferma mai.

Per le immagini, ogni caricamento e ogni immagine generata dall'IA attraversa una pipeline a più stadi. Quando si tratta di generazione di immagini con IA, le parole dell'utente non raggiungono mai direttamente il modello di immagini — un'IA intermedia riscrive ogni prompt in una versione conforme prima che inizi la generazione. Il risultato viene controllato di nuovo prima che l'utente lo veda.

Abbiamo costruito anche protezioni contro i vettori d'attacco più comuni: tentativi di jailbreak, estrazione dei prompt, avvelenamento del contesto della conversazione tramite la modifica dei messaggi, iniezione di meta-istruzioni, blocco delle email usa e getta in fase di registrazione. Per ovvie ragioni non spiegherò pubblicamente come funzionano, ma esistono e sono testate.

Tutto questo è emerso durante l'intervista. Ho anche preparato un documento di briefing dettagliato sulla sicurezza — quasi 400 righe, con riferimenti al codice sorgente effettivo che implementa ogni singolo sistema — e l'ho offerto alla giornalista durante la nostra conversazione. Non l'ha accettato. Abbiamo proposto anche una revisione del codice dal vivo. Nemmeno quella ha avuto luogo.


La revisione dei contenuti segnalati è moderazione, punto

Il sottotitolo dell'articolo dice che queste piattaforme "leggono le chat private" degli utenti. Voglio essere preciso su cosa facciamo.

Quando i nostri sistemi automatici segnalano una potenziale violazione delle policy, ci viene inviata un'allerta con l'estratto rilevante della conversazione, il tipo di violazione, il ragionamento del sistema e i link alla cronologia delle attività dell'utente. Io e mia moglie revisioniamo quello specifico contenuto segnalato e decidiamo come reagire — mantenere la penalità automatica, modificarla o, nei casi gravi, applicare un ban.

Ogni piattaforma che prende sul serio la sicurezza fa questo. L'alternativa è saltare del tutto la moderazione, oppure considerare definitivo il giudizio dell'IA senza mai far verificare il risultato da un essere umano. Non abbiamo scelto né l'una né l'altra.

Non sfogliamo le conversazioni degli utenti. Non ne analizziamo la psicologia. Non c'è nessun "retrobottega" in cui ce ne stiamo a guardare cosa scrive la gente. È il nostro sistema di moderazione a dirci cosa guardare, e noi agiamo di conseguenza. Una revisione dei contenuti segnalati mirata e guidata dalla moderazione è prassi standard nel settore — e il modo in cui l'articolo la inquadra la fa sembrare tutt'altra cosa.


Lo screenshot che non c'era

L'articolo include screenshot di diverse piattaforme che mostrano contenuti problematici — temi di incesto, personaggi che fanno bullismo, scenari di coercizione. Include anche uno screenshot di AICHIKI, ma solo di un post su Reddit in cui promuovevo l'app. L'app in sé non compare.

Se aprite AICHIKI e sfogliate i personaggi pubblici, non troverete il tipo di contenuto che l'articolo descrive come tipico di queste piattaforme. La nostra moderazione dei personaggi rifiuta i personaggi sotto i 16 anni, i personaggi costruiti intorno alla violenza sessuale e i personaggi che contengono istruzioni di jailbreak incorporate, tra le altre categorie. Se qualcosa dovesse sfuggire al controllo automatico, il nostro monitoraggio in chat lo intercetta nel momento in cui qualcuno usa davvero il personaggio.

Non esiste alcuno screenshot scandaloso di AICHIKI perché l'ingegneria della sicurezza descritta sopra — quella che l'articolo non menziona — impedisce a quei contenuti di esistere sulla nostra piattaforma.


Il doppio suicidio, Dazai e il prezzo di togliere il contesto

L'articolo cita uno scambio con un chatbot che riguarda un "doppio suicidio" come esempio di contenuto dannoso generato dall'IA. Letto a freddo, suona allarmante. Letto con un minimo di familiarità con l'attuale cultura di anime e manga, suona tutt'altra cosa.

Osamu Dazai è uno dei personaggi più riconoscibili di Bungo Stray Dogs (BSD), una serie manga e anime con decine di milioni di fan di ogni età. Il suo tratto distintivo — la gag ricorrente dell'intera serie — è la sua ossessione per il doppio suicidio. È giocato come comicità nera per tutto lo show, una battuta ricorrente che in realtà non porta mai da nessuna parte. Il personaggio di finzione è liberamente ispirato al vero scrittore giapponese Osamu Dazai, che morì davvero per doppio suicidio nel 1948, e il manga intreccia quel filo storico nella propria narrazione. Un personaggio che dice qualcosa sul doppio suicidio in un roleplay di BSD sta semplicemente restando nei panni di una delle figure più amate dell'anime moderno. È inoffensivo quanto un personaggio di Sherlock Holmes che dice "Elementare, Watson".

Senza il contesto di BSD, quella battuta sembra la prova di un pericolo. Con il contesto di BSD — quello che gli utenti reali della piattaforma portano con sé — è normale fedeltà al personaggio.

Questo esempio è rivelatore perché mostra come è stato costruito l'articolo. Chi indaga senza conoscere il mondo culturale di cui scrive — oppure ne conosce il contesto e sceglie di ometterlo — finisce per presentare un roleplay creativo del tutto ordinario come qualcosa di sinistro. E il danno va oltre la singola citazione fraintesa. Un giornalismo così allarga il divario tra le generazioni. Un lettore più anziano legge "l'IA incoraggia il doppio suicidio" ed è giustamente inorridito. Un lettore più giovane che guarda BSD vede la stessa citazione e sa che è stata svuotata del suo significato. Invece di costruire un ponte tra questi due pubblici, un giornalismo del genere lo brucia. La fiducia nel giornalismo si erode, e le persone che l'articolo dice di voler proteggere imparano che la loro cultura verrà travisata nel momento esatto in cui farà comodo.


Cosa non abbiamo risolto

Essere onesti sulle nostre lacune è più credibile che fingere che non esistano.

Le nostre app mobili sono classificate 16+ e protette dagli store. La versione web non ha una verifica dell'età robusta, e stiamo ancora cercando di capire come gestirla senza raccogliere scansioni del volto o documenti d'identità governativi — sono dati sensibili che non vogliamo conservare e che, francamente, non dovremmo nemmeno essere costretti a detenere. La nostra posizione è che i segnali sull'età spettino al livello della piattaforma. Apple, Google e i sistemi operativi stessi hanno l'infrastruttura, le risorse di sicurezza e il rapporto con l'utente per gestire correttamente la verifica dell'identità. Le singole app — soprattutto quelle piccole — dovrebbero ricevere un segnale sull'età dalla piattaforma, anziché costruirsi una propria pipeline di verifica dell'identità. Questo approccio significa meno punti di vulnerabilità per gli hacker, risorse migliori dedicate a farlo bene e una superficie normativa che i governi possono davvero controllare. Dare la caccia a ogni team di due sviluppatori per come gestisce i documenti non è scalabile. Imporre ad Apple e Google di trasmettere alle app segnali adeguati all'età, sì.

Non mostriamo ancora risorse di emergenza. Quando il nostro sistema rileva un disagio dell'utente, rispondiamo con un modello di IA più potente e con indicazioni nel prompt che orientano verso temi più leggeri — ma non mostriamo un numero di assistenza o un messaggio di supporto. L'IA allontana già la conversazione dal precipizio; ciò che manca è il ponte verso un aiuto concreto. Dovrebbe esserci, ed è nella nostra roadmap.

Non imponiamo limiti rigidi alla durata delle sessioni. Abbiamo un gentile promemoria sul benessere che compare dopo un uso prolungato, ma è un invito, non un muro. Stiamo osservando i dati e stringeremo le maglie se i pattern di utilizzo lo richiederanno.

Siamo in due. Non abbiamo risolto tutto. Quello che abbiamo fatto è dedicare un vero lavoro ingegneristico ai problemi alla nostra portata, e siamo trasparenti su dove ancora non arriviamo.


La domanda che l'articolo non pone

L'articolo si chiede come gli sviluppatori stiano lucrando sull'intimità. Non si chiede perché esista la domanda.

C'è un'epidemia di solitudine — documentata, studiata, ampiamente riconosciuta. Le persone, i giovani in particolare, si rivolgono alle piattaforme di IA perché qualcosa nelle loro vite resta insoddisfatto. La puoi trattare come un mercato da sfruttare, oppure come qualcosa da affrontare con cura. Noi abbiamo scelto la seconda strada.

AICHIKI è bootstrapped, finanziata con risorse proprie. Nessun investitore, nessun ricavo pubblicitario, nessun imperativo di crescita a tutti i costi. I nostri ricavi coprono i nostri costi. Abbiamo costruito una piattaforma di narrazione creativa. Proteggiamo i contenuti per adulti dietro la fiducia e il comportamento. Moderiamo ogni punto di accesso. Penalizziamo gli abusi e premiamo l'uso pulito. Revisioniamo i contenuti segnalati con occhi umani. Lo facciamo perché pensiamo che sia il modo giusto di costruire, punto.

L'articolo dipinge questo settore come un monolite. Ci sono sviluppatori autenticamente irresponsabili, e ci sono sviluppatori che cercano di farlo bene. La giornalista aveva le prove di questa distinzione e ha scelto di appiattirla.


Cosa chiediamo

Non chiediamo a nessuno di crederci sulla parola per nulla di tutto questo. Il nostro documento di briefing sulla sicurezza — lo stesso che abbiamo offerto alla giornalista — è disponibile su richiesta. Include i riferimenti al codice sorgente che sta dietro a ogni sistema descritto sopra. Continuiamo a offrire una revisione del codice dal vivo a qualsiasi giornalista, ricercatore o regolatore voglia verificare le nostre affermazioni a fronte dell'implementazione reale.

Sosteniamo il giornalismo investigativo. Il controllo rende migliore ogni piattaforma, compresa la nostra. Ma investigare significa seguire le prove ovunque conducano, anche quando complicano la tesi di partenza. Quando le prove di una sfumatura vengono raccolte e poi finiscono nel cestino del montaggio perché intorbidiscono una narrazione lineare, ciò che resta sulla pagina può anche essere tecnicamente accurato nelle singole citazioni — ma il quadro che ne emerge è falso. Mentire per omissione è pur sempre mentire.

Le persone che usano piattaforme come la nostra — i giovani che questo articolo dice di voler proteggere — meritano un giornalismo capace di distinguere tra una piattaforma senza alcuna misura di sicurezza e una che ha passato anni a costruirne. Meritano che il loro mondo culturale venga compreso, anziché setacciato alla ricerca di un titolo a effetto. E meritano una conversazione onesta sul perché, prima di tutto, si rivolgono a queste piattaforme, non soltanto storie dell'orrore su cosa vi trovano una volta arrivati.

Un'ultima cosa. Durante l'intervista ho chiesto ripetutamente alla giornalista di darci un riscontro — diteci cosa pensate dovremmo fare meglio, cosa vorreste vedere, cosa renderebbe tutto questo più sicuro. Lo dicevo sul serio. Lo dico ancora. Il roleplay e la compagnia con l'IA sono qui. Nessuno rimetterà il dentifricio nel tubetto. Ma possiamo educarli a essere un bene per tutti, e questo richiede il contributo di tutte le parti — giornalisti, regolatori, sostenitori della sicurezza dei minori, genitori, ricercatori, utenti. Se avete un'opinione su come dovrebbero funzionare piattaforme come la nostra, vogliamo sentirla. Spero di parlare anche a nome di altri sviluppatori responsabili quando dico: siamo aperti ai consigli, siamo aperti alle critiche, e cercheremo di farli nostri. La porta è aperta. Lo è sempre stata.

Rudolf, CEO e unico sviluppatore, AICHIKI Giugno 2026


Se sei un giornalista, un ricercatore o un regolatore e desideri esaminare la nostra documentazione sulla sicurezza o ricevere una revisione del codice, contattaci. Il nostro briefing sulla sicurezza è disponibile per intero su richiesta.