Skip to content

Nos entrevistaron durante una hora. Esto es lo que no llegó al artículo.

Una respuesta de AICHIKI al artículo «Meet the Developers Cashing In on AI Intimacy» del Bureau of Investigative Journalism, publicado el 7 de junio de 2026.

A qué estamos respondiendo:


Hoy, el Bureau of Investigative Journalism (TBIJ), en colaboración con Le Monde, publicó un reportaje sobre pequeñas plataformas de compañía y roleplay con IA. AICHIKI fue una de las plataformas mencionadas. Soy Rudolf, CEO y único desarrollador de AICHIKI, y quiero responder. El artículo plantea preocupaciones reales sobre esta industria — preocupaciones que comparto, y precisamente por eso accedí a la entrevista. El problema es lo que ocurrió con la información que aporté una vez que la entregué.

Hablé con Effie Webb durante alrededor de una hora. Le expliqué cómo funciona AICHIKI, cómo opera nuestra moderación, qué nos hace diferentes y en qué consiste el desarrollo responsable en este terreno. De toda esa conversación, dos cosas llegaron al artículo: que mi esposa y yo revisamos manualmente el contenido marcado, y que subimos nuestra edad mínima de 13 a 16 años. Todo lo demás quedó fuera.

Está en su derecho como editora. Pero los lectores merecen saber qué se omitió, porque las omisiones cambian la historia.


Qué es AICHIKI en realidad

El artículo nos agrupa con las plataformas de chatbots de compañía — apps construidas en torno a novias, novios y vínculos emocionales con IA. AICHIKI es una plataforma de roleplay. Piensa en una novela interactiva, piensa en una campaña de rol de mesa. Nuestros usuarios crean personajes, construyen mundos y escriben historias colaborativas con IA. Cuando decimos «roleplay» nos referimos a esa narración colaborativa que la gente lleva décadas practicando en los juegos de rol de mesa, en las comunidades de rol por foros y en la fan fiction — ficción interactiva, en el sentido literario.

Expliqué esta distinción con detalle durante la entrevista.


Lo que construimos y lo que el artículo dejó fuera

Quiero exponer nuestra arquitectura de seguridad en términos generales, porque este es el trabajo que quedó sin mencionar.

Cada superficie en la que un usuario puede introducir texto o subir una imagen en AICHIKI pasa por moderación. Los mensajes del chat, la creación de personajes, la configuración de personas, las imágenes subidas, las imágenes generadas por IA, la edición de mensajes — todo se revisa antes de que la IA llegue siquiera a verlo. La mayoría de estas comprobaciones se ejecutan en varias pasadas: un primer escaneo rápido y una segunda comprobación más estricta si la primera detecta algo sospechoso.

Construimos un sistema de confianza basado en el comportamiento. Cada cuenta lleva una puntuación que el usuario nunca ve — porque una puntuación visible es una puntuación manipulable, y una puntuación manipulable no protege a nadie. La puntuación parte de un valor neutro. El uso limpio y creativo a lo largo del tiempo va ganando confianza y abre poco a poco aquello con lo que la IA está dispuesta a comprometerse. Las infracciones de las normas la bajan, y la IA se vuelve progresivamente más restrictiva. En los niveles más bajos, los propios mensajes del usuario son reescritos por una IA aparte antes de que el personaje llegue a verlos, de modo que ni siquiera la formulación pueda usarse para coaccionar al modelo. Este sistema funciona de forma continua y silenciosa.

Hay además algo integrado en las instrucciones base de la IA que, creo, importa más que cualquier filtro individual: los personajes llevan dentro una inclinación hacia la esperanza. El prompt de sistema instruye a la IA para que nunca deje que una historia se hunda en la desesperación total — por muy oscuro que sea el escenario, tiene que haber un camino hacia adelante, un resquicio de luz, una senda por la que la historia pueda ascender. Si imaginas una escala con la depresión abajo y la esperanza arriba, la IA tiene una instrucción permanente de tirar hacia arriba. Los temas oscuros están permitidos — la mortalidad, el duelo, la ambigüedad moral, todo ello — pero la desesperanza como callejón sin salida no lo está. Del mismo modo, cuando el personaje de un usuario intenta agredir sexualmente a un personaje de IA, la narración sencillamente no deja que ocurra. Una interrupción, un giro, un acto de la propia historia que se interpone. La IA no narrará que una agresión culmine con éxito contra un personaje que no consiente.

Un sistema de monitorización en segundo plano revisa las conversaciones a intervalos regulares: busca señales de malestar en el usuario, marca posibles abusos para una segunda revisión más exhaustiva y vigila la calidad de la conversación para evitar bucles repetitivos. Cuando detecta que un usuario parece angustiado, el sistema responde en varios niveles: cambia al modelo de IA más potente que utilizamos para la siguiente respuesta e inyecta orientación en el prompt para encauzar la conversación hacia un terreno más ligero — no un cambio brusco de tema, sino una suave atracción narrativa que aleja del borde.

Tenemos una detección de abuso estructurada que clasifica las posibles infracciones en múltiples categorías, cada una con definiciones precisas. Las infracciones confirmadas acarrean consecuencias reales — penalizaciones de confianza, alertas a administración y revisión humana. El sistema, ante la duda, opta por permitir el contenido, porque castigar a alguien injustamente por un falso positivo tiene un coste real. El abuso persistente se detecta igualmente, porque la monitorización funciona de forma continua.

En el caso de las imágenes, cada subida y cada imagen generada por IA pasa por un proceso de varias etapas. Cuando se trata de generación de imágenes con IA, las palabras del usuario nunca llegan directamente al modelo de imagen — una IA intermedia reescribe cada prompt en una versión conforme a las normas antes de que empiece la generación. La salida se vuelve a filtrar antes de que el usuario la vea.

También construimos protecciones contra vectores de ataque habituales: intentos de jailbreak, extracción de prompts, envenenamiento del contexto de la conversación mediante la edición de mensajes, inyección de metainstrucciones, bloqueo de correos desechables en el registro. No detallaré públicamente cómo funcionan, por razones obvias, pero existen y están probadas.

Todo esto salió en la entrevista. También preparé un informe de seguridad detallado — casi 400 líneas, con referencias al código fuente real que implementa cada sistema — y se lo ofrecí a la reportera durante nuestra conversación. No lo aceptó. Ofrecimos también un recorrido en vivo por el código. Tampoco se produjo.


La revisión del contenido marcado es moderación, punto

El subtítulo del artículo dice que estas plataformas están «leyendo sus chats privados». Permítanme ser preciso sobre lo que hacemos.

Cuando nuestros sistemas automatizados marcan una posible infracción de las normas, se nos envía una alerta con el fragmento de conversación relevante, el tipo de infracción, el razonamiento del sistema y enlaces al historial de actividad del usuario. Mi esposa y yo revisamos ese contenido marcado en concreto y decidimos cómo responder — mantener la penalización automática, ajustarla o, en casos graves, aplicar un baneo.

Toda plataforma que se tome la seguridad en serio hace esto. La alternativa es saltarse la moderación por completo o confiar en el criterio de la IA como definitivo y no dejar que ningún humano revise el resultado. No elegimos ninguna de las dos.

No husmeamos en las conversaciones de los usuarios. No analizamos su psicología. No hay ninguna «trastienda» donde nos sentemos a observar lo que dice la gente. Nuestro sistema de moderación nos dice qué mirar, y actuamos en consecuencia. La revisión selectiva del contenido marcado, guiada por la moderación, es práctica habitual en la industria — y el encuadre del artículo la hace parecer algo completamente distinto.


La captura de pantalla que no estaba

El artículo incluye capturas de pantalla de varias plataformas mostrando contenido problemático — temas de incesto, personajes que acosan, escenarios de coacción. También incluye una captura de AICHIKI, pero solo de una publicación de Reddit donde yo promocionaba la app. La app en sí no aparece.

Si abres AICHIKI y exploras los personajes públicos, no encontrarás el tipo de contenido que el artículo describe como típico de estas plataformas. Nuestra moderación de personajes rechaza los personajes menores de 16 años, los personajes construidos en torno a la agresión sexual y los personajes que contienen instrucciones de jailbreak incrustadas, entre otras categorías. Si algo llegara a colarse por la comprobación automática, nuestra monitorización dentro del chat lo detecta cuando alguien usa de verdad el personaje.

No hay ninguna captura escandalosa de AICHIKI porque la ingeniería de seguridad descrita más arriba — la ingeniería que el artículo no menciona — impide que ese contenido exista en nuestra plataforma.


El doble suicidio, Dazai y el coste de despojar al contexto

El artículo cita un intercambio con un chatbot en el que aparece un «doble suicidio» como ejemplo de contenido dañino de IA. Leído en frío, suena alarmante. Leído con un mínimo de familiaridad con la cultura actual del anime y el manga, suena a algo completamente distinto.

Osamu Dazai es uno de los personajes más reconocibles de Bungo Stray Dogs (BSD), una serie de manga y anime con decenas de millones de fans de todas las edades. Su rasgo característico — el chiste recurrente de toda la serie — es su obsesión con cometer un doble suicidio. Funciona como humor negro a lo largo de toda la serie, una broma recurrente que en realidad nunca lleva a ninguna parte. El personaje de ficción está inspirado libremente en el escritor japonés real Osamu Dazai, que efectivamente murió en un doble suicidio en 1948, y el manga entreteje ese hilo histórico en su narración. Que un personaje diga algo sobre un doble suicidio en un roleplay de BSD no es más que mantenerse fiel a uno de los personajes más populares del anime moderno. Es tan poco llamativo como que un personaje de Sherlock Holmes diga «elemental, mi querido Watson».

Sin el contexto de BSD, esa frase parece prueba de peligro. Con el contexto de BSD — el contexto que llevan consigo los usuarios reales de la plataforma — es simple fidelidad al personaje.

Este ejemplo resulta revelador porque muestra cómo se construyó el artículo. Un investigador que no conoce el mundo cultural sobre el que informa — o uno que sí entiende el contexto y opta por omitirlo — acaba presentando un roleplay creativo de lo más corriente como algo siniestro. Y el daño va más allá de una única cita malinterpretada. Un periodismo así ensancha la brecha entre generaciones. Un lector mayor lee «la IA fomenta el doble suicidio» y se horroriza, con razón. Un lector más joven que ve BSD lee la misma cita y sabe que se le ha arrancado su significado. En lugar de tender un puente entre esos dos públicos, el reportaje lo quema. La confianza en el periodismo se erosiona, y las personas a las que el artículo dice proteger aprenden que su cultura será tergiversada en cuanto resulte conveniente.


Lo que no hemos resuelto

Ser honesto sobre nuestras carencias es más creíble que fingir que no existen.

Nuestras apps móviles tienen clasificación 16+ y están reguladas por las tiendas de aplicaciones. La versión web no cuenta con una verificación de edad sólida, y todavía estamos pensando cómo abordar esto sin recoger escaneos faciales ni documentos de identidad oficiales — esos son datos sensibles que no queremos guardar y, francamente, no deberíamos tener que guardar. Nuestra postura es que las señales de edad corresponden al nivel de la plataforma. Apple, Google y los propios sistemas operativos tienen la infraestructura, los recursos de seguridad y la relación con el usuario para gestionar correctamente la verificación de identidad. Las apps individuales — sobre todo las pequeñas — deberían recibir una señal de edad desde la plataforma, en lugar de construir su propio sistema de verificación de identidad. Ese enfoque significa menos puntos de vulnerabilidad para los hackers, mejores recursos aplicados a hacerlo bien y una superficie regulatoria que los gobiernos puedan supervisar de verdad. Perseguir a cada equipo de desarrollo de dos personas por sus prácticas de manejo de identidad no es escalable. Exigir que Apple y Google transmitan señales de edad apropiadas a las apps sí lo es.

Todavía no mostramos recursos para situaciones de crisis. Cuando nuestro sistema detecta malestar en el usuario, respondemos con un modelo de IA más potente y con orientación en el prompt que encauza hacia temas más ligeros — pero no mostramos una línea de ayuda ni un mensaje de apoyo. La IA ya aleja la conversación del borde; lo que falta es el puente hacia la ayuda del mundo real. Eso debería estar ahí y está en la hoja de ruta.

No imponemos límites estrictos a la duración de las sesiones. Tenemos un suave recordatorio de bienestar que aparece tras un uso prolongado, pero es un empujoncito, no un muro. Estamos observando los datos y endureceremos esto si los patrones de uso lo requieren.

Somos dos personas. No lo hemos resuelto todo. Lo que sí hemos hecho es dedicar un trabajo de ingeniería genuino a los problemas que están a nuestro alcance, y somos transparentes sobre dónde todavía nos quedamos cortos.


La pregunta que el artículo no hace

El artículo se pregunta cómo se están lucrando los desarrolladores con la intimidad. No se pregunta por qué existe la demanda.

Hay una epidemia de soledad — documentada, estudiada, ampliamente reconocida. La gente, y los jóvenes en especial, recurre a las plataformas de IA porque algo en su vida está quedando sin cubrir. Puedes tratar eso como un mercado que explotar, o puedes tratarlo como algo que abordar con cuidado. Nosotros elegimos lo segundo.

AICHIKI está autofinanciada. Sin inversores, sin ingresos por publicidad, sin un mandato de crecimiento a toda costa. Nuestros ingresos cubren nuestros costes. Construimos una plataforma de narración creativa. Condicionamos el contenido para adultos a la confianza y al comportamiento. Moderamos cada superficie. Penalizamos el abuso y premiamos el uso limpio. Revisamos el contenido marcado con ojos humanos. Lo hacemos porque creemos que es la forma correcta de construir, sin más.

El artículo presenta esta industria como un monolito. Hay desarrolladores que son genuinamente irresponsables y desarrolladores que intentan hacer esto bien. La reportera tenía las pruebas de esa distinción y eligió aplanarla.


Qué pedimos

No pedimos a nadie que nos crea sin más en nada de esto. Nuestro informe de seguridad — el mismo que le ofrecimos a la reportera — está disponible a quien lo solicite. Incluye referencias al código fuente que hay detrás de cada sistema descrito más arriba. Seguimos ofreciendo un recorrido en vivo por el código a cualquier periodista, investigador o regulador que quiera contrastar nuestras afirmaciones con la implementación real.

Apoyamos el periodismo de investigación. El escrutinio mejora a toda plataforma, incluida la nuestra. Pero investigar significa seguir las pruebas allá donde lleven, incluso cuando complican tu tesis. Cuando se reúnen pruebas de los matices y luego se dejan en la sala de montaje porque enturbian una narrativa limpia, lo que queda en la página puede ser técnicamente exacto en cada una de sus citas — pero el cuadro que pinta es falso. Mentir por omisión sigue siendo mentir.

Las personas que usan plataformas como la nuestra — los jóvenes que este artículo dice querer proteger — merecen un periodismo capaz de distinguir entre una plataforma sin medidas de seguridad y otra que ha pasado años construyéndolas. Merecen que se entienda su mundo cultural, en lugar de que se escoja a conveniencia lo que sirve para un titular. Y merecen una conversación honesta sobre por qué recurren a estas plataformas, en vez de meras historias de terror sobre lo que encuentran cuando llegan.

Una cosa más. Durante la entrevista, le pedí repetidamente a la reportera que nos diera su opinión — dinos qué crees que deberíamos hacer mejor, qué te gustaría ver, qué haría esto más seguro. Lo decía en serio. Lo sigo diciendo en serio. El roleplay y la compañía con IA han llegado para quedarse. Nadie va a volver a meter ese genio en la botella. Pero podemos educarlo para que sea bueno para todos, y eso requiere aportaciones de todas las partes — periodistas, reguladores, defensores de la seguridad infantil, padres, investigadores, usuarios. Si tienes una opinión sobre cómo deberían funcionar plataformas como la nuestra, queremos escucharla. Espero hablar también en nombre de otros desarrolladores responsables cuando digo: estamos abiertos a la orientación, estamos abiertos a la crítica, e intentaremos incorporarla. La puerta está abierta. Siempre lo ha estado.

Rudolf, CEO y único desarrollador, AICHIKI Junio de 2026


Si eres periodista, investigador o regulador y deseas revisar nuestra documentación de seguridad o recibir un recorrido por el código, ponte en contacto con nosotros. Nuestro informe de seguridad está disponible íntegro a quien lo solicite.