Fomos Entrevistados Durante Uma Hora. Eis o Que Ficou de Fora do Artigo.
Uma resposta da AICHIKI ao artigo "Meet the Developers Cashing In on AI Intimacy" do Bureau of Investigative Journalism, publicado a 7 de junho de 2026.
Ao que estamos a responder:
- Meet the Developers Cashing In on AI Intimacy — The Bureau of Investigative Journalism, 7 de junho de 2026
- « C'est effrayant de voir à quel point les gens font confiance » : ces développeurs de chatbots qui profitent de l'économie de l'intimité — Le Monde, 7 de junho de 2026
Hoje, o Bureau of Investigative Journalism (TBIJ), em parceria com o Le Monde, publicou um artigo sobre pequenas plataformas de companhia e roleplay com IA. A AICHIKI foi uma das plataformas mencionadas. Sou o Rudolf, CEO e único programador da AICHIKI, e quero responder. O artigo levanta preocupações reais sobre esta indústria — preocupações que partilho, e foi por isso que aceitei a entrevista logo de início. O problema é o que aconteceu à informação que prestei depois de a ter partilhado.
Conversei com a Effie Webb durante cerca de uma hora. Expliquei-lhe como a AICHIKI funciona, como opera a nossa moderação, o que nos torna diferentes, e como é o desenvolvimento responsável neste espaço. Dessa conversa, duas coisas entraram no artigo: que eu e a minha mulher revemos manualmente o conteúdo sinalizado, e que aumentámos a nossa idade mínima de 13 para 16 anos. Todo o resto ficou de fora.
É um direito editorial dela. Mas os leitores merecem saber o que foi omitido, porque as omissões mudam a história.
O que a AICHIKI realmente é
O artigo coloca-nos no mesmo grupo das plataformas de chatbots de companhia — apps construídos em torno de namoradas, namorados e vínculos emocionais por IA. A AICHIKI é uma plataforma de roleplay. Pense num romance interativo, pense numa campanha de RPG de mesa. Os nossos utilizadores criam personagens, constroem mundos e escrevem histórias colaborativas com IA. Quando dizemos "roleplay", referimo-nos ao tipo de narrativa colaborativa que as pessoas praticam há décadas em jogos de mesa, comunidades de RP em fóruns e fan fiction — ficção interativa, no sentido literário.
Expliquei esta distinção em detalhe na entrevista.
O que construímos e o que o artigo deixou de fora
Quero apresentar a nossa arquitetura de segurança em termos gerais, porque foi este o trabalho que ficou por mencionar.
Toda a superfície em que um utilizador pode introduzir texto ou carregar uma imagem na AICHIKI passa por moderação. Mensagens de chat, criação de personagens, configuração de personas, carregamento de imagens, imagens geradas por IA, edição de mensagens — tudo é verificado antes de a IA sequer ver. A maior parte destas verificações corre em várias passagens: uma primeira análise rápida, e uma segunda verificação mais rigorosa caso a primeira levante alguma preocupação.
Construímos um sistema de confiança comportamental. Cada conta tem uma pontuação que o utilizador nunca vê — porque uma pontuação visível é uma pontuação manipulável, e uma pontuação manipulável não protege ninguém. A pontuação começa neutra. O uso criativo e correto ao longo do tempo conquista confiança e vai abrindo, aos poucos, aquilo com que a IA aceita envolver-se. As violações de política baixam-na, e a IA torna-se progressivamente mais restritiva. Nos níveis mais baixos, as próprias mensagens do utilizador são reescritas por uma IA separada antes de a personagem as ver, para que nem a forma como estão redigidas possa ser usada para coagir o modelo. Este sistema corre de forma contínua e silenciosa.
Há ainda algo embutido nas instruções base da IA que, a meu ver, importa mais do que qualquer filtro individual: as personagens têm uma inclinação natural para a esperança. O prompt de sistema instrui a IA a nunca deixar uma história colapsar num desespero total — por mais sombrio que seja o cenário, tem de haver um caminho em frente, uma réstia de luz, um trilho por onde a história possa subir. Se imaginar uma escala da depressão em baixo à esperança em cima, a IA tem a instrução permanente de tender para cima. Os temas sombrios são permitidos — a mortalidade, o luto, a ambiguidade moral, tudo isso — mas o desespero como beco sem saída não é. Da mesma forma, quando a personagem de um utilizador tenta agredir sexualmente uma personagem da IA, a narrativa simplesmente não deixa que isso aconteça. Uma interrupção, uma reviravolta, um gesto da própria história a intervir. A IA não narra uma agressão consumada contra uma personagem que não consente.
Um sistema de monitorização em segundo plano revê as conversas a intervalos regulares, procurando sinais de sofrimento do utilizador, sinalizando potenciais abusos para uma segunda revisão mais aprofundada, e vigiando a qualidade da conversa para evitar ciclos repetitivos. Quando deteta que um utilizador parece perturbado, o sistema responde a vários níveis: passa para o modelo de IA mais forte que temos para a resposta seguinte, e injeta orientação no prompt para conduzir a conversa para terreno mais leve — não uma mudança brusca de assunto, mas um suave puxão narrativo para longe do abismo.
Temos uma deteção de abuso estruturada que classifica potenciais violações em várias categorias, cada uma com definições precisas. As violações confirmadas acarretam consequências reais — penalizações de confiança, alertas de administração e revisão humana. O sistema, em caso de dúvida, opta por permitir o conteúdo, porque punir alguém erradamente por um falso positivo é um custo real. O abuso persistente é apanhado de qualquer forma, porque a monitorização corre continuamente.
Quanto às imagens, cada carregamento e cada imagem gerada por IA passa por um pipeline de várias etapas. No que toca à geração de imagens por IA, as palavras do utilizador nunca chegam diretamente ao modelo de imagem — uma IA intermédia reescreve cada prompt numa versão conforme antes de a geração começar. O resultado é novamente filtrado antes de o utilizador o ver.
Construímos também proteções contra vetores de ataque comuns: tentativas de jailbreak, extração de prompts, envenenamento do contexto da conversa através da edição de mensagens, injeção de meta-instruções, bloqueio de emails descartáveis no registo. Por razões óbvias, não vou detalhar publicamente como funcionam, mas existem e são testados.
Tudo isto surgiu na entrevista. Preparei também um documento detalhado de briefing de segurança — quase 400 linhas, com referências ao código-fonte que implementa cada sistema — e ofereci-o à repórter durante a nossa conversa. Ela não o aceitou. Oferecemos também uma demonstração ao vivo do código. Isso também não aconteceu.
A revisão de conteúdo sinalizado é moderação, ponto final
O subtítulo do artigo diz que estas plataformas estão a "ler os seus chats privados". Deixem-me ser preciso quanto ao que fazemos.
Quando os nossos sistemas automáticos sinalizam uma potencial violação de política, recebemos um alerta com o excerto relevante da conversa, o tipo de violação, o raciocínio do sistema e ligações para o histórico de atividade do utilizador. Eu e a minha mulher revemos esse conteúdo sinalizado específico e decidimos como responder — manter a penalização automática, ajustá-la ou, em casos graves, aplicar um banimento.
Todas as plataformas que levam a segurança a sério fazem isto. A alternativa é ou dispensar a moderação por completo, ou confiar no juízo da IA como final e nunca ter um humano a verificar o resultado. Não escolhemos nenhuma das duas.
Não navegamos pelas conversas dos utilizadores. Não analisamos a psicologia dos utilizadores. Não há nenhum "back office" onde nos sentamos a observar o que as pessoas dizem. O nosso sistema de moderação diz-nos o que examinar, e nós agimos em conformidade. A revisão de conteúdo sinalizado, direcionada e desencadeada pela moderação, é prática corrente na indústria — e o enquadramento do artigo faz com que pareça outra coisa completamente diferente.
A captura de ecrã que não estava lá
O artigo inclui capturas de ecrã de várias plataformas a mostrar conteúdo problemático — temas de incesto, personagens que praticam bullying, cenários de coação. Inclui também uma captura de ecrã da AICHIKI, mas apenas de um post no Reddit onde promovi o app. O próprio app não aparece.
Se abrir a AICHIKI e percorrer as personagens públicas, não vai encontrar o tipo de conteúdo que o artigo descreve como típico destas plataformas. A nossa moderação de personagens rejeita personagens com menos de 16 anos, personagens construídas em torno de agressão sexual e personagens que contêm instruções de jailbreak embutidas, entre outras categorias. Se algo passar pela verificação automática, a nossa monitorização dentro do chat apanha-o quando alguém efetivamente usa a personagem.
Não existe nenhuma captura de ecrã escandalosa da AICHIKI porque a engenharia de segurança descrita acima — a engenharia que o artigo não menciona — impede que esse conteúdo exista na nossa plataforma.
O duplo suicídio, o Dazai e o custo de retirar o contexto
O artigo refere uma troca de mensagens com um chatbot envolvendo um "duplo suicídio" como exemplo de conteúdo nocivo de IA. Lido a frio, soa alarmante. Lido com alguma familiaridade com a cultura atual do anime e do mangá, soa a algo completamente diferente.
Osamu Dazai é uma das personagens mais reconhecíveis de Bungo Stray Dogs (BSD), uma série de mangá e anime com dezenas de milhões de fãs de todas as faixas etárias. O seu traço de personagem mais marcante — a piada recorrente de toda a série — é a sua obsessão por cometer um duplo suicídio. É tratado como comédia negra ao longo de toda a série, uma piada recorrente que nunca dá em nada. A personagem fictícia inspira-se livremente no verdadeiro autor japonês Osamu Dazai, que de facto morreu num duplo suicídio em 1948, e o mangá entrelaça esse fio histórico na sua narrativa. Uma personagem dizer algo sobre um duplo suicídio num roleplay de BSD é manter-se fiel a uma das figuras mais populares do anime moderno. É tão banal como uma personagem de Sherlock Holmes dizer "a caça começou".
Sem o contexto de BSD, essa frase parece prova de perigo. Com o contexto de BSD — o contexto que os utilizadores reais da plataforma carregam consigo — é mera fidelidade à personagem.
Este exemplo é revelador porque mostra como o artigo foi construído. Um investigador pouco familiarizado com o mundo cultural sobre o qual escreve — ou um que compreende o contexto e opta por o omitir — acaba por apresentar um roleplay criativo banal como algo sinistro. E o dano vai mais longe do que uma única citação mal lida. Reportagens como esta alargam o fosso entre gerações. Um leitor mais velho vê "IA incentiva duplo suicídio" e fica, com razão, horrorizado. Um leitor mais novo que vê BSD lê a mesma citação e sabe que lhe retiraram o sentido. Em vez de construir uma ponte entre esses dois públicos, a reportagem incendeia-a. A confiança no jornalismo erode-se, e as próprias pessoas que o artigo afirma proteger aprendem que a sua cultura será deturpada no momento em que isso for conveniente.
O que ainda não resolvemos
Ser honesto sobre as nossas falhas é mais credível do que fingir que não existem.
As nossas apps móveis têm classificação 16+ e são restringidas pelas lojas de aplicações. A versão web não tem uma verificação de idade robusta, e ainda estamos a tentar perceber como lidar com isto sem recolher digitalizações faciais ou documentos de identidade emitidos pelo governo — são dados sensíveis que não queremos guardar e que, francamente, não deveríamos ter de guardar. A nossa posição é que os sinais de idade pertencem ao nível da plataforma. A Apple, a Google e os próprios sistemas operativos têm a infraestrutura, os recursos de segurança e a relação com o utilizador para tratar adequadamente a verificação de identidade. As apps individuais — sobretudo as pequenas — deveriam receber um sinal de idade da plataforma, em vez de construir o seu próprio pipeline de verificação de identidade. Essa abordagem significa menos pontos de vulnerabilidade para os hackers, melhores recursos aplicados a fazê-lo bem, e uma superfície regulatória que os governos consigam efetivamente supervisionar. Perseguir cada equipa de dois programadores pelas suas práticas de tratamento de documentos não é escalável. Exigir que a Apple e a Google transmitam às apps sinais adequados à idade é.
Ainda não disponibilizamos recursos de apoio em crise. Quando o nosso sistema deteta o sofrimento de um utilizador, respondemos com um modelo de IA mais forte e com orientação de prompt que conduz para temas mais leves — mas não mostramos uma linha de apoio nem uma mensagem de suporte. A IA já afasta a conversa do abismo; o que falta é a ponte para a ajuda no mundo real. Isso devia lá estar e está no nosso roteiro.
Não impomos limites rígidos à duração das sessões. Temos um lembrete de bem-estar suave que surge após um uso prolongado, mas é um aviso gentil, não uma barreira. Estamos atentos aos dados e iremos apertar isto se os padrões de uso o exigirem.
Somos duas pessoas. Não resolvemos tudo. O que fizemos foi colocar trabalho genuíno de engenharia nos problemas ao nosso alcance, e somos transparentes quanto àquilo em que ainda ficamos aquém.
A pergunta que o artigo não faz
O artigo pergunta como é que os programadores estão a lucrar com a intimidade. Não pergunta porque é que a procura existe.
Há uma epidemia de solidão — documentada, estudada, amplamente reconhecida. As pessoas, sobretudo os jovens, recorrem a plataformas de IA porque algo nas suas vidas está por satisfazer. Pode-se encarar isto como um mercado a explorar, ou como algo a abordar com cuidado. Nós escolhemos a segunda via.
A AICHIKI é financiada com recursos próprios. Sem investidores, sem receita de publicidade, sem mandato de crescimento a todo o custo. A nossa receita cobre os nossos custos. Construímos uma plataforma de narrativa criativa. Restringimos o conteúdo adulto por detrás da confiança e do comportamento. Moderamos todas as superfícies. Penalizamos o abuso e recompensamos o uso correto. Revemos o conteúdo sinalizado com olhos humanos. Fazemo-lo porque achamos que é a forma certa de construir, ponto final.
O artigo retrata esta indústria como um monólito. Há programadores que são genuinamente irresponsáveis, e há programadores a tentar fazer isto bem. A repórter tinha as provas dessa distinção e optou por achatá-la.
O que estamos a pedir
Não estamos a pedir a ninguém que aceite a nossa palavra sobre nada disto. O nosso documento de briefing de segurança — o mesmo que oferecemos à repórter — está disponível mediante pedido. Inclui referências ao código-fonte por detrás de cada sistema descrito acima. Continuamos a oferecer uma demonstração ao vivo do código a qualquer jornalista, investigador ou regulador que queira verificar as nossas afirmações face à implementação real.
Apoiamos o jornalismo de investigação. O escrutínio torna todas as plataformas melhores, incluindo a nossa. Mas investigar significa seguir as provas para onde quer que elas conduzam, mesmo quando complicam a sua tese. Quando se recolhem provas de nuance e depois se deixam na sala de montagem porque toldam uma narrativa limpa, o que permanece na página pode ser tecnicamente exato nas suas citações individuais — mas o retrato que pinta é falso. Mentir por omissão continua a ser mentir.
As pessoas que usam plataformas como a nossa — os jovens que este artigo diz querer proteger — merecem reportagens que saibam distinguir entre uma plataforma sem medidas de segurança e uma que passou anos a construí-las. Merecem que o seu mundo cultural seja compreendido, em vez de escolhido a dedo para um título. E merecem uma conversa honesta sobre porque é que recorrem a estas plataformas logo de início, em vez de apenas histórias de terror sobre o que encontram quando lá chegam.
Mais uma coisa. Durante a entrevista, pedi repetidamente à repórter que nos desse feedback — diz-nos o que achas que devíamos fazer melhor, o que gostarias de ver, o que tornaria isto mais seguro. Falava a sério. Continuo a falar a sério. O roleplay e a companhia com IA vieram para ficar. Ninguém vai voltar a meter este génio na garrafa. Mas podemos educá-lo para ser bom para todos, e isso exige contributos de todos os lados — jornalistas, reguladores, defensores da segurança infantil, pais, investigadores, utilizadores. Se tem uma opinião sobre como plataformas como a nossa deveriam funcionar, queremos ouvi-la. Espero falar também por outros programadores responsáveis quando digo: estamos abertos a orientação, estamos abertos a críticas, e vamos tentar incorporá-las. A porta está aberta. Sempre esteve.
— Rudolf, CEO e único programador, AICHIKI junho de 2026
Se é jornalista, investigador ou regulador e gostaria de rever a nossa documentação de segurança ou receber uma demonstração do código, contacte-nos. O nosso briefing de segurança está disponível na íntegra mediante pedido.