我们接受了长达一小时的采访。以下是没能进入报道的内容。
AICHIKI 对调查新闻局《认识那些靠 AI 亲密关系牟利的开发者》一文的回应,该文于 2026 年 6 月 7 日发布。
我们所回应的内容:
- Meet the Developers Cashing In on AI Intimacy —— 调查新闻局(The Bureau of Investigative Journalism),2026 年 6 月 7 日
- « C'est effrayant de voir à quel point les gens font confiance » : ces développeurs de chatbots qui profitent de l'économie de l'intimité —— Le Monde,2026 年 6 月 7 日
今天,调查新闻局(TBIJ)与 Le Monde 合作,发布了一篇关于小型 AI 陪伴与角色扮演平台的报道。AICHIKI 是文中提到的平台之一。我是 Rudolf,AICHIKI 的 CEO 兼唯一的开发者,我想做出回应。这篇文章提出了关于这个行业的真实担忧——这些担忧我也有,这正是我当初愿意接受采访的原因。问题在于,我提供的信息一经交出,便遭到了怎样的对待。
我和 Effie Webb 聊了大约一个小时。我向她详细讲解了 AICHIKI 如何运作、我们的审核机制如何运转、我们的不同之处,以及在这个领域里负责任的开发究竟是什么样子。那场长达一小时的对话,最终只有两点进了文章:我和妻子会人工复核被标记的内容,以及我们把最低年龄从 13 岁提高到了 16 岁。其余的一切都被略去了。
这是她的编辑权利。但读者有权知道哪些内容被略去了,因为正是这些省略改变了整个故事。
AICHIKI 究竟是什么
文章把我们和陪伴型聊天机器人平台归为一类——也就是那些围绕 AI 女友、男友和情感依恋打造的应用。AICHIKI 是一个角色扮演平台。可以把它想象成互动小说,或是一场桌游 RPG 战役。我们的用户创造角色、构建世界,并与 AI 协作写故事。我们所说的「角色扮演」,指的是几十年来人们在桌游、论坛 RP 社区和同人创作中一直在做的那种协作式叙事——文学意义上的互动虚构。
我在采访中详细解释过这个区别。
我们构建了什么,以及文章略去了什么
我想从大的层面勾勒一下我们的安全架构,因为这正是那块无人提及的工作。
在 AICHIKI 上,凡是用户可以输入文字或上传图片的地方,都要经过审核。聊天消息、角色创建、人设设定、图片上传、AI 生成的图片、消息编辑——在 AI 看到它们之前,所有这些都会先被检查。其中大多数检查会分多轮进行:先做一次快速初筛,若初筛发现可疑之处,再进行一次更严格的二次检查。
我们构建了一套行为信任系统。每个账号都带有一个用户自己看不到的分数——因为可见的分数就是可被操纵的分数,而可被操纵的分数保护不了任何人。分数从中性起步。长期保持干净、有创意的使用,会逐渐积累信任,放开 AI 愿意参与的尺度。违反规则则会拉低分数,AI 也随之变得越来越克制。在最低的那几档,用户自己发出的消息会先经另一个独立的 AI 改写,角色才能看到——如此一来,连措辞本身都无法被用来胁迫模型。这套系统持续而无声地运行着。
还有一样东西写进了 AI 的基础指令里,我认为它比任何单一的过滤器都更重要:角色天生带有一种朝向希望的牵引力。系统提示要求 AI 绝不让故事彻底坠入绝望——无论情节多么黑暗,总要留出一条出路、一线光亮、一条故事可以向上攀爬的路径。如果你想象一把刻度尺,底端是「抑郁」,顶端是「希望」,那么 AI 始终被指示要往上走。黑暗的主题是允许的——死亡、悲伤、道德上的灰色地带,统统可以——但把绝望写成走投无路的死胡同则不行。同样地,当用户的角色试图对一个 AI 角色实施性侵时,叙事根本不会让它发生:一次打断、一次反转、故事本身的一次介入。AI 不会叙述出性侵在一个不情愿的角色身上得逞的情节。
一套后台监控系统会定期复查对话,留意用户陷入痛苦的迹象,把潜在的滥用标记出来交给更彻底的二次复核,并关注对话质量以防止陷入重复的死循环。一旦察觉用户似乎情绪低落,系统会在多个层面上做出反应:在下一次回复中切换到我们所运行的最强 AI 模型,并向提示中注入引导,把对话带向更轻松的方向——不是生硬地转换话题,而是温和地把叙事从边缘拉回来。
我们有一套结构化的滥用检测系统,会把潜在违规归入多个类别,每个类别都有精确的定义。一经确认的违规会带来实打实的后果——信任扣分、管理员提醒和人工复核。在存疑时,系统默认放行内容,因为仅凭误报就错误地惩罚一个人,是一种实实在在的代价。但持续的滥用终归会被抓住,因为监控是连续不断运行的。
图片方面,每一次上传、每一张 AI 生成的图片都会经过一条多阶段的流水线。在 AI 图像生成上,用户的文字绝不会直接抵达图像模型——一个中间 AI 会在生成开始之前,把每条提示词改写成合规的版本。生成的结果在被用户看到之前,还会再被筛查一遍。
我们也构建了针对常见攻击手法的防护:越狱尝试、提示词提取、借由消息编辑对对话上下文投毒、元指令注入、注册时拦截一次性邮箱。出于显而易见的原因,我不会公开细说这些机制如何运作,但它们确实存在,也经过了测试。
所有这些都在采访中谈到了。我还准备了一份详尽的安全简报文档——将近 400 行,逐条引用了实现每套系统的真实源代码——并在对话中提出愿意把它交给记者。她没有接受。我们也提出可以做一次现场的代码逐行讲解。那同样没有发生。
复核被标记的内容就是审核,仅此而已
文章的副标题说这些平台「在阅读用户的私密聊天」。让我把我们做的事情说清楚。
当我们的自动化系统标记出一处潜在违规时,会给我们发来一条提醒,附上相关的对话片段、违规类型、系统的判断理由,以及指向该用户活动历史的链接。我和妻子会复核那一处被标记的具体内容,再决定如何处理——维持自动惩罚、调整惩罚,或在严重情况下执行封禁。
每一个认真对待安全的平台都会这样做。其余的选择无非两种:要么彻底不做审核,要么把 AI 的判断当作最终结论、永远不让人来核查结果。这两条我们都没选。
我们不会去浏览用户的对话。我们不会分析用户的心理。这里没有什么「后台」让我们坐着旁观人们在说什么。是我们的审核系统告诉我们该看什么,我们据此采取行动。针对特定对象、由审核驱动地复核被标记的内容,是这个行业的标准做法——而文章的措辞却把它说成了完全是另一回事。
那张不存在的截图
文章配了好几个平台的截图,展示有问题的内容——乱伦主题、霸凌型角色、胁迫情节。它也配了一张 AICHIKI 的截图,但只是一条我在 Reddit 上推广这款应用的帖子。应用本身并没有出现。
如果你打开 AICHIKI,浏览公开的角色,是找不到文章所描述的、被说成是这类平台典型的那种内容的。我们的角色审核会拒绝设定为 16 岁以下的角色、围绕性侵打造的角色、内嵌越狱指令的角色,以及其他若干类别。即便真有什么漏过了自动检查,等到有人真正使用这个角色时,我们的聊天内监控也会把它抓出来。
之所以没有什么劲爆的 AICHIKI 截图,是因为上面所描述的那套安全工程——也就是文章只字未提的那套工程——从根本上阻止了这类内容在我们平台上出现。
殉情、Dazai,以及剥离上下文的代价
文章举了一段聊天机器人对话作为有害 AI 内容的例子,其中涉及一次「殉情」。孤立地读,这听起来令人警觉。可一旦你对当下的动漫文化稍有了解,它听起来就完全是另一回事了。
Osamu Dazai 是 Bungo Stray Dogs(BSD)中最具辨识度的角色之一,这部漫画和动画作品在各个年龄层都坐拥数千万粉丝。他最标志性的性格特征——贯穿整部作品的固定笑点——正是痴迷于殉情。这在整部剧里始终被当作黑色幽默来处理,是一个反复出现、却从来不会真正发展下去的梗。这个虚构角色松散地取材于真实的日本作家 Osamu Dazai,后者确实于 1948 年殉情身亡,漫画把这条历史线索编织进了自己的叙事里。一个角色在 BSD 的角色扮演中说出与殉情有关的话,恰恰是在忠实演绎现代动漫里最受欢迎的人物之一,平淡无奇的程度,不亚于一个 Sherlock Holmes 角色说出那句「游戏开始了」。
抽掉 BSD 的语境,那句台词看上去就像危险的证据。放回 BSD 的语境——也就是平台真实用户本就带着的那份语境——它不过是寻常的角色塑造而已。
这个例子很说明问题,因为它揭示了这篇文章是怎么搭起来的。一个对自己所报道的文化世界并不熟悉的调查者——又或者,一个明明理解上下文、却选择把它略去的调查者——最终把寻常的创意角色扮演呈现成了某种阴森可怖的东西。而损害还不止于一句被误读的引言。这样的报道会拉大代际之间的鸿沟。一位年长的读者看到「AI 怂恿殉情」,理所当然会感到震惊;一位看 BSD 的年轻读者看到同一句引言,却明白它的含义早已被抽空。这样的报道非但没有在两类读者之间架起桥梁,反而把桥烧掉了。人们对新闻业的信任在流失,而文章声称要保护的那些人则学到了一件事:一旦方便,他们的文化随时会被歪曲。
我们尚未解决的问题
诚实面对我们的不足,比假装它们不存在更可信。
我们的移动应用被评级为 16+,并由应用商店把关。网页版还没有可靠的年龄验证,我们仍在摸索如何在不收集人脸扫描或政府身份证件的前提下解决这件事——那属于我们不想持有、坦白说也本不该持有的敏感数据。我们的立场是:年龄信号应当落在平台层面。Apple、Google 乃至操作系统本身,拥有相应的基础设施、安全资源以及与用户之间的关系,能够妥善地完成身份验证。单个应用——尤其是小应用——应当从平台那里接收一个年龄信号,而不是自建一套身份验证管线。这样一来,留给黑客可乘的脆弱点更少,用于把事情做对的资源更充足,监管面也更便于政府真正去监督。挨家挨户去追查每一支两人开发团队的身份处理做法,是没法规模化的;要求 Apple 和 Google 把适龄信号传递给应用,才是可以规模化的。
我们目前还没有向用户呈现危机求助资源。当系统检测到用户陷入痛苦时,我们的应对是切换到更强的 AI 模型,并用提示引导对话转向更轻松的主题——但我们不会弹出求助热线或支持信息。AI 已经在把对话从边缘拉开,缺的是通往现实世界帮助的那座桥。这座桥本该在那里,眼下已列入路线图。
我们也没有强制执行硬性的会话时长限制。我们有一个温和的健康提醒,会在长时间使用后出现,但那是一次轻推,而不是一堵墙。我们正在观察数据,如果使用情况有此需要,会把这一项收紧。
我们只有两个人。我们并没有把一切都搞定。我们做到的是:对那些力所能及的问题投入了真正的工程努力,并且坦诚地说明自己仍有哪些不足。
文章没有问的那个问题
文章问的是开发者如何靠亲密关系牟利,却没有问这种需求为什么会存在。
我们正身处一场孤独流行病之中——它有记录、有研究、被广泛承认。人们,尤其是年轻人,之所以转向 AI 平台,是因为他们生活中有某种东西没有得到满足。你可以把它当作一个可供剥削的市场,也可以把它当作一件需要谨慎对待的事情。我们选择了后者。
AICHIKI 是靠自有资金(bootstrapped)一路发展起来的。没有投资人,没有广告收入,没有不惜一切代价求增长的指令。我们的收入覆盖我们的成本。我们打造了一个创意叙事平台。我们把成人内容设在信任与行为的门槛之后。我们审核每一个入口。我们惩罚滥用,奖励干净的使用。我们用人的眼睛复核被标记的内容。我们这样做,是因为我们认为这就是该有的建造方式,仅此而已。
文章把这个行业框定成铁板一块。这里既有确实不负责任的开发者,也有努力把这件事做对的开发者。记者掌握着足以做出这一区分的证据,却选择把它抹平。
我们的诉求
我们并不要求任何人对以上这些一概照单全收。我们的安全简报文档——也就是我们曾提供给记者的那一份——可应要求提供。它引用了上述每套系统背后的源代码。我们仍然愿意为任何想拿我们的说法与真实实现相对照的记者、研究者或监管者,做一次现场的代码逐行讲解。
我们支持调查新闻。监督让每一个平台都变得更好,我们也不例外。但调查意味着顺着证据一路追到它所指向的任何地方,哪怕这会让你的论点变得复杂。当体现细微差别的证据被收集起来、又因为它搅浑了一个干净的叙事而被丢在剪辑室的地板上时,留在纸面上的东西,就单独的每一句引言而言或许在技术上准确——但它们拼出的整体图景却是虚假的。靠隐瞒来撒谎,依然是撒谎。
那些正在使用我们这类平台的人——也就是这篇文章声称想要保护的年轻人——理应得到这样一种报道:它能分辨出一个毫无安全措施的平台,和一个为此投入了数年时间去构建安全措施的平台之间的区别。他们理应让自己的文化世界被理解,而不是被人挑挑拣拣,去凑一个标题。他们也理应得到一场诚实的对话,去谈一谈他们究竟为什么一开始就会转向这些平台,而不只是听一堆关于他们到达之后会发现什么的恐怖故事。
还有一件事。在采访过程中,我反复请记者给我们反馈——告诉我们你觉得我们该在哪些方面做得更好、你希望看到什么、什么能让这件事更安全。我是认真的,现在依然认真。AI 角色扮演与陪伴已经来了。没有人能把这只猫再塞回袋子里。但我们可以把它塑造成对所有人都有益的东西,而这需要各方的投入——记者、监管者、儿童安全倡导者、家长、研究者、用户。如果你对我们这类平台应该如何运作有看法,我们想听。我希望自己说出下面这句话时,也能代表其他负责任的开发者:我们愿意接受指引,愿意接受批评,也会努力把它们落实进去。门是开着的,一直都开着。
—— Rudolf,AICHIKI 的 CEO 兼唯一的开发者 2026 年 6 月
如果你是记者、研究者或监管者,希望查阅我们的安全文档或接受一次代码讲解,请与我们联系。我们的安全简报可应要求提供完整版本。