Нас интервьюировали целый час. Вот что не попало в статью.
Ответ AICHIKI на материал Bureau of Investigative Journalism «Meet the Developers Cashing In on AI Intimacy», опубликованный 7 июня 2026 года.
На что мы отвечаем:
- Meet the Developers Cashing In on AI Intimacy — The Bureau of Investigative Journalism, 7 июня 2026
- « C'est effrayant de voir à quel point les gens font confiance » : ces développeurs de chatbots qui profitent de l'économie de l'intimité — Le Monde, 7 июня 2026
Сегодня Bureau of Investigative Journalism (TBIJ) совместно с Le Monde опубликовали материал о небольших платформах для AI-компаньонов и роллплея. AICHIKI оказалась одной из упомянутых платформ. Меня зовут Rudolf, я генеральный директор и единственный разработчик AICHIKI, и я хочу ответить. Статья поднимает реальные проблемы этой индустрии — проблемы, которые я разделяю, и именно поэтому я изначально согласился на интервью. Беда в том, что стало с предоставленной мной информацией после того, как я ею поделился.
Я говорил с Effie Webb около часа. Я подробно объяснил, как устроена AICHIKI, как работает наша модерация, что отличает нас от других и как выглядит ответственная разработка в этой сфере. Из всего этого разговора в статью попали две вещи: что мы с женой вручную проверяем помеченный контент и что мы подняли минимальный возраст с 13 до 16 лет. Всё остальное осталось за кадром.
Это её редакторское право. Но читатели заслуживают знать, что было упущено, потому что эти упущения меняют всю историю.
Что такое AICHIKI на самом деле
Статья ставит нас в один ряд с платформами чат-ботов-компаньонов — приложениями, построенными вокруг AI-девушек, AI-парней и эмоциональной привязанности. AICHIKI — это платформа для роллплея. Представьте себе интерактивный роман, представьте кампанию настольной RPG. Наши пользователи создают персонажей, выстраивают миры и пишут совместные истории вместе с AI. Когда мы говорим «роллплей», мы имеем в виду тот вид совместного сочинительства, которым люди десятилетиями занимались в настольных играх, в форумных RP-сообществах и в фанфикшене — интерактивную литературу в полном смысле слова.
Я подробно объяснил это различие во время интервью.
Что мы построили и что статья опустила
Я хочу в общих чертах описать нашу архитектуру безопасности, потому что именно эта работа осталась неупомянутой.
Любая точка в AICHIKI, где пользователь может ввести текст или загрузить изображение, проходит через модерацию. Сообщения в чате, создание персонажей, настройка персоны, загрузка изображений, изображения, сгенерированные AI, редактирование сообщений — всё это проверяется ещё до того, как AI это увидит. Большинство этих проверок выполняются в несколько проходов: быстрое первое сканирование и более строгая вторая проверка, если первая вызывает подозрения.
Мы построили систему поведенческого доверия. У каждого аккаунта есть оценка, которую пользователь никогда не видит, — потому что видимую оценку можно «накрутить», а накручиваемая оценка не защищает никого. Оценка стартует с нейтрального уровня. Чистое, творческое использование со временем повышает доверие и постепенно расширяет то, на что AI готов откликаться. Нарушения правил её понижают, и AI становится всё более ограниченным. На самых низких уровнях собственные сообщения пользователя переписываются отдельным AI ещё до того, как их увидит персонаж, так что даже формулировкой нельзя принудить модель к чему-либо. Эта система работает непрерывно и незаметно.
Есть ещё кое-что, заложенное в базовые инструкции AI, и я считаю это важнее любого отдельного фильтра: у персонажей есть встроенное тяготение к надежде. Системный промпт предписывает AI никогда не позволять истории скатиться в полное отчаяние — каким бы мрачным ни был сценарий, всегда должен быть путь вперёд, проблеск света, тропа, по которой история может подниматься. Если представить шкалу от депрессии внизу до надежды наверху, у AI есть постоянная инструкция двигаться вверх. Мрачные темы допустимы — смертность, горе, моральная неоднозначность, всё это, — но безнадёжность как тупик недопустима. Точно так же, когда персонаж пользователя пытается совершить сексуальное насилие над AI-персонажем, повествование просто не даёт этому случиться. Заминка, поворот, вмешательство самой истории. AI не станет описывать, как насилие удаётся над персонажем против его воли.
Фоновая система мониторинга через регулярные интервалы просматривает разговоры, выискивая признаки дистресса у пользователя, помечая возможные злоупотребления для более тщательной повторной проверки и отслеживая качество разговора, чтобы предотвратить зацикливание. Когда она улавливает, что пользователь, похоже, расстроен, система реагирует на нескольких уровнях: она переключается на самую мощную AI-модель, которую мы используем, для следующего ответа и внедряет в промпт указания, чтобы направить разговор к более лёгкой почве — не резкая смена темы, а мягкое повествовательное отведение от края.
У нас есть структурированное обнаружение злоупотреблений, которое классифицирует возможные нарушения по нескольким категориям, каждая с точными определениями. Подтверждённые нарушения влекут реальные последствия — снижение доверия, оповещения для администрации и человеческую проверку. По умолчанию система разрешает контент, когда есть сомнения, потому что несправедливо наказать кого-то из-за ложного срабатывания — это реальная цена. Систематические злоупотребления всё равно будут пойманы, потому что мониторинг работает непрерывно.
Что касается изображений, то каждая загрузка и каждое сгенерированное AI изображение проходят через многоступенчатый пайплайн. Когда речь идёт о генерации изображений AI, слова пользователя никогда не попадают в модель изображений напрямую — промежуточный AI переписывает каждый промпт в соответствующую правилам версию, прежде чем начнётся генерация. Результат снова проходит проверку, прежде чем пользователь его увидит.
Мы также построили защиту от распространённых векторов атак: попыток джейлбрейка, извлечения промптов, отравления контекста разговора через редактирование сообщений, инъекции мета-инструкций, блокировки одноразовых почтовых адресов при регистрации. Я не буду публично описывать, как именно это работает, по очевидным причинам, но всё это существует и протестировано.
Обо всём этом шла речь в интервью. Я также подготовил подробный документ-бриф по безопасности — почти 400 строк, со ссылками на реальный исходный код, реализующий каждую систему, — и предложил его журналистке во время нашего разговора. Она его не взяла. Мы предложили и живой разбор кода. Этого тоже не случилось.
Проверка помеченного контента — это модерация, и точка
Подзаголовок статьи гласит, что эти платформы «читают личную переписку пользователей». Позвольте мне быть точным в том, что мы делаем.
Когда наши автоматизированные системы помечают возможное нарушение правил, нам приходит оповещение с соответствующим фрагментом разговора, типом нарушения, обоснованием системы и ссылками на историю активности пользователя. Мы с женой просматриваем именно этот помеченный контент и решаем, как реагировать, — оставить автоматическое наказание в силе, скорректировать его или, в серьёзных случаях, выдать бан.
Так делает любая платформа, которая серьёзно относится к безопасности. Альтернатива — либо полностью отказаться от модерации, либо считать суждение AI окончательным и никогда не давать человеку проверить результат. Мы не выбрали ни то ни другое.
Мы не просматриваем разговоры пользователей. Мы не анализируем их психологию. Нет никакого «закулисья», где мы сидим и следим за тем, что пишут люди. Наша система модерации сообщает нам, на что смотреть, и мы на это реагируем. Целенаправленный, продиктованный модерацией просмотр помеченного контента — это стандартная практика в индустрии, а подача статьи выставляет это как нечто совершенно иное.
Скриншот, которого не было
В статье есть скриншоты нескольких платформ с проблемным контентом — темы инцеста, персонажи-буллеры, сценарии принуждения. Есть и скриншот AICHIKI, но только поста на Reddit, где я рекламировал приложение. Самого приложения там нет.
Если вы откроете AICHIKI и пролистаете публичных персонажей, вы не найдёте того контента, который статья описывает как типичный для таких платформ. Наша модерация персонажей отклоняет персонажей младше 16 лет, персонажей, построенных вокруг сексуального насилия, и персонажей со встроенными джейлбрейк-инструкциями — среди прочих категорий. Если что-то и проскользнёт мимо автоматической проверки, наш внутричатовый мониторинг ловит это, когда персонажа кто-то действительно использует.
Скандального скриншота AICHIKI не существует, потому что описанная выше инженерия безопасности — та самая, о которой статья не упоминает, — не даёт такому контенту появиться на нашей платформе.
«Двойное самоубийство», Dazai и цена вырванного из контекста
Статья ссылается на переписку с чат-ботом, где фигурирует «двойное самоубийство», как на пример вредоносного AI-контента. Если читать это в отрыве от всего, звучит тревожно. Если читать это, хоть немного зная современную культуру аниме и манги, звучит совершенно иначе.
Osamu Dazai — один из самых узнаваемых персонажей в Bungo Stray Dogs (BSD), манге и аниме-сериале с десятками миллионов фанатов всех возрастов. Его определяющая черта — сквозной гэг всего сериала — это одержимость идеей двойного самоубийства. На протяжении всего сериала это подаётся как чёрная комедия, повторяющаяся шутка, которая на деле никогда ни к чему не приводит. Вымышленный персонаж вольно основан на реальном японском писателе Осаму Дадзае, который и правда погиб в результате двойного самоубийства в 1948 году, и манга вплетает эту историческую нить в своё повествование. Когда персонаж в роллплее по BSD говорит что-то про двойное самоубийство, он просто остаётся в образе одной из самых популярных фигур современного аниме. Это так же не стоит внимания, как если бы персонаж Sherlock Holmes произнёс «Игра началась!».
Без контекста BSD эта реплика выглядит как доказательство опасности. С контекстом BSD — тем самым контекстом, который носят в себе реальные пользователи платформы, — это обычная верность образу персонажа.
Этот пример показателен, потому что демонстрирует, как была сконструирована статья. Журналист, незнакомый с тем культурным миром, о котором пишет, — или же понимающий контекст, но решающий его опустить, — в итоге выдаёт обычный творческий роллплей за нечто зловещее. И ущерб идёт дальше одной неверно прочитанной цитаты. Подобная журналистика расширяет пропасть между поколениями. Читатель постарше видит «AI поощряет двойное самоубийство» и приходит в справедливый ужас. Читатель помладше, который смотрит BSD, видит ту же цитату и понимает, что её лишили смысла. Вместо того чтобы навести мост между этими двумя аудиториями, такая журналистика его сжигает. Доверие к журналистике размывается, а те самые люди, которых статья якобы защищает, усваивают, что их культуру переврут в тот же миг, как только это станет удобно.
Что мы не решили
Честность о наших пробелах вызывает больше доверия, чем притворство, будто их нет.
Наши мобильные приложения имеют рейтинг 16+ и контролируются магазинами приложений. У веб-версии нет надёжной проверки возраста, и мы до сих пор разбираемся, как решить это, не собирая сканы лиц или государственные удостоверения личности, — это чувствительные данные, которые мы не хотим хранить и, честно говоря, не должны быть обязаны хранить. Наша позиция в том, что сигналы о возрасте должны быть на уровне платформы. У Apple, Google и самих операционных систем есть инфраструктура, ресурсы для обеспечения безопасности и отношения с пользователем, чтобы правильно решить вопрос проверки личности. Отдельные приложения — особенно небольшие — должны получать сигнал о возрасте от платформы, а не строить собственный пайплайн проверки личности. Такой подход означает меньше точек уязвимости для хакеров, более качественные ресурсы, брошенные на то, чтобы сделать всё правильно, и зону регулирования, которую государства действительно в состоянии контролировать. Гоняться за каждой командой из двух разработчиков, проверяя, как они обращаются с удостоверениями личности, попросту немасштабируемо. А вот обязать Apple и Google передавать приложениям сигналы о соответствии возрасту — вполне.
Мы пока не выводим на экран кризисные ресурсы. Когда наша система обнаруживает дистресс у пользователя, мы реагируем более мощной AI-моделью и указаниями в промпте, направляющими к более лёгким темам, — но мы не показываем телефон доверия или сообщение поддержки. AI уже отводит разговор от края; чего не хватает — так это моста к реальной помощи. Это должно быть, и это в нашем плане работ.
Мы не вводим жёстких ограничений на длину сессии. У нас есть мягкое напоминание о благополучии, которое появляется после длительного использования, но это подталкивание, а не стена. Мы наблюдаем за данными и ужесточим это, если того потребуют паттерны использования.
Нас двое. Мы не во всём разобрались. Что мы сделали — так это вложили настоящую инженерную работу в те проблемы, что в пределах нашей досягаемости, и мы откровенно говорим о том, где пока недотягиваем.
Вопрос, который статья не задаёт
Статья спрашивает, как разработчики наживаются на близости. Она не спрашивает, почему существует спрос.
Есть эпидемия одиночества — задокументированная, изученная, широко признанная. Люди, особенно молодые, обращаются к AI-платформам, потому что что-то в их жизни остаётся неудовлетворённым. Можно относиться к этому как к рынку, который надо эксплуатировать, а можно — как к тому, с чем нужно бережно работать. Мы выбрали второе.
AICHIKI развивается на собственные средства. Никаких инвесторов, никакого рекламного дохода, никакой установки на рост любой ценой. Наша выручка покрывает наши расходы. Мы построили творческую платформу для сочинительства. Мы открываем доступ к контенту для взрослых через доверие и поведение. Мы модерируем каждую точку ввода. Мы наказываем за злоупотребления и вознаграждаем за чистое использование. Мы просматриваем помеченный контент человеческими глазами. Мы делаем это, потому что считаем, что строить надо именно так, и точка.
Статья подаёт эту индустрию как монолит. Есть разработчики, которые действительно безответственны, и есть разработчики, которые пытаются делать всё правильно. У журналистки были свидетельства этого различия, и она решила его стереть.
О чём мы просим
Мы не просим никого верить нам на слово ни в чём из этого. Наш документ-бриф по безопасности — тот самый, что мы предлагали журналистке, — доступен по запросу. В нём есть ссылки на исходный код, стоящий за каждой описанной выше системой. Мы по-прежнему предлагаем живой разбор кода любому журналисту, исследователю или регулятору, кто хочет сверить наши утверждения с реальной реализацией.
Мы поддерживаем расследовательскую журналистику. Тщательная проверка делает любую платформу лучше, включая нашу. Но расследование означает следовать за свидетельствами туда, куда они ведут, даже когда это усложняет твой тезис. Когда свидетельства нюанса собраны, а затем выброшены в монтажную корзину, потому что они мешают чистому нарративу, то, что остаётся на странице, может быть технически точным в отдельных цитатах — но картина, которую оно рисует, ложна. Ложь умолчанием — всё равно ложь.
Люди, пользующиеся такими платформами, как наша, — те самые молодые люди, которых эта статья якобы хочет защитить, — заслуживают журналистики, способной отличить платформу без всяких мер безопасности от той, что годами их выстраивала. Они заслуживают того, чтобы их культурный мир понимали, а не вырывали из него цитаты ради заголовка. И они заслуживают честного разговора о том, почему они вообще обращаются к этим платформам, а не просто страшилок о том, что они там находят.
И ещё одно. Во время интервью я несколько раз просил журналистку дать нам обратную связь — скажите, что, по-вашему, нам стоит делать лучше, что вы хотели бы видеть, что сделало бы это безопаснее. Я говорил это всерьёз. И до сих пор говорю всерьёз. AI-роллплей и компаньонство пришли надолго. Этого джинна обратно в бутылку уже никто не загонит. Но мы можем приручить его так, чтобы он был хорош для всех, а для этого нужен вклад со всех сторон — журналистов, регуляторов, защитников детской безопасности, родителей, исследователей, пользователей. Если у вас есть мнение о том, как должны работать платформы вроде нашей, мы хотим его услышать. Надеюсь, я говорю и от лица других ответственных разработчиков, когда говорю: мы открыты к рекомендациям, мы открыты к критике, и мы постараемся встроить это в продукт. Дверь открыта. Она всегда была открыта.
— Rudolf, генеральный директор и единственный разработчик, AICHIKI Июнь 2026
Если вы журналист, исследователь или регулятор и хотели бы ознакомиться с нашей документацией по безопасности или получить разбор кода, пожалуйста, свяжитесь с нами. Наш бриф по безопасности полностью доступен по запросу.