Skip to content

Нас інтерв'ювали годину. Ось що не потрапило до статті.

Відповідь AICHIKI на матеріал Bureau of Investigative Journalism «Meet the Developers Cashing In on AI Intimacy», опублікований 7 червня 2026 року.

На що ми відповідаємо:


Сьогодні Bureau of Investigative Journalism (TBIJ) у партнерстві з Le Monde опублікувало матеріал про невеликі платформи AI-компаньйонів та роллплею. AICHIKI була однією зі згаданих платформ. Я Rudolf, CEO і єдиний розробник AICHIKI, і я хочу відповісти. Стаття порушує реальні проблеми цієї індустрії — проблеми, які турбують і мене, і саме тому я взагалі погодився на інтерв'ю. Біда в тому, що сталося з інформацією, яку я надав, після того, як я її надав.

Я розмовляв з Effie Webb приблизно годину. Я пояснив їй, як працює AICHIKI, як влаштована наша модерація, що вирізняє нас з-поміж інших і як виглядає відповідальна розробка в цій сфері. З усієї розмови до статті потрапили дві речі: що ми з дружиною вручну переглядаємо позначений контент і що ми підняли мінімальний вік із 13 до 16 років. Усе інше залишилося за кадром.

Це її редакторське право. Але читачі заслуговують знати, що саме було випущено, бо ці випущені деталі змінюють усю історію.


Чим насправді є AICHIKI

Стаття зараховує нас до платформ чат-ботів-компаньйонів — застосунків, побудованих навколо AI-дівчат, AI-хлопців і емоційної прив'язаності. AICHIKI — це платформа для роллплею. Уявіть інтерактивний роман, уявіть настільну RPG-кампанію. Наші користувачі створюють персонажів, будують світи й пишуть спільні історії разом з AI. Коли ми кажемо «роллплей», ми маємо на увазі той вид спільного сторітелінгу, яким люди десятиліттями займаються в настільних іграх, форумних RP-спільнотах і фанфікшені — інтерактивну літературу в художньому сенсі.

Я докладно пояснив цю відмінність під час інтерв'ю.


Що ми побудували і що стаття опустила

Я хочу окреслити нашу архітектуру безпеки в загальних рисах, бо саме про цю роботу не згадали жодним словом.

Кожна точка на AICHIKI, де користувач може ввести текст чи завантажити зображення, проходить через модерацію. Повідомлення в чаті, створення персонажів, налаштування персони, завантаження зображень, згенеровані AI зображення, редагування повідомлень — усе це перевіряється ще до того, як його побачить AI. Більшість цих перевірок виконуються в кілька проходів: швидке перше сканування і суворіша друга перевірка, якщо перша викликала сумнів.

Ми побудували систему поведінкової довіри. Кожен акаунт має бал, якого користувач ніколи не бачить — бо видимий бал можна обхитрити, а бал, який можна обхитрити, не захищає нікого. Бал починається з нейтрального рівня. Чисте, креативне використання з часом заробляє довіру і поступово розширює те, на що AI погоджується відгукуватися. Порушення правил знижують бал, і AI стає дедалі стриманішим. На найнижчих рівнях власні повідомлення користувача переписує окремий AI ще до того, як їх побачить персонаж, тож навіть формулюванням не вдасться примусити модель до чогось. Ця система працює безперервно й непомітно.

Є ще дещо закладене в базові інструкції AI, що, на мою думку, важить більше за будь-який окремий фільтр: персонажі мають вбудований потяг до надії. Системний промпт наказує AI ніколи не дозволяти історії скотитися в цілковитий розпач — хоч би яким похмурим був сценарій, завжди має лишатися шлях уперед, промінчик світла, стежка, якою історія може дертися вгору. Якщо уявити шкалу від депресії внизу до надії вгорі, AI має постійну настанову рухатися догори. Похмурі теми дозволені — смертність, горе, моральна неоднозначність, усе це — а от безнадія як глухий кут — ні. Так само, коли персонаж користувача намагається вчинити сексуальне насильство над AI-персонажем, наратив просто не дає цьому статися. Переривання, поворот, втручання самої історії. AI не оповідатиме про те, як насильство успішно чиниться над персонажем проти його волі.

Фонова система моніторингу через регулярні проміжки переглядає розмови, шукаючи ознаки дистресу користувача, позначаючи потенційне зловживання для ретельнішої повторної перевірки і відстежуючи якість розмови, щоб не дати їй зациклитися. Коли вона вловлює, що користувач, схоже, засмучений, система реагує на кількох рівнях: для наступної відповіді вона перемикається на найпотужнішу AI-модель, яку ми використовуємо, і вбудовує в промпт настанови, щоб скерувати розмову в легше річище — не різка зміна теми, а м'який наративний відхід від краю.

У нас є структуроване виявлення зловживань, що класифікує потенційні порушення за кількома категоріями, кожна з точним визначенням. Підтверджені порушення мають реальні наслідки — зниження балу довіри, сповіщення адміністраторам і перевірку людиною. У разі сумніву система за замовчуванням дозволяє контент, бо помилково покарати когось через хибне спрацювання — це теж реальна ціна. Систематичне зловживання все одно буде виявлено, бо моніторинг працює безперервно.

Що стосується зображень, кожне завантаження й кожне згенероване AI зображення проходить через багатоступеневий конвеєр. Коли йдеться про генерацію зображень за допомогою AI, слова користувача ніколи не доходять до моделі зображень напряму — проміжний AI переписує кожен промпт у версію, що відповідає правилам, ще до початку генерації. Результат знову проходить перевірку, перш ніж користувач його побачить.

Ми також побудували захист від поширених векторів атак: спроб джейлбрейку, видобування промпту, отруєння контексту розмови через редагування повідомлень, ін'єкції мета-інструкцій, блокування одноразових поштових скриньок під час реєстрації. Я не описуватиму публічно, як це працює, із зрозумілих причин, але воно існує й воно протестоване.

Усе це звучало в інтерв'ю. Я також підготував докладний брифінг з безпеки — майже 400 рядків, із посиланнями на реальний вихідний код, що реалізує кожну систему, — і запропонував його репортерці під час нашої розмови. Вона його не взяла. Ми пропонували й розбір коду наживо. Цього теж не сталося.


Перегляд позначеного контенту — це модерація, крапка

Підзаголовок статті каже, що ці платформи «читають приватні чати». Дозвольте мені бути точним щодо того, що ми робимо.

Коли наші автоматизовані системи позначають потенційне порушення правил, нам надходить сповіщення з відповідним фрагментом розмови, типом порушення, обґрунтуванням системи й посиланнями на історію активності користувача. Ми з дружиною переглядаємо саме цей позначений контент і вирішуємо, як реагувати — залишити автоматичний штраф у силі, скоригувати його або, у серйозних випадках, видати бан.

Так робить кожна платформа, яка серйозно ставиться до безпеки. Альтернатива — або взагалі відмовитися від модерації, або вважати рішення AI остаточним і ніколи не давати людині перевірити результат. Ми не обрали ні того, ні іншого.

Ми не переглядаємо розмови користувачів. Ми не аналізуємо психологію користувачів. Немає жодного «бек-офісу», де ми сидимо й спостерігаємо за тим, що люди кажуть. Наша система модерації підказує нам, на що дивитися, і ми діємо за нею. Адресний перегляд позначеного контенту, керований модерацією, — стандартна практика в індустрії, а от стаття подає це так, наче йдеться про щось геть інше.


Скриншот, якого не було

Стаття містить скриншоти кількох платформ із проблемним контентом — теми інцесту, персонажі, що цькують, сценарії примусу. Вона також містить скриншот AICHIKI, але лише поста на Reddit, де я просував застосунок. Самого застосунку там немає.

Якщо ви відкриєте AICHIKI й переглянете публічних персонажів, ви не знайдете того роду контенту, який стаття описує як типовий для таких платформ. Наша модерація персонажів відхиляє персонажів молодших за 16 років, персонажів, побудованих навколо сексуального насильства, і персонажів, що містять вбудовані інструкції джейлбрейку, серед інших категорій. Якщо щось і прослизне повз автоматичну перевірку, наш моніторинг у чаті ловить це, коли хтось справді користується персонажем.

Скандального скриншота AICHIKI немає, бо описана вище інженерія безпеки — та сама інженерія, про яку стаття не згадує — не дає такому контенту існувати на нашій платформі.


Подвійне самогубство, Dazai та ціна вирваного контексту

Стаття згадує обмін повідомленнями з чат-ботом про «подвійне самогубство» як приклад шкідливого AI-контенту. Прочитане без контексту, це звучить тривожно. Прочитане з бодай якимось знайомством із сучасною аніме- та манґа-культурою, це звучить геть інакше.

Osamu Dazai — один із найвпізнаваніших персонажів Bungo Stray Dogs (BSD), серії манґи й аніме з десятками мільйонів фанатів усіх вікових груп. Його визначальна риса — наскрізний жарт усієї серії — це одержимість ідеєю подвійного самогубства. Протягом усього шоу це обігрується як чорна комедія, повторюваний жарт, що насправді ніколи нікуди не веде. Вигаданий персонаж вільно спирається на реального японського письменника Osamu Dazai, який і справді загинув унаслідок подвійного самогубства 1948 року, і манґа вплітає цю історичну нитку у свій сторітелінг. Персонаж, що каже щось про подвійне самогубство в роллплеї за BSD, просто лишається в образі однієї з найпопулярніших постатей сучасного аніме. Це настільки ж непримітно, як коли персонаж Sherlock Holmes каже «гра почалася».

Без контексту BSD цей рядок виглядає доказом небезпеки. З контекстом BSD — тим самим, що його носять у собі реальні користувачі платформи, — це звичайнісінька вірність образу.

Цей приклад показовий, бо демонструє, як було сконструйовано статтю. Дослідник, незнайомий із культурним світом, про який пише, — або той, хто розуміє контекст, але вирішує його опустити, — у підсумку подає звичайний креативний роллплей як щось зловісне. І шкода сягає далі за одну хибно прочитану цитату. Таке висвітлення поглиблює прірву між поколіннями. Старший читач бачить «AI заохочує до подвійного самогубства» і справедливо жахається. Молодший читач, який дивиться BSD, бачить ту саму цитату й знає, що з неї вихолостили зміст. Замість того щоб звести міст між цими двома аудиторіями, таке висвітлення його спалює. Довіра до журналістики розмивається, а люди, яких стаття нібито захищає, засвоюють: їхню культуру перекрутять тієї ж миті, щойно це стане зручно.


Що ми не вирішили

Чесність щодо наших прогалин викликає більше довіри, ніж удавання, ніби їх не існує.

Наші мобільні застосунки мають рейтинг 16+ і обмежені через app store. Веб-версія не має надійної верифікації віку, і ми досі шукаємо, як упоратися з цим, не збираючи скани облич чи державних документів — це чутливі дані, які ми не хочемо зберігати і, чесно кажучи, не мусили б. Наша позиція в тому, що сигнали про вік мають належати рівню платформи. Apple, Google й самі операційні системи мають інфраструктуру, ресурси безпеки й стосунки з користувачем, щоб як належить упоратися з верифікацією особи. Окремі застосунки — особливо невеликі — мають отримувати сигнал про вік від платформи, а не будувати власний конвеєр верифікації особи. Такий підхід означає менше точок вразливості для хакерів, кращі ресурси, спрямовані на те, щоб зробити це правильно, і регуляторне поле, за яким уряди справді можуть наглядати. Ганятися за кожною командою з двох розробників через те, як вони поводяться з документами, — це не масштабується. А вимагати від Apple і Google передавати застосункам сигнали про відповідність віку — масштабується.

Ми поки що не показуємо ресурси кризової допомоги. Коли наша система виявляє дистрес користувача, ми відповідаємо потужнішою AI-моделлю й настановами в промпті, що скеровують до легших тем, — але ми не показуємо телефон довіри чи повідомлення про підтримку. AI вже відводить розмову від краю; чого бракує — то це містка до реальної допомоги. Він має там бути, і він уже в дорожній карті.

Ми не запроваджуємо жорстких лімітів тривалості сесії. У нас є м'яке нагадування про самопочуття, яке з'являється після тривалого використання, але це підказка, а не стіна. Ми стежимо за даними й посилимо це, якщо патерни використання того вимагатимуть.

Нас двоє. Ми не з'ясували всього. Зате ми вклали справжню інженерну роботу в проблеми, які нам до снаги, і ми відверто говоримо про те, де нам ще бракує.


Питання, якого стаття не ставить

Стаття запитує, як розробники наживаються на інтимності. Вона не запитує, чому існує попит.

Існує епідемія самотності — задокументована, вивчена, широко визнана. Люди, особливо молодь, звертаються до AI-платформ, бо щось у їхньому житті лишається незадоволеним. Це можна сприймати як ринок, що його варто експлуатувати, а можна — як те, до чого треба підходити обережно. Ми обрали друге.

AICHIKI розвивається на власні кошти. Жодних інвесторів, жодних рекламних доходів, жодного мандату на зростання за будь-яку ціну. Наш дохід покриває наші витрати. Ми побудували платформу для креативного сторітелінгу. Ми відкриваємо доступ до контенту для дорослих за довірою й поведінкою. Ми модеруємо кожну точку входу. Ми караємо за зловживання й винагороджуємо чисте використання. Ми переглядаємо позначений контент людськими очима. Ми робимо це, бо вважаємо, що так будувати правильно, крапка.

Стаття зображує цю індустрію як моноліт. Є розробники, які справді безвідповідальні, і є розробники, які намагаються робити це правильно. У репортерки були докази для цієї відмінності — і вона вирішила її стерти.


Чого ми просимо

Ми не просимо нікого вірити нам на слово в жодному з цих пунктів. Наш документ-брифінг з безпеки — той самий, що ми пропонували репортерці — доступний за запитом. Він містить посилання на вихідний код за кожною описаною вище системою. Ми досі пропонуємо живий розбір коду в прямому ефірі будь-якому журналістові, дослідникові чи регулятору, який хоче звірити наші твердження з реальною реалізацією.

Ми підтримуємо журналістські розслідування. Прискіпливий розгляд робить кращою кожну платформу, зокрема й нашу. Але розслідування означає йти за доказами туди, куди вони ведуть, навіть коли це ускладнює вашу тезу. Коли докази нюансів зібрано, а потім викинуто, бо вони каламутять чистий наратив, те, що лишається на сторінці, може бути технічно точним у кожній окремій цитаті — але картина, яку воно малює, хибна. Брехня замовчуванням — це все одно брехня.

Люди, які користуються такими платформами, як наша, — молодь, яку ця стаття нібито хоче захистити, — заслуговують на висвітлення, здатне відрізнити платформу без жодних заходів безпеки від тієї, що роками їх будувала. Вони заслуговують на те, щоб їхній культурний світ розуміли, а не вихоплювали з нього зручні шматки заради заголовка. І вони заслуговують на чесну розмову про те, чому вони взагалі звертаються до цих платформ, а не лише на історії жахів про те, що вони там знаходять.

Ще одне. Під час інтерв'ю я неодноразово просив репортерку дати нам зворотний зв'язок — скажіть, що, на вашу думку, нам варто робити краще, що б ви хотіли бачити, від чого це стало б безпечнішим. Я казав це щиро. І досі кажу щиро. AI-роллплей і компаньйонство тут, із нами. Цього джина назад у пляшку вже ніхто не заганяє. Але ми можемо привчити його бути добрим для всіх, а для цього потрібен внесок з усіх боків — журналістів, регуляторів, захисників дитячої безпеки, батьків, дослідників, користувачів. Якщо у вас є думка про те, як мають працювати такі платформи, як наша, ми хочемо її почути. Сподіваюся, я говорю й за інших відповідальних розробників, коли кажу: ми відкриті до настанов, ми відкриті до критики, і ми намагатимемося це врахувати. Двері відчинені. Вони були відчинені завжди.

Rudolf, CEO і єдиний розробник, AICHIKI червень 2026 року


Якщо ви журналіст, дослідник чи регулятор і хотіли б переглянути нашу документацію з безпеки або отримати розбір коду, будь ласка, зв'яжіться з нами. Наш брифінг з безпеки доступний у повному обсязі за запитом.