Skip to content

Rozmawialiśmy przez godzinę. Oto, co nie weszło do artykułu.

Odpowiedź AICHIKI na tekst Bureau of Investigative Journalism „Meet the Developers Cashing In on AI Intimacy", opublikowany 7 czerwca 2026 roku.

Na co odpowiadamy:


Dzisiaj Bureau of Investigative Journalism (TBIJ), we współpracy z Le Monde, opublikowało tekst o małych platformach do tworzenia towarzyszy AI i roleplay. AICHIKI było jedną z wymienionych platform. Nazywam się Rudolf, jestem prezesem i jedynym programistą AICHIKI i chcę na to odpowiedzieć. Artykuł porusza realne problemy tej branży — problemy, które podzielam, dlatego w ogóle zgodziłem się na wywiad. Problem polega na tym, co stało się z tymi informacjami później, gdy już je przekazałem.

Rozmawiałem z Effie Webb przez mniej więcej godzinę. Wyjaśniłem jej, jak działa AICHIKI, jak funkcjonuje nasza moderacja, co nas wyróżnia i jak wygląda odpowiedzialny rozwój w tej dziedzinie. Z całej tej rozmowy do artykułu trafiły dwie rzeczy: że moja żona i ja ręcznie weryfikujemy oznaczone treści oraz że podnieśliśmy minimalny wiek z 13 do 16 lat. Cała reszta została pominięta.

To jej prawo jako redaktorki. Ale czytelnicy zasługują na to, by wiedzieć, co pominięto, bo te pominięcia zmieniają całą historię.


Czym AICHIKI naprawdę jest

Artykuł wrzuca nas do jednego worka z platformami chatbotów-towarzyszy — aplikacjami zbudowanymi wokół dziewczyn i chłopaków z AI oraz emocjonalnego przywiązania. AICHIKI to platforma do roleplay. Pomyśl o interaktywnej powieści, pomyśl o kampanii RPG przy stole. Nasi użytkownicy tworzą postaci, budują światy i piszą wspólne opowieści z AI. Kiedy mówimy „roleplay", mamy na myśli ten rodzaj wspólnego opowiadania historii, który ludzie uprawiają od dekad w grach fabularnych, w społecznościach RP na forach i w fan fiction — interaktywną fikcję w sensie literackim.

To rozróżnienie obszernie wyjaśniłem podczas wywiadu.


Co zbudowaliśmy i co artykuł pominął

Chcę przedstawić naszą architekturę bezpieczeństwa w ogólnych zarysach, bo to właśnie ta praca została przemilczana.

Każde miejsce, w którym użytkownik może wpisać tekst lub przesłać obraz w AICHIKI, przechodzi przez moderację. Wiadomości na czacie, tworzenie postaci, konfiguracja persony, przesyłane obrazy, obrazy generowane przez AI, edycja wiadomości — wszystko to jest sprawdzane, zanim AI w ogóle to zobaczy. Większość tych kontroli przebiega w kilku etapach: szybki pierwszy skan i bardziej rygorystyczna druga weryfikacja, jeśli ten pierwszy wzbudzi wątpliwości.

Zbudowaliśmy system zaufania oparty na zachowaniu. Każde konto ma wynik, którego użytkownik nigdy nie widzi — bo widoczny wynik to wynik, który da się ograć, a wynik, który da się ograć, nikogo nie chroni. Wynik startuje od poziomu neutralnego. Czyste, kreatywne korzystanie z czasem buduje zaufanie i stopniowo poszerza to, na co AI jest gotowe przystać. Naruszenia zasad ten wynik obniżają, a AI staje się coraz bardziej restrykcyjne. Na najniższych poziomach same wiadomości użytkownika są przepisywane przez osobne AI, zanim postać je zobaczy, tak by nawet sposobu ich sformułowania nie dało się wykorzystać do manipulowania modelem. System ten działa nieprzerwanie i po cichu.

Jest jeszcze coś wpisanego w bazowe instrukcje AI, co według mnie znaczy więcej niż jakikolwiek pojedynczy filtr: postaci mają wbudowane ciążenie ku nadziei. Prompt systemowy nakazuje AI, by nigdy nie pozwoliło historii osunąć się w całkowitą rozpacz — bez względu na to, jak mroczny jest scenariusz, zawsze musi istnieć droga naprzód, smuga światła, ścieżka, po której opowieść może się wspinać. Jeśli wyobrazisz sobie skalę od depresji na dole do nadziei na górze, AI ma stałe polecenie, by piąć się w górę. Mroczne motywy są dozwolone — śmiertelność, żałoba, moralna niejednoznaczność, wszystko to — ale beznadzieja jako ślepy zaułek już nie. Podobnie, gdy postać użytkownika próbuje dopuścić się napaści seksualnej na postaci AI, narracja po prostu na to nie pozwala. Przerwanie, odwrócenie sytuacji, akt samej opowieści, która interweniuje. AI nie poprowadzi narracji, w której napaść na niechcącą tego postać kończy się powodzeniem.

System monitorujący w tle przegląda rozmowy w regularnych odstępach, wypatrując oznak cierpienia użytkownika, oznaczając potencjalne nadużycia do dokładniejszej weryfikacji drugiego etapu i pilnując jakości rozmowy, by zapobiec powtarzalnym pętlom. Gdy wychwyci, że użytkownik wydaje się przygnębiony, system reaguje na kilku poziomach: przełącza się na najsilniejszy model AI, jaki uruchamiamy, dla kolejnej odpowiedzi, i wstrzykuje do promptu wskazówki, które kierują rozmowę ku lżejszym tematom — nie gwałtowna zmiana tematu, lecz delikatne narracyjne odsunięcie od krawędzi.

Mamy uporządkowane wykrywanie nadużyć, które klasyfikuje potencjalne naruszenia w wielu kategoriach, każda z precyzyjną definicją. Potwierdzone naruszenia niosą realne konsekwencje — obniżenie zaufania, alerty dla administracji i weryfikację przez człowieka. W razie niepewności system domyślnie dopuszcza treść, bo niesłuszne ukaranie kogoś za fałszywy alarm to realny koszt. Uporczywe nadużycia i tak zostają wychwycone, bo monitoring działa nieprzerwanie.

W przypadku obrazów każdy przesłany plik i każdy obraz wygenerowany przez AI przechodzi przez wieloetapowy pipeline. Jeśli chodzi o generowanie obrazów przez AI, słowa użytkownika nigdy nie docierają wprost do modelu obrazu — pośrednie AI przepisuje każdy prompt na zgodną z zasadami wersję, zanim zacznie się generowanie. Efekt jest ponownie prześwietlany, zanim użytkownik go zobaczy.

Zbudowaliśmy też zabezpieczenia przed typowymi wektorami ataku: próbami jailbreaku, wyciąganiem promptu, zatruwaniem kontekstu rozmowy przez edycję wiadomości, wstrzykiwaniem metainstrukcji, blokowaniem jednorazowych adresów e-mail przy rejestracji. Z oczywistych względów nie będę publicznie opisywał, jak to działa, ale te mechanizmy istnieją i są testowane.

Wszystko to padło podczas wywiadu. Przygotowałem też szczegółowy dokument z briefingiem o bezpieczeństwie — blisko 400 linii, z odniesieniami do faktycznego kodu źródłowego, który implementuje każdy z tych systemów — i zaproponowałem go dziennikarce w trakcie rozmowy. Nie wzięła go. Zaoferowaliśmy także wspólne przejście przez kod na żywo. To również się nie wydarzyło.


Weryfikacja oznaczonych treści to moderacja, koniec, kropka

Podtytuł artykułu mówi, że te platformy „czytają prywatne czaty" użytkowników. Pozwólcie, że doprecyzuję, co właściwie robimy.

Kiedy nasze automatyczne systemy oznaczą potencjalne naruszenie zasad, dostajemy alert z odpowiednim fragmentem rozmowy, typem naruszenia, uzasadnieniem systemu i linkami do historii aktywności użytkownika. Moja żona i ja przeglądamy tę konkretną oznaczoną treść i decydujemy, jak zareagować — zostawić automatyczną karę, skorygować ją, a w poważnych przypadkach nałożyć bana.

Robi tak każda platforma, która poważnie traktuje bezpieczeństwo. Alternatywą jest albo całkowite pominięcie moderacji, albo traktowanie ocen AI jako ostatecznych i nigdy niesprawdzanie wyniku przez człowieka. Nie wybraliśmy żadnej z tych dróg.

Nie przeglądamy rozmów użytkowników. Nie analizujemy psychiki użytkowników. Nie ma żadnego „zaplecza", w którym siedzimy i obserwujemy, co ludzie piszą. Nasz system moderacji mówi nam, na co spojrzeć, a my na to reagujemy. Ukierunkowana, napędzana moderacją weryfikacja oznaczonych treści to standardowa praktyka w branży — a ujęcie z artykułu sprawia, że brzmi to jak coś zupełnie innego.


Zrzut ekranu, którego nie było

Artykuł zawiera zrzuty ekranu kilku platform pokazujące problematyczne treści — motywy kazirodcze, postaci znęcające się nad innymi, scenariusze przymuszania. Zawiera też zrzut ekranu AICHIKI, ale wyłącznie wpisu na Reddit, w którym promowałem aplikację. Sama aplikacja w ogóle się nie pojawia.

Jeśli otworzysz AICHIKI i przejrzysz publiczne postaci, nie znajdziesz tam tego rodzaju treści, które artykuł opisuje jako typowe dla takich platform. Nasza moderacja postaci odrzuca postaci poniżej 16 lat, postaci zbudowane wokół napaści seksualnej oraz postaci z osadzonymi instrukcjami jailbreaku, między innymi. A jeśli coś jednak przemknie się przez automatyczną kontrolę, nasz monitoring na czacie wychwytuje to w chwili, gdy ktoś faktycznie zacznie używać tej postaci.

Nie ma żadnego skandalicznego zrzutu ekranu z AICHIKI, bo opisana wyżej inżynieria bezpieczeństwa — ta sama, o której artykuł nie wspomina — sprawia, że takie treści w ogóle nie istnieją na naszej platformie.


Podwójne samobójstwo, Dazai i cena wyrywania z kontekstu

Artykuł przywołuje wymianę zdań z chatbotem dotyczącą „podwójnego samobójstwa" jako przykład szkodliwych treści AI. Czytane na zimno brzmi to alarmująco. Czytane z jakąkolwiek znajomością współczesnej kultury anime i mangi brzmi jak coś zupełnie innego.

Osamu Dazai to jedna z najbardziej rozpoznawalnych postaci w Bungo Stray Dogs (BSD), serii mangi i anime z dziesiątkami milionów fanów we wszystkich grupach wiekowych. Jego cecha definiująca — running gag całej serii — to obsesja na punkcie popełnienia podwójnego samobójstwa. W całym anime rozgrywane jest to jako czarna komedia, powracający żart, który nigdy do niczego nie prowadzi. Fikcyjna postać jest luźno oparta na prawdziwym japońskim pisarzu Osamu Dazaiu, który rzeczywiście zginął w wyniku podwójnego samobójstwa w 1948 roku, a manga wplata ten wątek historyczny w swoją narrację. Postać mówiąca coś o podwójnym samobójstwie w roleplayu z BSD po prostu pozostaje w roli jednej z najpopularniejszych figur współczesnego anime. Jest to równie niepokojące jak postać Sherlocka Holmesa mówiąca „gra się rozpoczęła".

Bez kontekstu BSD ta kwestia wygląda jak dowód zagrożenia. Z kontekstem BSD — kontekstem, który faktyczni użytkownicy platformy noszą w głowie — to zwykła wierność postaci.

Ten przykład jest wymowny, bo pokazuje, jak skonstruowano artykuł. Osoba prowadząca śledztwo, nieobeznana ze światem kulturowym, o którym pisze — albo taka, która ten kontekst rozumie, lecz postanawia go pominąć — ostatecznie przedstawia zwykły, kreatywny roleplay jako coś złowieszczego. A szkoda sięga dalej niż jeden źle odczytany cytat. Dziennikarstwo tego rodzaju poszerza przepaść między pokoleniami. Starszy czytelnik widzi „AI zachęca do podwójnego samobójstwa" i jest słusznie przerażony. Młodszy czytelnik, który ogląda BSD, widzi ten sam cytat i wie, że wyrwano go ze znaczenia. Zamiast budować most między tymi dwiema grupami, takie dziennikarstwo go spala. Zaufanie do dziennikarstwa się kruszy, a ludzie, których artykuł rzekomo chce chronić, uczą się, że ich kultura zostanie przekłamana w chwili, gdy będzie to wygodne.


Czego nie rozwiązaliśmy

Szczerość wobec własnych luk jest bardziej wiarygodna niż udawanie, że ich nie ma.

Nasze aplikacje mobilne mają kategorię 16+ i są bramkowane przez sklepy z aplikacjami. Wersja webowa nie ma solidnej weryfikacji wieku i wciąż zastanawiamy się, jak to rozwiązać bez zbierania skanów twarzy czy dokumentów tożsamości — to wrażliwe dane, których nie chcemy przechowywać i których, szczerze mówiąc, przechowywać nie powinniśmy. Nasze stanowisko jest takie, że sygnały o wieku powinny być obsługiwane na poziomie platformy. Apple, Google i same systemy operacyjne mają infrastrukturę, zasoby bezpieczeństwa i relację z użytkownikiem, by zająć się weryfikacją tożsamości jak należy. Pojedyncze aplikacje — zwłaszcza te małe — powinny otrzymywać sygnał o wieku od platformy, a nie budować własny pipeline weryfikacji tożsamości. Takie podejście oznacza mniej punktów podatnych na ataki hakerów, lepsze zasoby skierowane na zrobienie tego dobrze i powierzchnię regulacyjną, którą rządy faktycznie mogą nadzorować. Ściganie każdego dwuosobowego zespołu deweloperskiego za jego praktyki obsługi dokumentów tożsamości jest nieskalowalne. Wymaganie od Apple i Google, by przekazywały aplikacjom sygnały dostosowane do wieku, jest skalowalne.

Nie pokazujemy jeszcze zasobów kryzysowych. Gdy nasz system wykryje cierpienie użytkownika, reagujemy silniejszym modelem AI i wskazówkami w prompcie, które kierują ku lżejszym tematom — ale nie wyświetlamy numeru telefonu zaufania ani komunikatu wsparcia. AI już odciąga rozmowę od krawędzi; brakuje mostu do realnej pomocy. To powinno tam być i jest w planach.

Nie egzekwujemy twardych limitów długości sesji. Mamy łagodne przypomnienie o dbaniu o siebie, które pojawia się po dłuższym korzystaniu, ale to zachęta, nie ściana. Obserwujemy dane i zaostrzymy to, jeśli wzorce korzystania będą tego wymagać.

Jest nas dwoje. Nie rozgryźliśmy wszystkiego. To, co zrobiliśmy, to włożenie prawdziwej pracy inżynierskiej w problemy będące w naszym zasięgu, i mówimy otwarcie o tym, gdzie wciąż nie dociągamy.


Pytanie, którego artykuł nie zadaje

Artykuł pyta, jak deweloperzy zarabiają na intymności. Nie pyta, dlaczego istnieje na nią popyt.

Mamy epidemię samotności — udokumentowaną, badaną, powszechnie uznawaną. Ludzie, zwłaszcza młodzi, zwracają się ku platformom AI, bo coś w ich życiu pozostaje niezaspokojone. Możesz to potraktować jako rynek do wyzysku albo jako coś, do czego trzeba podejść z rozwagą. My wybraliśmy to drugie.

AICHIKI jest finansowane z własnych środków. Bez inwestorów, bez przychodów z reklam, bez nakazu wzrostu za wszelką cenę. Nasze przychody pokrywają nasze koszty. Zbudowaliśmy kreatywną platformę do opowiadania historii. Bramkujemy treści dla dorosłych za zaufaniem i zachowaniem. Moderujemy każde miejsce. Karzemy nadużycia i nagradzamy czyste korzystanie. Weryfikujemy oznaczone treści ludzkim okiem. Robimy to, bo uważamy, że tak właśnie należy budować, koniec, kropka.

Artykuł przedstawia tę branżę jako monolit. Są deweloperzy naprawdę nieodpowiedzialni i są deweloperzy, którzy starają się robić to dobrze. Dziennikarka miała dowody na to rozróżnienie i postanowiła je zatrzeć.


O co prosimy

Nie prosimy nikogo, by uwierzył nam w to wszystko na słowo. Nasz dokument z briefingiem o bezpieczeństwie — ten sam, który zaproponowaliśmy dziennikarce — jest dostępny na życzenie. Zawiera odniesienia do kodu źródłowego stojącego za każdym opisanym wyżej systemem. Wciąż oferujemy wspólne przejście przez kod na żywo każdemu dziennikarzowi, badaczowi czy regulatorowi, który chce skonfrontować nasze twierdzenia z faktyczną implementacją.

Wspieramy dziennikarstwo śledcze. Bycie pod lupą czyni każdą platformę lepszą, w tym naszą. Ale śledztwo oznacza podążanie za dowodami, dokądkolwiek prowadzą, nawet gdy komplikują twoją tezę. Kiedy dowody na niuans zostają zebrane, a potem wylądują w koszu, bo zaciemniają klarowną narrację, to, co zostaje na stronie, może być technicznie zgodne z prawdą w poszczególnych cytatach — ale obraz, który maluje, jest fałszywy. Kłamstwo przez przemilczenie to wciąż kłamstwo.

Ludzie korzystający z platform takich jak nasza — młodzi ludzie, których ten artykuł rzekomo chce chronić — zasługują na dziennikarstwo, które potrafi odróżnić platformę bez żadnych zabezpieczeń od takiej, która spędziła lata na ich budowaniu. Zasługują na to, by ich świat kulturowy został zrozumiany, a nie wyselekcjonowany pod nagłówek. I zasługują na uczciwą rozmowę o tym, dlaczego w ogóle zwracają się ku tym platformom, a nie tylko na historie grozy o tym, co tam zastają.

Jeszcze jedno. Podczas wywiadu wielokrotnie prosiłem dziennikarkę o feedback — powiedz nam, co Twoim zdaniem powinniśmy robić lepiej, co chciałabyś zobaczyć, co uczyniłoby to bezpieczniejszym. Mówiłem to zupełnie poważnie. I wciąż mówię to poważnie. Roleplay i towarzystwo oparte na AI są już tutaj. Nikt nie cofnie tego, co się stało. Ale możemy to wytrenować tak, by było dobre dla wszystkich, a to wymaga wkładu ze wszystkich stron — dziennikarzy, regulatorów, rzeczników bezpieczeństwa dzieci, rodziców, badaczy, użytkowników. Jeśli masz zdanie na temat tego, jak platformy takie jak nasza powinny działać, chcemy je usłyszeć. Mam nadzieję, że mówię też w imieniu innych odpowiedzialnych deweloperów, gdy powiem: jesteśmy otwarci na wskazówki, jesteśmy otwarci na krytykę i postaramy się ją wbudować. Drzwi są otwarte. Zawsze były.

Rudolf, prezes i jedyny programista, AICHIKI Czerwiec 2026


Jeśli jesteś dziennikarzem, badaczem lub regulatorem i chciałbyś zapoznać się z naszą dokumentacją bezpieczeństwa albo otrzymać przejście przez kod, skontaktuj się z nami. Nasz briefing o bezpieczeństwie jest w całości dostępny na życzenie.