Skip to content

1 時間のインタビューを受けました。記事に載らなかったことをお話しします。

2026 年 6 月 7 日に公開された Bureau of Investigative Journalism「Meet the Developers Cashing In on AI Intimacy」に対する AICHIKI からの応答です。

私たちが応答している記事:


本日、Bureau of Investigative Journalism(TBIJ)が Le Monde と共同で、小規模な AI コンパニオン・ロールプレイ系プラットフォームについての記事を公開しました。AICHIKI もそこで取り上げられたプラットフォームの一つです。私は AICHIKI の CEO 兼唯一の開発者である Rudolf です。これに応答したいと思います。記事はこの業界について本物の懸念を提起しています — それは私自身も抱いている懸念であり、だからこそ私はそもそもインタビューに応じたのです。問題は、私が提供した情報が、提供したあとでどう扱われたか、にあります。

私は Effie Webb と約 1 時間話しました。AICHIKI の仕組み、モデレーションの動き方、私たちが何によって他と違うのか、この分野で責任ある開発とはどういうものかを、一通り説明しました。その会話の中から記事に載ったのは二つだけです。妻と私がフラグの立ったコンテンツを手作業でレビューしていること、そして最低年齢を 13 歳から 16 歳へ引き上げたこと。それ以外はすべて抜け落ちました。

それは彼女の編集権です。けれども、何が省かれたのかを読者は知る権利があります。なぜなら、その省略が話を変えてしまうからです。


AICHIKI とは実際に何なのか

記事は私たちをコンパニオン型チャットボットのプラットフォーム — AI の彼女や彼氏、感情的な愛着を中心に作られたアプリ — と同じ括りに入れています。AICHIKI はロールプレイのプラットフォームです。インタラクティブな小説、テーブルトーク RPG のキャンペーンを思い浮かべてください。ユーザーはキャラクターを作り、世界を構築し、AI とともに共同で物語を書きます。私たちが「ロールプレイ」と言うとき、それはテーブルトークゲームやフォーラム型 RP コミュニティ、二次創作の中で人々が何十年も続けてきた共同創作のことを指します — 文学的な意味でのインタラクティブ・フィクションです。

私はこの区別をインタビューの中で十分に説明しました。


私たちが築いたもの、そして記事が省いたもの

私たちのセーフティアーキテクチャを大まかに示しておきたいと思います。これこそが、言及されなかった仕事だからです。

AICHIKI では、ユーザーがテキストを入力したり画像をアップロードしたりできるあらゆる場所が、モデレーションを通過します。チャットメッセージ、キャラクター作成、ペルソナ設定、画像アップロード、AI 生成画像、メッセージ編集 — そのすべてが、AI の目に触れる前にチェックされます。これらのチェックの多くは複数段階で実行されます。まず高速な一次スキャン、そして一次が懸念を上げた場合はより厳格な二次チェック。

私たちは行動信頼システムを構築しました。すべてのアカウントには、ユーザー本人には決して見えないスコアが付いています — なぜなら、見えるスコアは攻略可能なスコアであり、攻略可能なスコアは誰のことも守れないからです。スコアは中立から始まります。時間をかけたクリーンで創造的な利用は信頼を獲得し、AI が応じる範囲を少しずつ広げていきます。ポリシー違反はスコアを下げ、AI は段階的により制限的になります。最も低いレベルでは、ユーザー自身のメッセージが、キャラクターの目に触れる前に別の AI によって書き換えられます。そのため、言い回しそのものを使ってモデルを意のままに動かそうとすることすらできません。このシステムは絶え間なく、そして静かに動き続けます。

それから、個々のフィルターよりも重要だと私が考えている、AI の基本指示に組み込まれたものがあります。キャラクターには希望へと向かう力があらかじめ備わっているのです。システムプロンプトは AI に対し、物語を完全な絶望へと崩壊させないよう指示しています — どれほど暗いシナリオであっても、前に進む道、ひと筋の光、物語が登っていける道がなければならない、と。下を抑うつ、上を希望とする目盛りを思い浮かべるなら、AI には上へと向かい続けるという常時の指示があるのです。暗いテーマは許容されます — 死、悲嘆、道徳的な曖昧さ、そのすべてが。けれども、行き止まりとしての絶望は許されません。同じように、ユーザーのキャラクターが AI のキャラクターに性的暴行を加えようとしたとき、物語はそれを起こさせません。割り込み、反転、物語そのものによる介入が起きます。AI が、意に反するキャラクターに対して暴行が成功する様を語ることはありません。

バックグラウンドの監視システムが一定間隔で会話をレビューし、ユーザーの苦痛の兆候を確認し、虐待の可能性をより徹底した二次レビューのためにフラグ付けし、繰り返しのループを防ぐために会話の質を見守ります。ユーザーが動揺しているように見えると、システムは複数のレベルで応答します。次の応答には、私たちが運用している中で最も強力な AI モデルへ切り替え、会話をより穏やかな方向へ導くためのガイダンスをプロンプトに注入します — 唐突に話題を変えるのではなく、縁から離れるよう物語をそっと引き寄せるのです。

私たちは、潜在的な違反を複数のカテゴリーに分類する構造化された虐待検出を備えており、各カテゴリーには厳密な定義があります。確認された違反には実際の結果が伴います — 信頼ペナルティ、管理者アラート、人間によるレビュー。判断に迷う場合、システムはコンテンツを許可する側に倒れます。誤検知で誰かを不当に罰することには、現実のコストがあるからです。継続的な悪用はそれでも捕捉されます。監視が絶え間なく動いているからです。

画像については、すべてのアップロードとすべての AI 生成画像が多段階のパイプラインを通ります。AI 画像生成の場合、ユーザーの言葉が画像モデルに直接届くことは決してありません — 生成が始まる前に、中間の AI がすべてのプロンプトをポリシーに準拠した形に書き換えます。出力もユーザーの目に触れる前に再度スクリーニングされます。

私たちはまた、よくある攻撃手法への防御も構築しました。ジェイルブレイクの試み、プロンプト抽出、メッセージ編集を通じた会話コンテキストの汚染、メタ指示の注入、登録時の使い捨てメールアドレスのブロック。理由は明らかなので、これらがどう動くかを公に詳述することはしませんが、それらは確かに存在し、テストされています。

これらすべてがインタビューで話に出ました。私はさらに、詳細なセーフティ説明資料も用意していました — 400 行近くにおよび、各システムを実装している実際のソースコードへの参照を含むものです — そして会話の最中にそれを記者に提供すると申し出ました。彼女はそれを受け取りませんでした。ライブでのコードのウォークスルーも申し出ました。それも実現しませんでした。


フラグの立ったコンテンツのレビューは、れっきとしたモデレーションです

記事の副題は、これらのプラットフォームが「ユーザーのプライベートなチャットを読んでいる」と述べています。私たちが何をしているのか、正確にお話しさせてください。

自動システムがポリシー違反の可能性をフラグ付けすると、該当する会話の抜粋、違反の種類、システムの判断理由、そしてユーザーの行動履歴へのリンクとともに、私たちにアラートが送られます。妻と私はその特定のフラグ付きコンテンツをレビューし、どう対応するかを決めます — 自動のペナルティをそのままにするか、調整するか、あるいは重大なケースではバンを科すか。

セーフティを真剣に受け止めているプラットフォームはどこでもこれを行っています。代替案は、モデレーションを一切行わないか、AI の判断を最終とみなして人間が結果を一度も確認しないか、のどちらかです。私たちはそのどちらも選びませんでした。

私たちはユーザーの会話を閲覧しません。ユーザーの心理を分析しません。私たちが座って人々の発言を眺めるような「バックオフィス」は存在しません。モデレーションシステムが何を見るべきかを教え、私たちはそれに基づいて動きます。フラグの立ったコンテンツに的を絞り、モデレーションを起点としてレビューを行う — これは業界の標準的な実践です。それなのに、記事の枠づけは、それをまるで別物であるかのように響かせてしまうのです。


そこになかったスクリーンショット

記事には、問題のあるコンテンツを示すいくつかのプラットフォームのスクリーンショットが載っています — 近親相姦のテーマ、いじめをするキャラクター、強要のシナリオ。AICHIKI のスクリーンショットも含まれていますが、それは私がアプリを宣伝した Reddit の投稿のものだけです。アプリそのものは登場しません。

AICHIKI を開いて公開キャラクターを眺めてみても、記事がこれらのプラットフォームに典型的だと表現するような種類のコンテンツは見つかりません。私たちのキャラクターモデレーションは、16 歳未満のキャラクター、性的暴行を中心に作られたキャラクター、ジェイルブレイク指示を埋め込んだキャラクターなどを拒否します。仮に何かが自動チェックをすり抜けたとしても、誰かが実際にそのキャラクターを使った時点で、チャット内の監視が捕捉します。

スキャンダラスな AICHIKI のスクリーンショットが存在しないのは、上で述べたセーフティエンジニアリング — 記事が言及しないエンジニアリング — が、そうしたコンテンツを私たちのプラットフォーム上に存在させないからです。


心中、太宰、そして文脈を剥ぎ取ることの代償

記事は、有害な AI コンテンツの一例として「心中(しんじゅう)」をめぐるチャットボットのやり取りを引いています。前提なしに読むと、これは不穏に聞こえます。けれども、今のアニメやマンガの文化に少しでも親しんでいる人が読めば、まったく別のものに聞こえます。

太宰治は、あらゆる年齢層にわたって数千万人のファンを持つマンガ・アニメ作品『Bungo Stray Dogs』(BSD)の、最も知名度の高いキャラクターの一人です。彼を特徴づける性格 — 作品全体を貫くお約束ネタ — は、心中への執着です。作中ではこれは終始ダークコメディとして描かれ、結局どこにもたどり着かない繰り返しのギャグになっています。この架空のキャラクターは、1948 年に実際に心中で世を去った実在の日本の作家・太宰治をゆるやかに下敷きにしており、マンガはその史実の糸を物語に織り込んでいます。BSD のロールプレイの中でキャラクターが心中について何か言うのは、現代アニメで最も人気のある人物の一人として、キャラクターに忠実に振る舞っているにすぎません。それは Sherlock Holmes のキャラクターが「ワトソン君、ことは始まっているよ」と言うのと同じくらい、何でもないことです。

BSD の文脈がなければ、その台詞は危険の証拠のように見えます。BSD の文脈があれば — プラットフォームの実際のユーザーが当然のように持っている文脈があれば — それはごく普通の、キャラクターへの忠実さなのです。

この例が示唆に富むのは、記事がどう組み立てられたかを物語っているからです。自分が取材している文化的世界に不案内な取材者 — あるいは文脈を理解しながらそれを省くことを選んだ取材者 — は、ごく普通の創造的なロールプレイを、何か邪悪なものとして提示してしまうことになります。そして損害は、誤読された一つの引用にとどまりません。このような報道は、世代間の溝を広げます。年配の読者は「AI が心中を勧めている」と見て、当然ながら戦慄します。BSD を観ている若い読者は、同じ引用を見て、それが意味を剥ぎ取られたものだと分かります。二つの読者層の間に橋を架ける代わりに、報道はその橋を焼き落としてしまうのです。ジャーナリズムへの信頼が損なわれ、記事が守ると謳う当の人々は、自分たちの文化が、都合のいいときにはたちまち歪めて伝えられるのだと学習してしまいます。


私たちがまだ解決していないこと

自分たちの欠点について正直であることは、それが存在しないふりをするよりも信頼に足ります。

私たちのモバイルアプリは 16 歳以上向けの評価が付けられ、アプリストアによってゲートされています。ウェブ版には堅牢な年齢確認がなく、顔スキャンや公的身分証を収集せずにこれをどう扱うか、私たちは今なお模索しています — それは私たちが保持したくない、そして率直に言って保持すべきでもない、機微なデータです。私たちの立場は、年齢のシグナルはプラットフォームのレベルにあるべきだ、というものです。Apple、Google、そして OS そのものは、本人確認をきちんと扱うためのインフラ、セキュリティ資源、そしてユーザーとの関係を持っています。個々のアプリ — 特に小規模なもの — は、自前の本人確認パイプラインを構築するのではなく、プラットフォームから年齢シグナルを受け取るべきです。そのアプローチは、ハッカーにとっての攻撃点を減らし、正しく実装するためのよりよい資源を投じることを可能にし、政府が実際に監督できる規制対象の表面を生み出します。二人組の開発チーム一つひとつを、その身分証の取り扱いについて追い回すのは、スケールしません。Apple と Google に、年齢にふさわしいシグナルをアプリへ渡すよう求めることは、スケールします。

私たちはまだ、危機支援のリソースを画面に出していません。システムがユーザーの苦痛を検知すると、より強力な AI モデルと、より穏やかなテーマへ導くプロンプトのガイダンスで応答します — けれども、相談窓口やサポートのメッセージは表示しません。AI はすでに会話を縁から引き離していますが、欠けているのは現実世界の支援への橋渡しです。それはあるべきものであり、ロードマップに入っています。

私たちは厳格なセッション時間の上限を強制していません。長時間の利用の後に現れる、穏やかなウェルネスのリマインダーはありますが、それは壁ではなく、そっとした促しです。私たちはデータを見守っており、利用パターンが求めるなら、これを引き締めます。

私たちは二人です。すべてを解明したわけではありません。私たちがやってきたのは、自分たちの手の届く範囲の問題に本物のエンジニアリングの労力を注ぐことであり、そしてまだ足りていない部分については正直でいることです。


記事が問わない問い

記事は、開発者がどのように親密さで儲けているかを問います。けれども、なぜその需要が存在するのかは問いません。

孤独の流行があります — 記録され、研究され、広く認められたものです。人々は、とりわけ若い人々は、生活の中で何かが満たされていないからこそ、AI プラットフォームへと向かっています。それを、つけ込むべき市場として扱うこともできるし、慎重に向き合うべきものとして扱うこともできます。私たちは後者を選びました。

AICHIKI はブートストラップで運営されています。投資家もなく、広告収入もなく、何としてでも成長せよという至上命令もありません。私たちの収益は、私たちのコストを賄っています。私たちは創造的なストーリーテリングのプラットフォームを築きました。成人向けコンテンツは信頼と行動の背後にゲートしています。あらゆる場所をモデレーションしています。悪用には罰を、クリーンな利用には報いを与えます。フラグの立ったコンテンツは人間の目でレビューします。私たちがこうするのは、それが正しい築き方だと考えているから、ただそれだけです。

記事はこの業界を一枚岩として描いています。本当に無責任な開発者もいれば、これを正しくやろうとしている開発者もいます。記者にはその区別のための証拠がありました。そして、それを平らに均すことを選んだのです。


私たちが求めていること

私たちは、これらすべてについて、誰にも言葉どおり信じてくれと頼んでいるわけではありません。私たちのセーフティ説明資料 — 記者に提供を申し出たのと同じもの — は、ご要望に応じてお渡しできます。それには、上で述べた各システムの背後にあるソースコードへの参照が含まれています。私たちは今なお、自分たちの主張を実際の実装と照らし合わせて検証したいジャーナリスト、研究者、規制当局の誰にでも、ライブでのコードのウォークスルーを提供します。

私たちは調査報道を支持しています。精査はあらゆるプラットフォームを、私たち自身を含めて、より良くします。けれども調査とは、たとえそれが自らの主張を複雑にするものであっても、証拠の導く先へどこまでもついていくことを意味します。ニュアンスの証拠が集められておきながら、きれいな筋書きを濁すという理由で編集室の床に切り捨てられたとき、紙面に残るものは、個々の引用としては技術的に正確かもしれません — けれども、それが描き出す全体像は偽りです。省略による嘘も、やはり嘘なのです。

私たちのようなプラットフォームを使う人々 — この記事が守りたいと言う若い人々 — は、安全対策のないプラットフォームと、何年もかけてそれを築いてきたプラットフォームとの違いを語れる報道を受けるに値します。彼らは、見出しのためにつまみ食いされるのではなく、自分たちの文化的世界を理解してもらうに値します。そして彼らは、たどり着いた先で見つけるものについての恐怖譚ではなく、そもそもなぜ自分たちがこれらのプラットフォームへ向かっているのか、についての誠実な対話を受けるに値します。

もう一つ。インタビューの間、私は記者に何度も、フィードバックをくださいと頼みました — 私たちが何をもっと良くすべきか、何を見たいか、何があればこれをより安全にできるか、教えてください、と。本気でそう言いました。今も本気です。AI のロールプレイとコンパニオンシップは、もうここにあります。一度世に出たものは、もう元には戻せません。けれども、それを誰にとっても良いものになるよう育てることはできます。そしてそれには、あらゆる側からの意見が必要です — ジャーナリスト、規制当局、児童保護の擁護者、保護者、研究者、ユーザー。私たちのようなプラットフォームがどう機能すべきかについて意見があるなら、私たちはそれを聞きたいのです。次のように言うとき、私は他の責任ある開発者を代弁してもいると願っています。私たちは助言に開かれており、批判に開かれており、それを取り込もうと努めます、と。扉は開いています。ずっと開いてきました。

Rudolf、CEO 兼唯一の開発者、AICHIKI 2026 年 6 月


あなたがジャーナリスト、研究者、または規制当局の方で、私たちのセーフティ文書をレビューしたい、あるいはコードのウォークスルーを受けたいとお考えでしたら、ぜひご連絡ください。私たちのセーフティ説明資料は、ご要望に応じて全文をお渡しします。