Khi bạn san phẳng cả một quang phổ, bạn giết chết động lực

Một suy ngẫm rộng hơn về hiện trạng của nhập vai AI, báo chí điều tra, và vì sao việc làm sai điều này gây tổn hại cho chính những người mà tất cả chúng ta đều đang cố bảo vệ.

Đọc thêm bối cảnh:
Phản hồi chi tiết từng điểm của chúng tôi: Chúng tôi đã được phỏng vấn suốt một giờ. Đây là những gì không được đưa vào bài báo.
Bài báo châm ngòi cho nó: Meet the Developers Cashing In on AI Intimacy — The Bureau of Investigative Journalism, ngày 7 tháng 6 năm 2026
Bản tiếng Pháp: « C'est effrayant de voir à quel point les gens font confiance » : ces développeurs de chatbots qui profitent de l'économie de l'intimité — Le Monde, ngày 7 tháng 6 năm 2026

Hôm nay chúng tôi đã đăng một phản hồi cho bài báo của Bureau of Investigative Journalism về các nền tảng nhập vai và bạn đồng hành AI. Bài viết đó đi vào cụ thể — nó nêu chi tiết những gì AICHIKI thực sự đã xây dựng và những gì bài báo bỏ qua. Bài này thì nói về bức tranh lớn hơn, bởi những vấn đề của bài báo ấy đi xa hơn nhiều so với chuyện của riêng chúng tôi.

Luận điểm rộng hơn của bài báo — rằng các nền tảng AI nhỏ đang mọc lên với những biện pháp an toàn yếu ớt và khai thác những người dùng cô đơn — đúng một phần. Trong lĩnh vực này có những nhà phát triển thực sự không hề có kiểm duyệt, không hề có rào chắn độ tuổi, và cũng không có ý định xây dựng chúng. Một số người đã nói thẳng như vậy trước ống kính. Hãy đưa tin về điều đó. Làm ơn.

Vấn đề là cuộc điều tra phát hiện ra cả một quang phổ nhưng lại đăng tải một khối đồng nhất. Những nền tảng không có một biện pháp an toàn nào bị đặt cạnh những nền tảng có hạ tầng kiểm duyệt nhiều lớp, và bài báo đối xử với chúng như cùng một câu chuyện. Bằng chứng về sự khác biệt được thu thập rồi bị vứt bỏ vì nó làm phức tạp một mạch chuyện gọn gàng.

Bạn hoàn toàn có thể dựng nên một câu chuyện gây hiểu lầm sâu sắc chỉ từ những câu trích có thật, miễn là bạn kiểm soát được câu nào xuất hiện và chúng được dựng trong khung nào. Từng câu trích riêng lẻ có thể chính xác trong khi bức tranh tổng thể mà chúng vẽ ra lại sai. Và đó chính là điều xảy ra khi bạn viết một bài báo theo lối ngược — bắt đầu từ kết luận, chọn lọc bằng chứng minh họa cho nó, rồi lặng lẽ xếp xó bất cứ thứ gì chỉ về hướng ngược lại.

Có một tiền lệ nổi tiếng cho kiểu phương pháp luận này trong khoa học. Vào thập niên 1950, nhà sinh lý học người Mỹ Ancel Keys đặt ra mục tiêu chứng minh rằng chất béo trong chế độ ăn gây ra bệnh tim. Ông thu thập dữ liệu từ 22 quốc gia. Khi kết quả về, một số quốc gia không ủng hộ giả thuyết của ông — dân số của họ ăn rất nhiều chất béo nhưng tỷ lệ bệnh tim lại thấp. Thế là Keys loại những quốc gia đó ra khỏi tập dữ liệu và công bố Seven Countries Study của mình chỉ bằng những dữ liệu xác nhận điều ông vốn đã tin. Nghiên cứu ấy định hình chính sách dinh dưỡng toàn cầu suốt nhiều thập kỷ. Các chính phủ thúc đẩy chế độ ăn ít chất béo dựa trên nó. Ảnh hưởng là khổng lồ. Vậy mà toàn bộ chuyện đó được dựng trên bằng chứng đã được nhặt nhạnh chọn lọc — dữ liệu thật, nhưng trình bày một cách có chọn lọc để hậu thuẫn cho một kết luận đã tồn tại trước khi nghiên cứu bắt đầu.

Bài báo của TBIJ đi theo đúng phương pháp luận ấy. Phóng viên thu thập thông tin từ nhiều nền tảng. Một phần thông tin đó cho thấy có những nhà phát triển đang đổ công sức kỹ thuật nghiêm túc vào an toàn. Thông tin đó bị gạt sang một bên. Những gì còn lại kể nên một câu chuyện gọn gàng, đáng báo động — về mặt kỹ thuật được dựng trên những câu trích có thật, trừ đi những điểm dữ liệu lẽ ra sẽ làm phức tạp mọi thứ. Keys nhìn vào những quốc gia không khớp với luận điểm của mình rồi xóa chúng khỏi nghiên cứu. Bài báo này nhìn vào những kiến trúc an toàn không khớp với luận điểm của nó rồi xóa chúng khỏi câu chuyện.

Việc san phẳng quang phổ để lại những hậu quả vượt ra ngoài những nhà phát triển bị khắc họa sai lệch.

Một nhà phát triển trong lĩnh vực này lúc này có hai lựa chọn. Bỏ ra hàng tháng trời xây dựng các hệ thống tin cậy, kiểm duyệt nội dung, phát hiện lạm dụng, các đường ống an toàn cho hình ảnh — công sức kỹ thuật thực thụ tiêu tốn thời gian thật và tiền thật. Hoặc bỏ qua tất cả những thứ đó và tung ra một nền tảng trơ trụi với một API key và một trang thanh toán.

Nếu các nhà phát triển có trách nhiệm và những kẻ vô trách nhiệm đều nhận được cách đối xử như nhau từ báo chí — cùng một bài báo, cùng một khung dựng, cùng một lời cáo buộc ngầm — thì thông điệp gửi đến mọi nhà phát triển mới bước chân vào lĩnh vực này thật rõ ràng: làm an toàn chẳng được trả công. Bạn sẽ bị khắc họa y như nhau dù thế nào đi nữa. Nước đi hợp lý, với bất kỳ ai không có một lương tâm cá nhân mạnh mẽ, là bỏ qua hoàn toàn khoản đầu tư đó.

Và đó mới là thiệt hại thực sự mà cách đưa tin như thế này gây ra. Đối xử với mọi nền tảng như nhau chủ động triệt tiêu động lực cho chính hành vi mà bài báo tuyên bố mong muốn. Một cấu trúc động lực phụ thuộc hoàn toàn vào việc từng nhà phát triển có lương tâm là một cấu trúc mong manh. Nó lẽ ra phải tưởng thưởng cho việc làm điều đúng đắn, vậy mà cách đưa tin không thể phân biệt giữa nỗ lực và sự cẩu thả lại đẩy theo hướng ngược lại.

Câu hỏi về sự cô đơn lơ lửng trên tất cả những điều này, và gần như không ai trong cuộc đối thoại công khai chịu đối diện với nó một cách trung thực.

Người trẻ đang tìm đến các nền tảng nhập vai và bạn đồng hành AI bởi có điều gì đó trong cuộc sống của họ đang không được đáp ứng — sự kết nối, sự thể hiện sáng tạo, cảm giác được lắng nghe. Nhu cầu ấy là có thật, và nó sâu sắc. Cấm mọi nền tảng AI vào ngày mai thì nhu cầu đó cũng không biến mất. Nó vẫn không được đáp ứng, hoặc nó tìm đến những lối ra tăm tối hơn với thậm chí còn ít sự giám sát hơn.

Bài báo của TBIJ coi nhu cầu như một điều hiển nhiên và chỉ tập trung hoàn toàn vào phía cung — ai đang xây dựng các nền tảng này và họ vô trách nhiệm đến đâu. Cách dựng đó cho phép cuộc đối thoại có vẻ hữu ích mà không bao giờ chạm tới câu hỏi khó hơn: vì sao có nhiều người đến vậy, đặc biệt là người trẻ, lại tìm đến AI ngay từ đầu? Nếu bạn nghiêm túc về việc bảo vệ con người, bạn phải đối diện với điều đang đẩy họ tới đó. Những câu chuyện kinh dị về thứ họ tìm thấy khi đến nơi không thể thay thế cho cuộc đối thoại ấy.

Bối cảnh pháp lý cũng chẳng giúp ích gì. Những luật lệ và khung quy định đang được áp lên AI hội thoại vốn được thiết kế cho mạng xã hội — các luồng nội dung, thuật toán gợi ý, động lực người theo dõi, sự chia sẻ lan truyền. Một cuộc trò chuyện với chatbot khác về mặt cấu trúc so với một luồng TikTok. Các tác hại vận hành khác nhau, các cơ chế vận hành khác nhau, và các biện pháp can thiệp cũng cần vận hành khác nhau. Nhưng các cơ quan quản lý lại với tay lấy những công cụ họ vốn đã có sẵn, mà những công cụ ấy lại được tạo ra cho một vấn đề khác.

Đối xử với các nền tảng AI như những sản phẩm có yêu cầu về an toàn sản phẩm — các tiêu chuẩn nền tảng, các hồ sơ rủi ro phân cấp, không gian cho những cách tiếp cận khác nhau để đáp ứng chúng — thì gần với đúng hơn so với phần lớn những gì đang được đề xuất hiện nay. Các khung an toàn sản phẩm cho phép bạn đặt ra những mức tối thiểu thực sự trong khi vẫn thừa nhận rằng một đội hai người và một tập đoàn tỷ đô sẽ đáp ứng chúng theo những cách khác nhau. Những lệnh cấm trên diện rộng và những quy tắc rập khuôn áp chung cho tất cả sẽ đẩy các nhà phát triển có trách nhiệm ra ngoài và gần như chẳng làm gì được để ngăn những kẻ vô trách nhiệm, vì họ sẽ chỉ đơn giản là chuyển sang khu vực pháp lý khác hoặc phớt lờ việc thực thi.

Tuy nhiên, điều khiến tôi lo lắng nhất là khoảng cách văn hóa.

Những người đang đưa ra các quyết định chính sách về những nền tảng này — các cơ quan quản lý, các nhà lập pháp, các ban biên tập — phần lớn không dùng chúng và không hiểu nền văn hóa quanh chúng. Họ đang dựa vào cách đưa tin mà, như trải nghiệm của chúng tôi cho thấy, tước bỏ ngữ cảnh văn hóa đi để đổi lấy sự rõ ràng và sức tác động.

Bài báo của TBIJ đưa ra một đoạn trao đổi với chatbot về chuyện "cùng nhau tự sát" như bằng chứng về nội dung gây hại. Với bất kỳ ai không quen thuộc với anime, điều đó nghe như một AI đang khuyến khích tự gây hại cho bản thân. Với hàng chục triệu người hâm mộ Bungo Stray Dogs, nó được nhận ra ngay lập tức là nét tính cách đặc trưng của Osamu Dazai — một trò hài kịch đen chạy xuyên suốt, định hình một trong những nhân vật được yêu thích nhất trong manga hiện đại. Đặt trong ngữ cảnh, nó cũng đáng báo động cỡ như một con bot Sherlock Holmes nói "Thật sơ đẳng, Watson thân mến."

Một độc giả lớn tuổi đọc "AI khuyến khích cùng nhau tự sát" và kinh hoàng, điều đó dễ hiểu thôi. Một độc giả trẻ tuổi từng xem BSD đọc đúng câu trích đó và biết rằng ý nghĩa đã bị tước đi. Độc giả lớn tuổi bước đi với thông tin sai lệch. Độc giả trẻ tuổi bước đi sau khi đã học được rằng những người viết về thế giới của họ không hề hiểu nó — và bài học ấy lan ra rất nhanh. Nếu họ hiểu sai về Dazai, thì họ còn hiểu sai về điều gì nữa? Tại sao tôi lại phải tin bất kỳ điều gì khác trong bài báo này? Tại sao tôi lại phải tin những thể chế đứng sau nó?

Sự bào mòn lòng tin ấy đang diễn ra một cách âm thầm và nó nguy hiểm. Một thế hệ chứng kiến văn hóa của mình liên tục bị xuyên tạc bởi chính những thể chế tuyên bố bảo vệ họ sẽ không trở nên thận trọng hơn. Họ ngừng lắng nghe. Và khi họ ngừng lắng nghe, lời cảnh báo thực sự tiếp theo — về một nền tảng thực sự nguy hiểm — sẽ bị bỏ ngoài tai cùng với mọi thứ khác.

Ngữ cảnh văn hóa là điều kiện tiên quyết để được chính những người mà bạn nói rằng mình đang bảo vệ xem trọng, chứ không phải một lớp đánh bóng tùy chọn. Thiếu nó, bạn chỉ đang nói với một nhóm khán giả vốn đã đồng ý với bạn. Còn những người cần nghe thông điệp ấy nhất thì đã bỏ ngoài tai từ lâu.

Nhập vai và bạn đồng hành AI đã hiện diện rồi. Không ai có thể thu lại chuyện đã rồi nữa. Câu hỏi là liệu chúng ta sẽ dựng nên một khung quy định thấu đáo quanh nó — một khung biết phân biệt giữa nỗ lực và sự cẩu thả, đối diện một cách trung thực với lý do nhu cầu tồn tại, và tôn trọng thế giới văn hóa mà nó đang cố quản lý — hay chúng ta cứ tiếp tục viết đi viết lại đúng một câu chuyện hù dọa ấy trong khi những vấn đề thực sự vẫn không được giải quyết.

Chúng tôi đã và đang cố gắng làm điều này cho đúng. Chúng tôi mong rằng cuộc đối thoại quanh mình cũng sẽ cố gắng như vậy.

— Rudolf, AICHIKI Tháng 6 năm 2026

Khi bạn san phẳng cả một quang phổ, bạn giết chết động lực ​

Khi bạn san phẳng cả một quang phổ, bạn giết chết động lực