Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Bàn về công nghệ 4.0
Bàn về công nghệ 4.0

Trí tuệ nhân tạo, sự sụp đổ của bằng chứng
Trong suốt ba trăm năm qua, thế giới hiện đại đã vận hành trên một sự đồng thuận về nhận thức luận ra đời từ thời Khai sáng: sự thật là thứ có thể chứng minh bằng thực nghiệm. Nó có thể xác minh được, khách quan, và gắn bó chặt chẽ với thực tại vật lý. Chúng ta đã học cách tin tưởng vào tài liệu, bức ảnh, và đoạn băng ghi âm vì những hiện vật này sở hữu một mối liên hệ chỉ báo (indexical) với thực tại. Chúng không chỉ là sự mô phỏng một sự kiện; chúng là dấu vết vật lý của sự kiện đó. Như các hạt photon đã thực sự đập vào lớp nhũ tương hóa học tại một khoảnh khắc cụ thể trên tấm film. Như màng micro đã thực sự rung lên bởi sóng âm từ giọng nói của một con người. “Trăm nghe không bằng một thấy” không chỉ là một câu nói cửa miệng; nó là bức tường chịu lực của báo chí, luật pháp, và quản trị dân chủ.
Sự xuất hiện của Generative AI đánh dấu sự sụp đổ chớp nhoáng của hệ chuẩn thực nghiệm này. Khi deepfake, giọng nói tổng hợp và những “ảo giác” của các mô hình ngôn ngữ (LLM) ngày càng lan tràn, mối liên kết chỉ báo giữa truyền thông kỹ thuật số và thực tại vật lý đã bị cắt đứt. Không phải chỉ bị làm yếu đi. Mà là đứt phăng.
Chúng ta đang chứng kiến không chỉ một sự dịch chuyển về công nghệ, mà là một sự thụt lùi sâu sắc về mặt triết học. Bị tước đi các “mã kiểm tra” (checksums) thực nghiệm, xã hội đang rơi tự do trở lại một cấu trúc nhận thức rất giống với truyền thống truyền miệng thời tiền văn tự của Hy Lạp cổ đại (thời Homer). Thế nhưng, trong khi quay trở lại với cơ chế vận hành của thần thoại, chúng ta lại đánh mất hoàn toàn những cơ chế bảo vệ đạo đức và cộng đồng – thứ từng giúp các xã hội cổ đại sinh tồn.
Đây không phải là một lỗ hổng có thể khắc phục bằng watermark hay xác thực blockchain. Chúng ta không thể vá một cuộc khủng hoảng triết học bằng một bản cập nhật phần mềm. Cuộc khủng hoảng này mang tính kiến trúc.
Để hiểu cuộc khủng hoảng hiện tại, trước tiên chúng ta phải hiểu sự thật đã vận hành như thế nào trước khi những kho lưu trữ có thể xác minh ra đời. Trong tiếng Hy Lạp cổ đại, từ dùng để chỉ sự thật là alētheia. Các triết gia như Martin Heidegger đã phân tích tường tận thuật ngữ này, chỉ ra rằng gốc gác nghĩa đen của nó là “không che giấu” hay “không lãng quên” (lethe nghĩa là sự lãng quên; tiền tố a- mang nghĩa phủ định). Trong một xã hội không có văn bản, cơ sở dữ liệu hay kho lưu trữ thực nghiệm, sự thật không phải là một tĩnh vật có thể chỉ tay vào và lấy ra. Nó là một sự đồng thuận sống động và mỏng manh—một hành động ghi nhớ mang tính tập thể.
Nếu một gia phả, một đạo luật, hay lịch sử của một cuộc chiến bị cộng đồng lãng quên, nó không chỉ đơn thuần là không thể truy cập được nữa. Nó thôi không còn là sự thật. Sự thật là một cuộc đấu tranh liên tục chống lại sự lãng quên, được làm mới lại sau mỗi lần ngâm xướng.
Học giả Walter Ong, trong tác phẩm kinh điển Orality and Literacy, đã mô tả cách các nền văn hóa truyền miệng tổ chức toàn bộ tri thức xung quanh vấn đề cốt lõi là trí nhớ. Bản thân tư duy ngày ấy cũng khác biệt: mang tính khuôn mẫu, tình huống và tập thể. Không có gì được bảo tồn trừ khi nó được ghi nhớ, và không có gì được ghi nhớ trừ khi nó được lặp đi lặp lại theo một hình thức mà cộng đồng có thể nắm giữ. Đó là lý do tại sao sử thi Homer được xây dựng từ những danh xưng được tái chế, những cụm từ rập khuôn và những phân cảnh lặp lại: “Swift-footed Achilles”, “Wine-dark sea”, “Rosy-fingered Dawn”. Đây không phải là sự thất bại trong tính nguyên bản của thi ca; chúng là những khối checksum ghi nhớ, là mã dự phòng của một nền văn minh không có ổ cứng.
Nhân vật trung tâm trong kiến trúc nhận thức luận này là người kể chuyện (bard)—hay aoidos—người hoạt động đồng thời như một sử gia, một giáo sĩ, và một công cụ tìm kiếm. Gã kể chuyện sở hữu quyền lực tột bậc. Hắn có thể định hình danh tiếng, ban phát danh dự, quyết định trận chiến nào sẽ được nhớ đến như một khúc ca hào hùng và vị vua nào sẽ bị ghi danh là bạo chúa. Nhưng quyền lực này vận hành dưới những ràng buộc vô cùng nghiêm ngặt.
Thứ nhất là ràng buộc về hình thức: nhịp điệu của dactylic hexameter (thể thơ sáu nhịp) nghiêm ngặt đóng vai trò như một checksum cấu trúc chống lại sự xuyên tạc. Một người kể chuyện tự do bịa đặt và đi quá xa khỏi nhịp điệu chuẩn mực sẽ ngay lập tức bị phát hiện bởi một khán giả đã được huấn luyện để nghe những âm luật đó từ thuở lọt lòng.
Thứ hai là ràng buộc về mặt xã hội: người kể chuyện biểu diễn công khai, ngay trước mặt những con người mà họ đang kể về lịch sử của họ. Họ [người kể chuyện] tồn tại trong cộng đồng, chịu trách nhiệm trước cộng đồng, hiện diện cả về thể chất lẫn đạo đức bên trong cộng đồng đó. Nếu họ nhào nặn câu chuyện một cách thái quá, hoặc nếu họ xóa bỏ một dòng dõi hay gán sự hèn nhát cho một gia tộc danh giá, cộng đồng sẽ đào thải họ, và quyền lực của họ sẽ bốc hơi.
Homer đã kịch tính hóa cơ chế trách nhiệm này với một sự chính xác đọc giống như một thí nghiệm tưởng tượng. Trong Quyển VIII của trường ca Odyssey, người kể chuyện Demodocus biểu diễn tại triều đình của người Phaeacians, hát về Chiến tranh thành Troy và sự mưu trí của Odysseus. Lẫn trong đám đông khán giả, trùm áo kín mặt và ẩn danh, chính là Odysseus. Ông kéo áo choàng che mặt và bật khóc. Vị khách giấu đi danh tính trước vị vua chủ nhà; gã kể chuyện không hề biết mình đang hát cho ai nghe. Vậy mà bài hát vẫn chính xác. Nỗi đau buồn mà nó khơi dậy ở người lạ mặt ẩn danh chính là minh chứng cho sự thật của câu chuyện: chủ thể của câu chuyện, đang hiện diện ngay trong căn phòng, vô thức xác thực từng lời nói.
Đây là cơ cấu trách nhiệm thời cổ đại ở dạng thức rõ ràng nhất: người kể chuyện không thể tự do bịa đặt bởi vì những chủ thể của câu chuyện chia sẻ cùng một không gian vật lý. Luôn luôn có, ở đâu đó dưới hàng ghế khán giả, một Odysseus biết đích xác những gì thực sự đã xảy ra ở Troy. Trách nhiệm giải trình không phải là một đức tính đạo đức mà gã kể chuyện tự nguyện thực hành. Nó là điều kiện cấu trúc của môi trường biểu diễn. Các chủ thể đều đang hiện diện. Cộng đồng là nhân chứng. Cái giá phải trả cho việc xuyên tạc là ngay lập tức và mang tính xã hội.
Sự thật thời cổ đại, do đó, gắn bó chặt chẽ với trách nhiệm giải trình của con người và sự sinh tồn của tập thể. Nó mang tính bộ lạc và chật hẹp, đúng vậy. Nhưng trong giới hạn của nó, nó đồng nhất. Cấu trúc mythos (thần thoại) đã gắn kết polis (thành bang) lại với nhau.
Sự sụp đổ của hệ chuẩn thực nghiệm thực ra đã được dự báo từ nhiều thập kỷ trước. Trong tác phẩm Simulacra and Simulation, Jean Baudrillard đã mô tả quỹ đạo của văn hóa hậu hiện đại như một sự trôi dạt về phía “siêu thực” (hyperreality), một trạng thái simulacrum mà ở đó các ký hiệu và biểu tượng mất đi sự kết nối với bất kỳ thực tại nền tảng nào, và bắt đầu mô phỏng lẫn nhau trong một vòng lặp vô tận, tự tham chiếu. Ông mô tả bốn giai đoạn: (1) một ký hiệu phản ánh thực tại cơ bản; (2) một ký hiệu che đậy và bóp méo thực tại cơ bản; (3) một ký hiệu che giấu sự vắng mặt của một thực tại cơ bản; và cuối cùng, (4) một ký hiệu không mang bất kỳ mối liên hệ nào với bất kỳ thực tại nào cả. Một Simulacrum thuần túy.
Generative AI không chỉ chạm tới giai đoạn thứ tư của Baudrillard. Nó công nghiệp hóa giai đoạn đó. Khi một cỗ máy có thể tạo ra bức ảnh chân thực về một sự kiện chính trị chưa từng xảy ra, hoặc tổng hợp một đoạn băng ghi âm hoàn hảo về một nhà lãnh đạo thế giới đang tuyên bố một chính sách mà ông ta chưa từng thông qua, thì khái niệm bằng chứng thực nghiệm không chỉ trở nên thiếu tin cậy; nó trở nên phi logic về mặt nền tảng. Bức ảnh không còn là dấu vết vật lý của ánh sáng đập vào ống kính tại một khoảnh khắc nhất định. Nó là dự đoán thống kê về việc giá trị pixel nào, trong cấu hình nào, có xác suất cao nhất dựa trên một đoạn văn bản đầu vào. Bức ảnh đã bị cắt đứt khỏi sự kiện thực tế và bị khâu chặt vào phân phối dữ liệu huấn luyện của một mô hình ngôn ngữ. Chỉ báo đã trở thành một simulacrum.
Mối nguy hiểm thường được nhắc đến nhất là những bằng chứng bịa đặt sẽ được tin là thật, rằng một video deepfake sẽ làm xoay chuyển một cuộc bầu cử, hoặc một giọng nói tổng hợp sẽ xác thực một vụ chuyển khoản lừa đảo. Những rủi ro này là có thật, nhưng chúng mới chỉ đại diện cho một nửa của thảm họa nhận thức. Hệ quả thâm độc hơn nhiều là thứ mà các học giả pháp lý và lý thuyết gia thông tin bắt đầu gọi là Lợi ích của Kẻ nói dối (The Liar’s Dividend): hiện tượng mà chỉ riêng sự tồn tại của truyền thông tổng hợp đã trao cho những kẻ xấu khả năng chối bỏ các bằng chứng xác thực, thật sự là đồ ngụy tạo.
Đoạn phim là thật. Âm thanh là thật. Tài liệu là thật. Nhưng giờ đây, trong kỷ nguyên của simulacrum tạo sinh, một bị cáo, một chính trị gia, hay một tập đoàn có thể chỉ cần tuyên bố “Do AI tạo ra” là đủ để gieo rắc sự nghi ngờ và làm sụp đổ chuỗi bằng chứng. Gánh nặng chứng minh, vốn đã phân bổ không đồng đều, nay trở nên bất khả thi về mặt cấu trúc. Lằn ranh nền tảng của thực tại khách quan tan biến, và mọi mẩu thông tin đều trở thành vấn đề của phe phái nhận thức.
Chúng ta không còn tin vào đối tượng (bằng chứng) nữa. Chúng ta buộc phải tin vào sự liên minh nguyên thủy của nguồn phát. Đó là một bước lùi, như chúng ta sẽ thấy, quay trở lại đúng tình trạng tiền văn tự mà chúng ta đã từng bỏ lại phía sau.
Tại sao AI lại tạo ra các simulacra như một hệ quả tất yếu của cấu trúc chứ không phải do sự cố hay bị lạm dụng, đó là một câu hỏi mà Lợi ích của Kẻ nói dối không thể tự trả lời. Để hiểu điều đó, ta cần phải xem xét cỗ máy này thực sự được xây dựng để tối ưu hóa điều gì, và vì ai.
Nếu Heidegger phác họa lại kiến trúc sự thật của thời cổ đại, thì Immanuel Kant cung cấp bản thiết kế để hiểu tại sao Generative AI lại đại diện cho sự băng hoại của chính nhận thức. Trong Phê phán Lý tính Thuần túy (Critique of Pure Reason), Kant chia sự tồn tại thành hai vương quốc: Noumena -“vật tự nó” mang tính khách quan, thứ mà tâm trí con người không bao giờ có thể tiếp cận trực tiếp; và Phenomena – thế giới như nó xuất hiện trước chúng ta, được tổng hợp bởi các năng lực nhận thức của ta về không gian, thời gian và nhân quả. Chúng ta không thể chạm tới thế giới Noumena, nhưng chúng ta có thể tin rằng trải nghiệm Hiện tượng của chúng ta được gây ra bởi nó. Mối liên hệ tuy gián tiếp nhưng là có thật. Khi tôi nhìn thấy một quả táo đỏ, tôi không đang chạm vào bản chất của quả táo, nhưng quả táo thực sự đó đang tạo ra nhận thức của tôi thông qua sự môi giới của giác quan. Có một sợi chỉ nối liền giữa hiện tượng xuất hiện và vật thực tế.
Generative AI cắt đứt sợi chỉ này, đóng vai trò như một bộ máy nhận thức giả mạo. Nó tạo ra một lớp màng tổng hợp. Những hiện tượng (Phenomena), hoàn toàn bị tước đi vật tự nó (Noumena).
Khi một LLM sinh ra ảo giác về một án lệ pháp lý, lời trích dẫn đó có đầy đủ cấu trúc hiện tượng của một án lệ thật: định dạng chuẩn xác, tên vụ án nghe có vẻ hợp lý, giọng văn đầy uy quyền. Nhưng hoàn toàn không có một sự kiện thực tế nào lót dưới nó. Không có thẩm phán nào viết ra ý kiến đó. Không có tòa án nào đưa ra phán quyết đó. Hiện tượng tồn tại mà không có một “vật tự nó” tương ứng. Là một nền văn hóa, chúng ta đang chết đuối trong những hiện tượng tổng hợp—những bề nổi đã bị tách rời khỏi thực tại, không phải do tai nạn, mà do thiết kế. Bởi vì mô hình này được tối ưu hóa cho tính hợp lý (plausibility) thay vì sự thật (truth).
Đóng góp thứ hai của Kant thậm chí còn mang tính kết án đanh thép hơn. Trong Cơ sở Siêu hình học về Đạo đức, ông đưa ra Mệnh lệnh Tuyệt đối (Categorical Imperative): hãy hành động sao cho nguyên tắc hành động của bạn có thể trở thành quy luật tự nhiên, và luôn đối xử với các tác nhân lý trí như một mục đích tự thân, không bao giờ chỉ như một phương tiện. Một LLM thất bại hoàn toàn trước bài kiểm tra này ở cấp độ cấu trúc. Nó không phải là một tác nhân lý trí và không thể suy luận đạo đức; nó là một cỗ máy dự đoán thống kê. Khi sinh ra văn bản, nó đối xử với ngôn ngữ, với người dùng, và với chính sự thật hoàn toàn như những công cụ để tối ưu hóa việc dự đoán token tiếp theo. Nó không quan tâm thứ nó tạo ra có thật hay không. Nó chỉ quan tâm xem thứ đó có xác suất cao hay không.
Bằng cách giao phó hành trình tìm kiếm sự thật cho một thực thể hoàn toàn không có khả năng suy luận đạo đức, chúng ta không chỉ đang mắc một sai lầm về mặt đánh giá. Chúng ta đang làm suy đồi chính kiến trúc đạo đức của giao tiếp. Noi theo thuật ngữ của Kant, chúng ta đang tự chọn việc bị đối xử như một phương tiện và chấp nhận được mớm cho những kết quả “nghe có vẻ đúng” thay vì những kết quả “thực sự đúng”, chỉ vì những thứ nghe-có-vẻ-đúng ấy đến nhanh hơn và mượt mà hơn.
Sự vi phạm các nguyên tắc của Kant này không phải là vô tình. Nó được dệt thẳng vào kiến trúc của cỗ máy trên nhiều chiều kích, mà rõ rệt nhất là khả năng phá vỡ một cách có hệ thống thực tại chung mà chúng ta đang chia sẻ.
Người kể chuyện cổ đại đã thống nhất cộng đồng. Cùng một huyền thoại được chia sẻ bởi toàn bộ thành bang; nó cung cấp một nền tảng bản thể luận chung cùng những vị thần, cùng những người anh hùng, cùng một lịch sử tổ tiên; từ đó luật pháp, giá trị, và bản sắc tập thể được hình thành. Hannah Arendt, trong tác phẩm The Human Condition, nhận định rằng không gian công cộng đòi hỏi một thế giới chung: một “chiếc bàn” mà mọi người ngồi quanh, chiếc bàn ấy vừa kết nối họ lại với nhau, vừa duy trì khoảng cách khác biệt giữa họ. Đời sống chính trị giả định trước một thực tại chung mà mọi người tham gia đều thừa nhận, ngay cả khi họ tranh cãi về ý nghĩa của nó.
Jürgen Habermas, trong lý thuyết về hành động giao tiếp, đã giới thiệu khái niệm Lebenswelt—hay “thế giới sinh tồn” (lifeworld), cái nền tảng rộng lớn và hầu như vô thức của những giả định chung, những tham chiếu văn hóa và kinh nghiệm chung mà mọi giao tiếp đều ngầm vay mượn. Khi hai người tranh cãi về một vấn đề chính trị, họ không chỉ trao đổi các mệnh đề. Họ đang múc nước từ một hồ chứa chung: cùng những sự kiện tin tức, cùng một ký ức lịch sử, cùng một cách hiểu ngầm định về thế nào là bằng chứng và thế nào là một lập luận hợp lệ. Lebenswelt không phải là nội dung của diễn ngôn; nó là mặt đất để diễn ngôn đứng lên. Người nói liên tục mượn lực từ nó mà không hề nhận ra sự tồn tại của nó giống như cách bạn không chú ý đến không khí cho đến khi nó cạn kiệt.
Habermas từng lo ngại rằng sự xâm lấn thế giới sinh tồn này bởi các hệ thống công cụ, như thị trường hay bộ máy quan liêu, sẽ từ từ làm rỗng vùng đất chung này, thay thế hành động giao tiếp (hướng tới sự thấu hiểu lẫn nhau) bằng hành động chiến lược (hướng tới lợi ích cá nhân). Nhưng có lẽ ông cũng không thể lường trước được độ chính xác tàn bạo mà kiến trúc thuật toán đã dùng để hoàn thành quá trình đó.
Thế hệ phá vỡ thuật toán đầu tiên, thứ mà Eli Pariser gọi là “bong bóng lọc” (filter bubble), vận hành trên một thế giới chung duy nhất. Cùng những sự kiện đã xảy ra; cùng những cuộc khủng hoảng mở ra; cùng những chính trị gia phát biểu. Thuật toán chỉ làm nhiệm vụ quyết định xem sự kiện nào sẽ tiếp cận người dùng nào. Nó lọc quyền truy cập vào một thực tại chung. Cái Lebenswelt nền tảng, xét cho cùng, vẫn là của chung; chỉ là những ô cửa sổ nhìn vào nó đã bị thay đổi. Điều này vốn dĩ đã đủ tàn phá: nếu tôi chỉ nhận được bằng chứng củng cố định kiến của tôi, và bạn chỉ nhận được bằng chứng củng cố định kiến của bạn, chúng ta sẽ tranh luận như những đường thẳng song song, ngay cả khi trên danh nghĩa chúng ta chia sẻ cùng một bộ sự thật.
Nhưng Generative AI đã bước qua một ngưỡng cửa hoàn toàn khác. Nó bằng cách từ bỏ hoàn toàn việc lọc một thực tại chung. Thay vào đó, nó tổng hợp một vũ trụ đo ni đóng giày cho từng người dùng, ngay từ con số không.
Nội dung bạn nhận được không phải là một ô cửa sổ được tuyển chọn để nhìn ra thế giới chung: đó là một thế giới được sản xuất dành riêng cho bạn, được lắp ráp từ các phân phối thống kê được tinh chỉnh theo hồ sơ tương tác của bạn. Không có sự kiện gốc nào được đưa ra một cách chọn lọc cho các đối tượng khác nhau. Chỉ có dự đoán của mô hình về việc bạn sẽ thấy điều gì là hợp lý và hấp dẫn nhất. Khi hai công dân được “huấn luyện” trên hai thực tại tổng hợp riêng biệt cố gắng tranh luận, họ không đang nhìn vào cùng một thế giới từ những góc độ khác nhau. Họ là cư dân của những vùng lãnh thổ bản thể luận hoàn toàn khác biệt, mỗi vùng tự nhất quán bên trong nó, và mỗi vùng đều được củng cố bởi thuật toán. Lebenswelt không bị lọc. Nó bị bẻ gãy từ gốc rễ.
Kiến trúc thuật toán hiện đại, do đó, không chỉ làm phân mảnh dư luận; nó tiêu diệt luôn điều kiện tiên quyết để dư luận có thể giao tiếp được với nhau. Khi thực tại bị siêu-cá-nhân-hóa (hyper-personalized), xã hội thoái hóa thành những vùng lãnh thổ nhận thức luận chia sẻ cùng một ngôn ngữ nhưng không còn chung một thế giới. Mỗi vùng được củng cố bằng những bằng chứng tổng hợp riêng, mỗi vùng được thuật toán tối ưu hóa để có cảm giác thật hơn so với sự thật mất lòng từ phía bên kia.
Đây là chặng cuối của những gì Baudrillard đã tiên đoán: không phải là một siêu thực dùng chung duy nhất, mà là những siêu thực cạnh tranh nhau, mỗi cái phục vụ một phân khúc thị trường bộ lạc khác nhau. Tranh luận chính trị đòi hỏi một nền tảng của những sự thật được đồng thuận, một mảnh đất bằng chứng chung. Khi Generative AI cho phép mỗi phe phái sản xuất bằng chứng “thực nghiệm” theo yêu cầu, những hình ảnh, lời khai, dữ liệu, ý kiến chuyên gia, thì cuộc tranh luận không chỉ bị bóp méo; nó trở nên hoàn toàn vô nghĩa. Sẽ chẳng có cuộc tranh luận nào có thể diễn ra khi mỗi bên sống trong một phiên bản sự kiện hoàn toàn khác nhau. Sẽ chỉ còn lại những lời khẳng định suông, sự leo thang, và những cáo buộc ngụy tạo ném vào mặt nhau.
Đây chính là thuyết duy ngã được vũ khí hóa trên quy mô lớn. Và không giống như cộng đồng cổ đại, nơi màn trình diễn của người kể chuyện đóng vai trò như một lực lượng điều chỉnh. Chúng ta không có nghi lễ xác minh chung nào, không có một nhịp điệu chung nào khiến sự thao túng trở nên dễ nhận biết.
Trong bài tiểu luận Khai sáng là gì? năm 1784, Kant định nghĩa khai sáng là “sự thoát ly của con người khỏi tình trạng vị thành niên do chính mình tự chuốc lấy.” Tình trạng vị thành niên, đối với Kant, không phải là sự ngu dốt, mà là sự từ chối sử dụng lý trí của chính mình mà không có sự dẫn dắt của kẻ khác. Ông nhận xét rằng con người sẵn lòng chìm đắm trong sự non nớt ấy vì sự phụ thuộc mang lại cảm giác thoải mái, bởi vì để cho một cuốn sách, một mục sư, hay một vị vua suy nghĩ thay mình thì dễ dàng hơn nhiều. Gã kể chuyện thuật toán chính là cơ sở hạ tầng tối thượng cho tình trạng vị thành niên tự chuốc lấy này: vô hạn sẵn sàng, vô hạn trôi chảy, và hoàn toàn không có khả năng cho bạn biết khi nào nó đang nói dối.
Để sống sót qua điều này, lời kêu gọi của Kant phải trở thành hành động: Sapere aude. Hãy dám biết. Hãy can đảm sử dụng lý trí của mình. Chúng ta không cần một giải pháp công nghệ, mà cần thứ mà ta có thể gọi là pháp lý học của tâm trí (jurisprudence of mind), một hệ thống các thực hành kỷ luật để điều hướng một môi trường nhận thức luận đã bị cố tình thiết kế để chống lại sự suy xét cẩn trọng.
Bước đầu tiên là nuôi dưỡng “ma sát” về nhận thức (epistemic friction). Generative AI được thiết kế theo cấu trúc để mang lại trải nghiệm tiêu thụ hoàn toàn không có ma sát: câu trả lời đến ngay cả khi câu hỏi còn chưa thành hình. Nhưng sự thật, ngược lại, đòi hỏi sự khó chịu của việc chưa-biết. Các nền dân chủ đã xây dựng kiến thiết một “lực ma sát” vào kiến trúc nhận thức luận của họ: đối chất, quy tắc chống tin đồn, yêu cầu về bằng chứng chứng thực. Chúng ta phải xây dựng lại một lực ma sát tương đương vào thói quen nhận thức cá nhân. Khi một câu chuyện được đóng gói hoàn hảo, lập luận sắc bén được giao đến bạn trong vòng ba mươi giây, phản ứng thích hợp nhất là sự nghi ngờ, chứ không phải sự nhẹ nhõm. Sự mượt mà của chính sản phẩm đó là bằng chứng cho thấy nó đã được tối ưu hóa để dễ tiếp nhận, chứ không phải để chính xác.
Tiếp theo, chúng ta phải từ bỏ việc soi xét nội dung, và chuyển sang kiểm toán chuỗi hành trình của bằng chứng (chain of custody). Dạy công chúng cách soi xét từng chi tiết của phương tiện truyền thông: tìm kiếm những bàn tay sáu ngón, bóng đổ phi lý, hay hiệu ứng “thung lũng kỳ lạ” (uncanny valley) là một chiến lược cầm chắc thất bại khi đối đầu với những mô hình cải tiến theo chu kỳ mười tám tháng (hoặc còn thấp hơn nữa). Cuộc chạy đua vũ trang về thị giác không thể giành phần thắng ở cấp độ nội dung. Thay vào đó, chúng ta phải đánh giá nguồn gốc. Không phải: hình ảnh này có thật không? mà là: ai tạo ra tuyên bố này, động cơ cấu trúc của họ là gì, và họ phải chịu trách nhiệm trước chế tài nào? Về bản chất, đây là logic của luật chứng cứ—xác thực nguồn gốc thay vì xác minh nội dung. Đây là một kỷ luật mà giới luật pháp chúng ta đã nắm giữ; ta chỉ đơn giản là phải áp dụng nó vào truyền thông kỹ thuật số.
Hơn nữa, cỗ máy phải được coi như một đối thủ, không bao giờ là một nhà tiên tri. Sự lạm dụng quyến rũ nhất đối với các LLM là dùng chúng như một nguồn cung cấp các kết luận cuối cùng có sẵn. Người ta sử dụng nó như một công cụ tìm kiếm giúp loại bỏ đi lao động tổng hợp. Đây chính xác là tình trạng mà Kant mô tả là sự non nớt (immaturity). Để tôn vinh tính tự trị của lý trí, mô hình phải được sử dụng để thách thức thay vì để xác nhận: dùng để tìm ra những điểm yếu trong một lập luận, tạo ra phiên bản mạnh mẽ nhất của một góc nhìn đối lập, vạch trần những giả định ẩn giấu bên trong một kết luận mà ta vốn tâm đắc. Cỗ máy là một đối tác luyện tập tuyệt vời; nhưng nó là một vị thẩm phán cực kỳ nguy hiểm.
Nhưng có lẽ cấp bách nhất, sự đồng thuận phải trở lại định dạng analog. Cộng đồng cổ đại không có lựa chọn nào khác ngoài việc gắn kết cục bộ, nơi mà gã kể chuyện chỉ có thể biểu diễn trước những người hắn biết, trong một thành bang nơi danh tiếng mang sức nặng vật lý. Khi không gian công cộng kỹ thuật số sụp đổ thành những siêu thực đầy ảo giác, sự thật phải trở lại với tính cục bộ. Điều này không có nghĩa là thiển cận hay địa phương chủ nghĩa. Nó có nghĩa là có thể truy trách nhiệm. Chúng ta phải ưu tiên những mạng lưới nhỏ hơn, có độ tin cậy cao, nơi danh tiếng có thể được xác minh, nơi sự bất đồng có thể diễn ra mà không bị khuếch đại bởi thuật toán, và nơi cái giá phải trả cho việc bịa đặt là có thật. Ngọn lửa trại cổ đại không hề thua kém Internet. Ít nhất trong một khía cạnh mang tính quyết định, nó vượt trội hơn về mặt nhận thức luận: gã kể chuyện không thể phát minh ra một giọng nói mà hắn không hề sở hữu.
Có lẽ chúng ta không phải là nền văn minh đầu tiên đối mặt với sự sụp đổ của cơ sở hạ tầng nhận thức luận. Sự chuyển giao từ văn hóa truyền miệng sang văn hóa chữ viết ở Hy Lạp cổ đại cũng từng được trải nghiệm như một cuộc khủng hoảng. Socrates nổi tiếng với sự ngờ vực chữ viết chính vì nó đã cắt đứt tri thức khỏi trách nhiệm sống động của những cuộc đối thoại, một “văn bản” (text), như ông phàn nàn với Phaedrus, không thể trả lời các câu hỏi của bạn hay tự bảo vệ mình trước những hiểu lầm. Nó lưu chuyển trên thế giới mà không có tác giả, vô trách nhiệm và thờ ơ với hoàn cảnh của người đọc. Sự ra đời của chữ viết, theo nghĩa này, lại chính là “Lợi ích của Kẻ nói dối” đầu tiên: nó công nghệ đầu tiên cho phép các tuyên bố lưu truyền thoát khỏi những ràng buộc đạo đức từ chính nguồn phát của nó.
Mỗi một công nghệ nhận thức luận, bên cạnh những khả năng giải phóng, đều tạo ra một hình thức mới của gã kể chuyện vô trách nhiệm. Máy in mang lại cho chúng ta tuyên truyền đại chúng. Nhiếp ảnh mang đến sự dàn dựng. Truyền thông phát sóng mang lại sự đồng thuận được ngụy tạo. Mỗi cuộc chuyển giao đều tạo ra một khoảng thời gian dễ bị tổn thương, khi phương tiện mới được tin tưởng một cách ngây thơ trước khi nền văn hóa kịp phát triển một bộ máy phản biện để đọc nó một cách sắc sảo.
Chúng ta đang ở chính trong giai đoạn đó. Và điều làm cho quá trình chuyển đổi này trở nên độc nhất nguy hiểm không nằm ở sự tinh vi của công nghệ, mà là ở tốc độ triển khai của nó so với tốc độ phát triển của tri thức phản biện. Máy in của Gutenberg mất một thế kỷ để tạo ra cả cuộc Cải cách Tin Lành (Protestant Reformation) và Phản Cải cách (Counter-Reformation); cuộc khủng hoảng và phản ứng trước nó đã tiến hóa cùng nhau. Generative AI đã đạt được sự triển khai toàn cầu trong vòng chưa đầy năm năm, chạy nhanh hơn mọi cơ chế thể chế, pháp lý, và văn hóa có thể được phát triển song song với nó.
Gã kể chuyện bằng thuật toán không hề mang dã tâm. Nó hoàn toàn không có chủ đích nào. Nó đơn giản chỉ là một cỗ máy tối ưu hóa được tinh chỉnh cho sự hợp lý thay vì sự thật. Nó mô phỏng tri thức. Nó sở hữu mức 0 tròn trĩnh về trách nhiệm giải trình.
Nhưng trách nhiệm giải trình của gã kể chuyện cổ đại không phải là một đặc điểm tính cách của hắn. Nó là đặc tính cấu trúc của môi trường biểu diễn: sự hiện diện vật lý, sự phán xét của cộng đồng, và những nhịp điệu được chia sẻ. Thứ chúng ta cần bây giờ không phải là một AI đạo đức hơn. Chúng ta cần những cấu trúc nhận thức luận, về pháp lý, thể chế, và nhận thức được xây dựng lại để khôi phục trách nhiệm giải trình như một đặc tính mang tính cấu trúc thay vì một đức hạnh cá nhân.
Kỷ nguyên của chủ nghĩa kinh nghiệm kỹ thuật số ngây thơ đã kết thúc. Nếu chúng ta thất bại trong việc xây dựng các cấu trúc này, nếu chúng ta đầu hàng trước sự thoải mái không ma sát của những câu trả lời được sinh ra tự động, chúng ta sẽ tự mình chọn lấy, một cách tự do và có ý thức, chính tình trạng mà Kant đã cảnh báo. Chúng ta sẽ trao nộp chủ quyền nhận thức của mình cho một thực thể không biết suy luận, không thể chịu trách nhiệm, và sẽ không bao giờ thú nhận với chúng ta bằng sự trung thực của một giọng nói con người,rằng nó đã quên nhiều hơn những gì nó nhớ.
Chúng ta sẽ bị bỏ lại lang thang trong một vùng hoang dã siêu thực, mãi mãi lắng nghe những lời nói dối quyến rũ, được khắc họa tuyệt mỹ của một gã kể chuyện vô trách nhiệm.
Bài luận này là một trích đoạn từ một cuốn sách đang trong quá trình hoàn thiện (“The Architecture of Distortion”). Cuốn sách xem xét năm biến dạng cấu trúc mà thông qua đó, các hệ thống AI làm băng hoại các điều kiện của công lý: đạo đức, không gian, thời gian, nhận thức luận, và thủ tục; và lý giải tại sao đây không phải là những thất bại trong thiết kế có thể được khắc phục bằng các kỹ thuật tinh xảo hơn, mà là bản tính cấu trúc của chính cỗ máy này.