Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Bàn về công nghệ 4.0
Bàn về công nghệ 4.0

Trong kỷ nguyên GenAI, data literacy là kỹ năng sinh tồn, giúp ta lọc nhiễu, kiểm nguồn, đặt câu hỏi đúng, tránh bẫy tin giả và nội dung giật gân.
Tin giả không mới. Điều mới là tốc độ và quy mô mà GenAI và các nền tảng thuật toán đang bơm thông tin vào mắt chúng ta mỗi ngày.
Hãy cùng tìm hiểu: tại sao tin giả lại thường chiến thắng, cách nào để nhận biết sự trung thực của tin
Theo báo cáo Digital 2024, người dùng internet trung bình dành 6 giờ 40 phút mỗi ngày để online. Trong đó, mạng xã hội đã chính thức trở thành “cửa ngõ” chính đến với tin tức, nhưng “nguồn tin” này không phải là các tòa soạn, mà là một dòng chảy vô tận được quyết định bởi thuật toán.[1]
Với chỉ 40% người dùng còn tin tưởng vào tin tức nói chung (theo Reuters Institute 2025, p5), một khoảng trống lòng tin khổng lồ đã mở ra. Khoảng trống đó đang được lấp đầy bởi các nguồn tin thứ cấp, không được kiểm chứng và được tối ưu hóa để gây chú ý, không phải để cung cấp sự thật.[2]
Trong bối cảnh đó, data literacy không chỉ là đọc số và vẽ biểu đồ. Đó là năng lực sinh tồn để định vị và bám trụ vào sự thật.
Vấn đề không chỉ là chúng ta lướt nhanh. Ở cấp độ thói quen, rất nhiều người còn không nhấp vào liên kết để đọc. Một nghiên cứu của Đại học Columbia và Inria cho thấy khoảng 59% liên kết được chia sẻ trên mạng xã hội không hề được chính người chia sẻ nhấp vào.[3]
Ngay cả với số ít người còn lại chịu nhấp vào, nghiên cứu năm 2023 từ MSN cho thấy khoảng ¼ phân phối có thời gian đọc từ 0 đến 30 giây. Điều này khẳng định người dùng sẽ rời trang rất sớm nếu nội dung đầu không được tối ưu hóa bằng các nội dung gây sự chú ý. Rõ ràng với thời gian ngắn như vậy, người dùng không có đủ thời gian để xem xét mọi bằng chứng, lý lẽ một cách cẩn thận.[5] Các vấn đề chân thực, lại cần phải tốn rất nhiều thời gian để xây dựng, chứng minh, trong khi đó các tin sốc, giật gân thì nhanh chóng thu hút được sự chú ý.
Dữ liệu từ Chartbeat cho thấy chỉ trong một năm (2022-2023), lưu lượng truy cập từ Facebook đến các trang tin tức đã giảm 48%. Điều này có nghĩa người dùng đang đọc một “phiên bản tin tức”[4] ngay trên nền mạng xã hội – qua tiêu đề, tóm tắt, và ngày càng nhiều qua video ngắn. Hành động “nhấp vào để đọc bài viết” đang dần trở thành dĩ vãng.
Khi cần tìm hiểu thông tin, chỉ còn 22% người dùng chủ động truy cập trực tiếp vào các trang báo.[6] 55% người dùng thường tìm đến các nền tảng video và mạng xã hội. thông qua việc theo dõi các cá nhân và influencer để cập nhật tin tức, thay vì các nhà báo chuyên nghiệp.
Khi luật chơi của sự chú ý thay đổi, đây là môi trường cho tin giả phát triển, bởi lẽ người dùng không có thời gian để xem xét, đánh giá tính chân thực của thông tin.
Một nghiên cứu kinh điển của MIT năm 2018 trên Twitter đã chứng minh: tin giả lan truyền nhanh hơn và có khả năng được retweet cao hơn 70% so với tin thật.[7] Một nghiên cứu khác trên tạp chí PNAS Nexus (2024) càng củng cố điều này. Sau khi phân tích 155 tin tức lan truyền mạnh nhất, họ phát hiện ra rằng tỉ lệ tin tức sai lệch đã được kiểm chứng là 26.6%, và có thể tăng lên đến 34.2% (tức khoảng một phần ba) nếu tính cả những tin tức “không thể kết luận” – những tin mập mờ đến mức ngay cả chuyên gia cũng không thống nhất được. [8]
Đối với Tiktok, đây là một nền tảng rất khó đo lường về mức độ đáng tin cậy của nội dung, bởi bản chất của loại dữ liệu là các video gây khó khăn trong phân tích hàng loạt, như kết luận của Reuter cũng đã nêu.[9]
Một báo cáo của NewsGuard (2022) cho thấy gần 20% video trong kết quả tìm kiếm về các chủ đề thời sự chứa thông tin sai lệch, và thuật toán có thể đẩy các nội dung này đến người dùng mới chỉ trong vòng 40 phút.[10]

Vấn đề còn nghiêm trọng hơn trong các chủ đề sức khỏe. Tờ báo The Guardian thực hiện một nghiên cứu quy mô nhỏ trên 100 video chứa hashtag #mentalhealthtips thì có tới 52 video chứa các lời khuyên không đúng sự thật.[11] Một nghiên cứu khác thực hiện bởi Đại học Chicago với các từ khóa chuyên ngành #sinusitis, #sinus, and #sinusinfection cũng thể hiện mức độ tin giả trên tiktok lên tới 44%.[12]
Kết quả cuối cùng là một môi trường thông tin mà ở đó sự thật, vốn thường phức tạp và ít gây sốc, phải vật lộn để tồn tại. Cuộc chơi vốn đã không công bằng ngay từ đầu.
Trong nhiều trường hợp, sai lầm trong tư duy và nhận thức không chỉ được hình thành bởi việc thiếu dữ kiện, mà nó còn được củng cố rất nhiều bởi các rào cản vô hình làm sai lệch tư duy nhận thức, khiến chúng ta cảm thấy được củng cố thêm niềm tin vào tin giả
Nhịp sống hiện đại khiến ta thiếu thời gian và động lực để phản biện, trong khi bộ não lại có xu hướng ưu tiên sự thoải mái. Chúng ta tìm kiếm những thông tin thuận tiện và trùng với niềm tin sẵn có – một hiện tượng tâm lý học gọi là thiên kiến xác nhận (confirmation bias).
Nghiên cứu trên tạp chí PNAS Nexus cũng khẳng định điều này, chỉ ra rằng các yếu tố như quan điểm chính trị và lòng tin có sẵn vào khoa học đóng vai trò quyết định trong việc một thông điệp có được chấp nhận hay không. Tin giả thường thắng không phải vì logic, mà vì nó khai thác được sự phân cực và củng cố những gì chúng ta đã muốn tin.[13]
Thói quen này thể hiện rất rõ trong văn hóa tranh luận ở Việt Nam, khi nhiều người chỉ cần một URL bất kỳ để dẫn chứng cho quan điểm của mình, bất kể đó là nguồn nào: web xào nấu, báo câu view, hay thậm chí những web nghe chừng uy tín nhưng lại được biên tập cẩu thả (copy & paste nội dung). Miễn là nó ủng hộ luận điểm, nguồn gốc hay tính xác thực của thông tin không còn quan trọng.
Nhưng rào cản tâm lý không chỉ dừng lại ở đó. Ngay cả khi nhận thức được vấn đề, chúng ta lại có xu hướng nghĩ nó dành cho người khác. Một nghiên cứu trên tạp chí JMIR Infodemiology năm 2024 đã định lượng hóa một rào cản còn lớn hơn: hiệu ứng “chừa mình ra” (third-person effect). [14] Trong khảo sát này, những người dùng trẻ tuổi đánh giá khả năng người khác bị ảnh hưởng bởi tin giả trên TikTok ở mức cao (5.26 trên 7), nhưng lại đánh giá khả năng của chính mình ở mức thấp hơn đáng kể (4.07 trên 7). Nói cách khác, chúng ta đều nghĩ rằng data literacy là kỹ năng mà người khác cần, chứ không phải mình.
Và “cơn bão” này càng trở nên nguy hiểm hơn với sự trỗi dậy của AI. Các mô hình ngôn ngữ lớn, với khả năng tạo ra những ảo giác (hallucination) nghe cực kỳ thuyết phục và có cấu trúc chặt chẽ, càng khiến những người thiếu kỹ năng kiểm chứng dễ dàng rơi vào bẫy tin tưởng. Sự thuận tiện của AI vô tình trở thành chất xúc tác cho những điểm yếu tâm lý cố hữu của chúng ta.
| Nhóm | Thiên kiến | Mô tả ngắn gọn |
|---|---|---|
| Chú ý và ấn tượng ban đầu | Neo bám số đầu | Thông tin đầu tiên đặt mốc trong đầu, kéo đánh giá về sau theo mốc đó. |
| Tính nổi bật | Yếu tố gây kích thích cao chiếm ưu thế trong chú ý và ghi nhớ, dù không đại diện. | |
| Thiên lệch tiêu cực | Tin xấu và rủi ro thu hút chú ý mạnh hơn tin tốt có cùng mức độ. | |
| Tìm kiếm và lựa chọn thông tin | Xác nhận | Tìm và nhớ điều củng cố niềm tin sẵn có, bỏ qua thông tin trái chiều. |
| Mới lạ | Ưu tiên nội dung khác thường và bất ngờ, dễ đẩy tin giật gân lên trước. | |
| Lặp nhiều thành quen | Nghe lặp lại nhiều lần sẽ thấy có vẻ đúng hơn dù thiếu bằng chứng. | |
| Ảnh hưởng xã hội | Bầy đàn | Nhiều người tin hay làm theo thì bản thân dễ đồng thuận theo đám đông. |
| Uy quyền | Đánh giá quá cao phát ngôn từ người có danh tiếng hay chức vị. | |
| Hào quang | Ấn tượng tốt ở một mặt lan sang các mặt khác của cùng người hay tổ chức. |
Ngay cả khi chúng ta đã vượt qua được những rào cản tâm lý, một thách thức khác còn tinh vi hơn xuất hiện: lỗ hổng về kỹ năng dữ liệu. Không phải ai trong chúng ta cũng được trang bị kỹ năng thống kê để “giải phẫu” một thông tin. Các khảo sát quốc tế cho thấy một tỉ lệ đáng kể người trưởng thành, ngay cả ở các nước phát triển, vẫn gặp khó khăn trong việc diễn giải các khái niệm thống kê cơ bản.
Khoảng trống này tạo ra ba cạm bẫy nhận thức mà ngay cả những người thông minh và chăm phản biện cũng có thể mắc phải nếu không cẩn thận:
Một biểu đồ có thể trông rất chuyên nghiệp, nhưng lại được thiết kế để thao túng nhận thức. Chỉ cần thay đổi trục Y để nó không bắt đầu từ 0, một sự khác biệt nhỏ 5% có thể trông như một bước nhảy vọt 500%. Thiếu kỹ năng đọc trục và thang đo, chúng ta rất dễ bị dẫn dắt bởi hình ảnh thay vì con số thật.
Đây có lẽ là cạm bẫy phổ biến và nguy hiểm nhất, đặc biệt trong các tin tức về sức khỏe. Hãy lấy một ví dụ về bữa ăn sáng: một bài báo cót tiêu đề “Khoa học đã chứng minh: Bỏ bữa sáng gây tăng cân và có nguy cơ bị tiểu đường [17]
Thiếu kỹ năng phân biệt giữa hai khái niệm này, chúng ta rất dễ đưa ra những quyết định sai lầm về sức khỏe chỉ dựa trên một tiêu đề được thiết kế để gây sợ hãi.
Một khảo sát online giật tít: “90% người Việt đồng ý với quan điểm X!”. Nhưng khi kiểm tra kỹ, mẫu khảo sát chỉ là 100 người tự nguyện tham gia trên một fanpage cụ thể. Một mẫu nhỏ và không ngẫu nhiên không bao giờ có thể đại diện cho cả một quốc gia. Đây là chiêu bài kinh điển để tạo ra một “sự đồng thuận giả tạo”.
Nghiên cứu đó chỉ theo dõi một nhóm người hay bỏ bữa sáng và thấy tỉ lệ bệnh của họ cao hơn, chứ không trực tiếp can thiệp để chứng minh nhân quả. Đây là một sự khác biệt cực kỳ lớn về độ tin cậy.[18]
Môi trường trao đổi thông tin tại Việt Nam thường đề cao trải nghiệm cá nhân và “người thật việc thật”. Thói quen tin vào lời kể của người quen, tôn trọng uy tín của một cá nhân (authority bias) thay vì phương pháp luận của họ, làm cho việc kiểm chứng bị xem nhẹ.
Vụ việc sữa giả được quảng bá bởi rất nhiều ‘chuyên gia’ y tế và dinh dưỡng là ví dụ điển hình cho vấn đề này.[15]
Trong khi đó, kết quả nghiên cứu khoa học, với những điều kiện nghiêm ngặt và tính trừu tượng, thường nhận ít sự chú ý hơn. Lời khuyên từ một “chuyên gia” trên mạng xã hội, dù không có bằng chứng, đôi khi lại có sức nặng hơn một bài phân tích tổng hợp (meta-analysis) trên hàng chục nghiên cứu.
Đáng lo ngại hơn, rất nhiều “chuyên gia” này lại được đào tạo bởi các khóa học SEO giúp họ tập trung phát triển các nội dung câu view thay vì truyền tải sự thật, kết quả khoa học.
Hãy hiểu data literacy theo nghĩa rộng, áp dụng cho mọi loại thông tin chứ không chỉ số liệu. Nó bao gồm 4 trụ cột chính:
Nhận diện ngữ cảnh, động cơ của tác giả. Phân biệt dữ kiện (fact), suy luận (inference), và ý kiến (opinion). Tách tiêu đề gây chú ý khỏi nội dung cốt lõi.
Truy tìm nguồn gốc ban đầu (primary source). So chéo ít nhất hai nguồn độc lập. Kiểm tra ngày tháng, phương pháp thu thập, kích thước mẫu, sai số, và xung đột lợi ích (ai tài trợ cho nghiên cứu này?).
Đây không chỉ là một thói quen tốt, mà còn là một trong những biện pháp can thiệp hiệu quả nhất. Khoa học gọi đây là fact-checking, và các nghiên cứu đã chứng minh nó có khả năng làm giảm đáng kể niềm tin vào thông tin sai lệch.
Một kỹ thuật còn mạnh hơn nữa là “tiêm chủng tư duy” (inoculation) – tức là học cách nhận diện các kỹ thuật thao túng (ví dụ: tấn công cá nhân, tạo ra sự phân cực giả tạo…). Khi bạn biết trước các “chiêu trò”, bạn sẽ miễn nhiễm với chúng, giống như vaccine giúp cơ thể chống lại virus vậy
Hiểu các khái niệm cơ bản như:
Khi chia sẻ lại, hãy tóm tắt trung thực. Nhấn mạnh điều kiện và giới hạn của dữ liệu. Không tô vẽ kết luận vượt ngoài bằng chứng.
Thực hành
Tùy vào vai trò là người viết hay người đọc, chúng ta có thể sử dụng các chiến lược khác nhau
Với người viết
Với người đọc
Bạn lướt mạng và thấy một bài viết ngắn khẳng định: “Khoa học đã chứng minh: Bỏ bữa sáng gây tăng cân và có nguy cơ bị tiểu đường!”[17]
Thay vì hoảng sợ hay tin ngay, hãy bật “chế độ data literacy” và lướt qua bộ câu hỏi bỏ túi:
Chính những thói quen này mới có thể là nguyên nhân thật sự gây ra bệnh tật, chứ không phải bản thân hành động bỏ bữa sáng
Data literacy năm 2025 là kỹ năng sinh tồn, vì nó giúp ta giữ bình tĩnh, nhìn rõ bức tranh, và chọn hành động dựa trên bằng chứng thay vì cảm xúc tức thời. Khi người viết có trách nhiệm hơn và người đọc chủ động hơn, vòng xoáy chết sẽ chậm lại. Chúng ta có thể bắt đầu từ hôm nay..
[1] https://reutersinstitute.politics.ox.ac.uk/digital-news-report/2025
[2] Reuters Institute Digital News Report 2025
[3] https://www.independent.co.uk/tech/59-percent-of-links-shared-on-social-media-have-never-actually-been-clicked-study-finds-a7086291.html
[4] Phiên bản tin tức này là các phần nội dung tóm gọn, chứ không thể hiện đầy đủ nội dung gốc và các vấn đề liên quan
[5] https://www.microsoft.com/en-us/research/publication/understanding-web-browsing-behaviors-through-weibull-analysis-of-dwell-time/
[6] Reuters Institute Digital News Report 2025
[7] https://news.mit.edu/2018/study-twitter-false-news-travels-faster-true-stories-0308
[8] C K Tokita el al (2024)
[9] Reuters Institute Digital News Report 2025
[10] https://www.newsguardtech.com/misinformation-monitor/september-2022/
[11] https://www.theguardian.com/society/2025/may/31/more-than-half-of-top-100-mental-health-tiktoks-contain-misinformation-study-finds
[12] Dimitroyannis R, Fenton D, Cho S, Nordgren R, Pinto JM, Roxbury CR. A Social Media Quality Review of Popular Sinusitis Videos on TikTok. Otolaryngol Head Neck Surg. 2024 May;170(5):1456-1466. doi: 10.1002/ohn.688. Epub 2024 Mar 3. PMID: 38431902. https://pmc.ncbi.nlm.nih.gov/articles/PMC11150891 https://biologicalsciences.uchicago.edu/news/health-information-tiktok?utm_source=chatgpt.com
[13] C K Tokita el al (2024)
[14] Kirkpatrick CE, Lawrie LL. TikTok as a Source of Health Information and Misinformation for Young Women in the United States: Survey Study. JMIR Infodemiology. 2024 May 21;4:e54663. doi: 10.2196/54663. PMID: 38772020; PMCID: PMC11150891
[15] https://vnexpress.net/bac-si-quang-cao-sua-gia-toi-bi-loi-dung-4874122.html
[16] Tokita et al.
[17] https://laodong.vn/dinh-duong-am-thuc/nhin-an-sang-de-giam-can-de-dan-den-benh-tieu-duong-1339034.ldo
[18] Uemura M, Yatsuya H, Hilawe EH, Li Y, Wang C, Chiang C, Otsuka R, Toyoshima H, Tamakoshi K, Aoyama A. Breakfast Skipping is Positively Associated With Incidence of Type 2 Diabetes Mellitus: Evidence From the Aichi Workers’ Cohort Study. J Epidemiol. 2015;25(5):351-8. doi: 10.2188/jea.JE20140109. Epub 2015 Mar 14. PMID: 25787236; PMCID: PMC4411234.