Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Bàn về công nghệ 4.0
Bàn về công nghệ 4.0

Trong kỷ nguyên GenAI, data literacy là kỹ năng sinh tồn, giúp ta lọc nhiễu, kiểm nguồn, đặt câu hỏi đúng, tránh bẫy tin giả và nội dung giật gân.

Khi dữ liệu cá nhân bị rò rỉ và phát tán, điều nạn nhân cần nhất là một công cụ gỡ bỏ nhanh. Tuy nhiên, Luật Dữ liệu 2025 lại không cung cấp cơ chế này. Thay vào đó, luật chỉ tập trung vào việc xử phạt kẻ làm lộ, khiến nạn nhân phải "tự bơi" trong cuộc chiến dọn dẹp hậu quả.

Từ một nhu cầu đơn giản, mình đã tạo ra một công cụ OCR đa luồng, có cả giao diện web, và nhận về một cú "vỡ mộng" đầy bất ngờ.

Dù sinh sau đẻ muộn, Luật Bảo vệ Dữ liệu Cá nhân dường như đã chọn một con đường riêng thay vì kế thừa hoàn toàn các triết lý pháp lý tiến bộ từ GDPR. Từ việc đặt 'sự đồng ý' làm nền tảng gần như tuyệt đối, tạo ra thách thức cho các hoạt động cơ bản như chống gian lận, cho đến việc thiếu vắng 'Quyền được Lãng quên' trong không gian mạng, luật mới đã tạo ra một khung pháp lý với những khác biệt sâu sắc. Những khác biệt trên giấy tờ này tạo ra các vướng mắc thực tiễn

Khám phá sức mạnh phân tích dữ liệu AI bảo mật với LocalTabula—ứng dụng Streamlit chạy offline, biến file Excel và CSV Google Sheet thành cơ sở dữ liệu trò chuyện. Tận dụng LLM cục bộ để sinh SQL bằng ngôn ngữ tự nhiên, tìm kiếm ngữ nghĩa và tùy chỉnh prompt engineering trên phần cứng giá rẻ. Hoàn hảo cho quản trị dữ liệu, triển khai tiết kiệm chi phí và hỗ trợ truy vấn đa ngôn ngữ.

Thử nghiệm Gemini 2.5 Pro qua một dự án “thực chiến”: xây dựng webapp Streamlit trên Colab để tự động trích xuất và xử lý hóa đơn (OCR tiếng Việt, prompt LLM, xác thực dữ liệu và lưu về Google Sheet). Kết quả ban đầu là bộ khung mã Python rõ ràng, đầy đủ, tiết kiệm hàng giờ thiết lập, chỉ còn việc debug vài vấn đề về ngôn ngữ và API. Nếu bạn đang tìm kiếm công cụ hỗ trợ tạo mẫu nhanh chóng cho các ứng dụng phức tạp, trải nghiệm với Gemini 2.5 Pro này chắc chắn đáng để khám phá!

Các mô hình AI tạo sinh như ChatGPT dù rất thuyết phục, vẫn thường “bịa chuyện” (hallucination) bằng cách đưa ra thông tin chi tiết sai lệch nhưng với độ tự tin cao. Bài viết này chia sẻ 8 cách đơn giản để phát hiện khi nào AI đang “múa” dữ liệu—từ việc nhận diện các khẳng định quá chắc chắn, mâu thuẫn logic, chi tiết bất thường, đến cách kiểm chứng nguồn và sử dụng trực giác của chính bạn.

EU AI Act không chỉ ràng buộc các doanh nghiệp trong Liên minh châu Âu mà còn mở rộng sang cả các nhà phát triển và nhà cung cấp hệ thống AI ở bên ngoài. Theo Điều 2(1), bất kể trụ sở đặt tại đâu, mọi hệ thống AI hay mô hình GPAI khi được đưa vào thị trường hoặc sử dụng tại EU đều phải tuân thủ quy định này. Các nhà cung cấp ngoài EU phải chỉ định “đại diện được ủy quyền” tại châu Âu để chịu trách nhiệm về tính hợp lệ của tài liệu kỹ thuật, chứng minh sự tuân thủ và hợp tác với cơ quan chức năng.

Giải thích khái niệm differential privacy bằng ngôn ngữ dễ hiểu, không nặng tính toán học. Phân tích cách thức tích hợp DP vào các mô hình học sâu (deep learning) và LLM. Đề xuất mối liên hệ giữa DP và các quy định tại Nghị định 13, từ đó làm cơ sở cho những khuyến nghị pháp luật khả thi, hỗ trợ phát triển AI tôn trọng quyền riêng tư tại Việt Nam.

Bài viết này tóm tắt phân loại 10 nhóm rủi ro về nhân quyền phát sinh từ AI tạo sinh, dựa trên khung phân loại của Văn phòng Cao ủy Nhân quyền Liên hợp quốc. Từ quyền được tự do khỏi tổn hại thể chất, tinh thần cho đến quyền riêng tư, quyền sở hữu trí tuệ và quyền tham gia các vấn đề công cộng, mỗi loại rủi ro đều được minh hoạ bằng ví dụ thực tiễn và cơ sở pháp lý tương ứng. Dù AI sáng tạo có thể mang lại lợi ích về năng suất và quyền tiếp cận thông tin, bài viết cảnh báo những tác động tiềm ẩn, đặc biệt khi công nghệ này ngày càng thâm nhập sâu vào đời sống cá nhân và xã hội.