Category coding

Cách AI hiểu bối cảnh 1M token

Đến 2025, LLM có ngữ cảnh triệu token, nhưng hiệu quả thực tế thường chỉ bằng một nửa. Bài viết đi sâu vào cách các kiến trúc attention, positional encoding và bộ nhớ khác nhau ảnh hưởng đến khả năng truy hồi, suy luận và lỗi của mô hình. Chọn mô hình đúng là chọn cách nó thành công và thất bại.

Benchmark docling OCR cho văn bản tiếng Việt

Mấy ngày trước IBM ra mắt mô hình mở Granite Docling VLM tích hợp vào thư viện Docling với kỳ vọng OCR “hiểu” được cấu trúc văn bản. Nhân dịp đó mình thử benchmark ba pipeline để xem tốc độ và độ phù hợp khi xử lý tài liệu pháp lý tiếng Việt.

LocalTabula: Truy Vấn Dữ Liệu Bảng Bằng Ngôn Ngữ Tự Nhiên

Khám phá sức mạnh phân tích dữ liệu AI bảo mật với LocalTabula—ứng dụng Streamlit chạy offline, biến file Excel và CSV Google Sheet thành cơ sở dữ liệu trò chuyện. Tận dụng LLM cục bộ để sinh SQL bằng ngôn ngữ tự nhiên, tìm kiếm ngữ nghĩa và tùy chỉnh prompt engineering trên phần cứng giá rẻ. Hoàn hảo cho quản trị dữ liệu, triển khai tiết kiệm chi phí và hỗ trợ truy vấn đa ngôn ngữ.

Xây dựng app OCR hóa đơn với Gemini 2.5 Pro

Thử nghiệm Gemini 2.5 Pro qua một dự án “thực chiến”: xây dựng webapp Streamlit trên Colab để tự động trích xuất và xử lý hóa đơn (OCR tiếng Việt, prompt LLM, xác thực dữ liệu và lưu về Google Sheet). Kết quả ban đầu là bộ khung mã Python rõ ràng, đầy đủ, tiết kiệm hàng giờ thiết lập, chỉ còn việc debug vài vấn đề về ngôn ngữ và API. Nếu bạn đang tìm kiếm công cụ hỗ trợ tạo mẫu nhanh chóng cho các ứng dụng phức tạp, trải nghiệm với Gemini 2.5 Pro này chắc chắn đáng để khám phá!

Hiểu về differential privacy

Giải thích khái niệm differential privacy bằng ngôn ngữ dễ hiểu, không nặng tính toán học. Phân tích cách thức tích hợp DP vào các mô hình học sâu (deep learning) và LLM. Đề xuất mối liên hệ giữa DP và các quy định tại Nghị định 13, từ đó làm cơ sở cho những khuyến nghị pháp luật khả thi, hỗ trợ phát triển AI tôn trọng quyền riêng tư tại Việt Nam.