Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Bàn về công nghệ 4.0
Bàn về công nghệ 4.0

Tại sao giữa năm 2026, tôi vẫn cặm cụi tự build RAG chạy offline? Việc xây dựng hệ thống RAG chạy cục bộ giúp người dùng duy trì quyền chủ quyền dữ liệu và đảm bảo tính bảo mật trong…

Mấy ngày trước IBM ra mắt mô hình mở Granite Docling VLM tích hợp vào thư viện Docling với kỳ vọng OCR “hiểu” được cấu trúc văn bản. Nhân dịp đó mình thử benchmark ba pipeline để xem tốc độ và độ phù hợp khi xử lý tài liệu pháp lý tiếng Việt.

Từ một nhu cầu đơn giản, mình đã tạo ra một công cụ OCR đa luồng, có cả giao diện web, và nhận về một cú "vỡ mộng" đầy bất ngờ.

Thử nghiệm Gemini 2.5 Pro qua một dự án “thực chiến”: xây dựng webapp Streamlit trên Colab để tự động trích xuất và xử lý hóa đơn (OCR tiếng Việt, prompt LLM, xác thực dữ liệu và lưu về Google Sheet). Kết quả ban đầu là bộ khung mã Python rõ ràng, đầy đủ, tiết kiệm hàng giờ thiết lập, chỉ còn việc debug vài vấn đề về ngôn ngữ và API. Nếu bạn đang tìm kiếm công cụ hỗ trợ tạo mẫu nhanh chóng cho các ứng dụng phức tạp, trải nghiệm với Gemini 2.5 Pro này chắc chắn đáng để khám phá!