Thẻ OCR

Local RAG với LMStudio, Obsidian và Zotero

Góc làm việc với máy tính cấu hình cao hiển thị giao diện quản lý AI cục bộ và sơ đồ mạng nơ-ron

Tại sao giữa năm 2026, tôi vẫn cặm cụi tự build RAG chạy offline? Việc xây dựng hệ thống RAG chạy cục bộ giúp người dùng duy trì quyền chủ quyền dữ liệu và đảm bảo tính bảo mật trong…

Benchmark docling OCR cho văn bản tiếng Việt

Mấy ngày trước IBM ra mắt mô hình mở Granite Docling VLM tích hợp vào thư viện Docling với kỳ vọng OCR “hiểu” được cấu trúc văn bản. Nhân dịp đó mình thử benchmark ba pipeline để xem tốc độ và độ phù hợp khi xử lý tài liệu pháp lý tiếng Việt.

Xây dựng app OCR hóa đơn với Gemini 2.5 Pro

Thử nghiệm Gemini 2.5 Pro qua một dự án “thực chiến”: xây dựng webapp Streamlit trên Colab để tự động trích xuất và xử lý hóa đơn (OCR tiếng Việt, prompt LLM, xác thực dữ liệu và lưu về Google Sheet). Kết quả ban đầu là bộ khung mã Python rõ ràng, đầy đủ, tiết kiệm hàng giờ thiết lập, chỉ còn việc debug vài vấn đề về ngôn ngữ và API. Nếu bạn đang tìm kiếm công cụ hỗ trợ tạo mẫu nhanh chóng cho các ứng dụng phức tạp, trải nghiệm với Gemini 2.5 Pro này chắc chắn đáng để khám phá!