Góc làm việc với máy tính cấu hình cao hiển thị giao diện quản lý AI cục bộ và sơ đồ mạng nơ-ron

Local RAG với LMStudio, Obsidian và Zotero

Tại sao giữa năm 2026, tôi vẫn cặm cụi tự build RAG chạy offline?

Việc xây dựng hệ thống RAG chạy cục bộ giúp người dùng duy trì quyền chủ quyền dữ liệu và đảm bảo tính bảo mật trong các lĩnh vực nhạy cảm. Giải pháp này loại bỏ sự phụ thuộc vào internet, giảm chi phí lưu trữ đám mây và tránh tình trạng bị ràng buộc bởi các nhà cung cấp dịch vụ lớn.

Công cụ OmniMind kết hợp Obsidian, Zotero và LM Studio để tạo ra trợ lý nghiên cứu ngoại tuyến an toàn. Hệ thống hỗ trợ đồng bộ hóa dữ liệu thời gian thực và tích hợp khả năng nhận diện ký tự quang học qua mô hình thị giác, giúp xử lý tài liệu mà không cần gửi thông tin ra bên ngoài.

Nhiều người hỏi mình một câu rất thực tế:

“Ủa, giữa năm 2026 rồi, cloud AI mạnh như vũ bão, sao ông vẫn ám ảnh với việc chạy RAG bằng model local làm gì cho mệt? Nó vừa chậm, vừa kém thông minh hơn. NotebookLM của Google làm quá tốt rồi. Claude Desktop thì bá đạo với MCP kết nối đủ thứ từ Slack, Outlook đến WhatsApp…”

Nhìn bên ngoài, nhận định đó hoàn toàn đúng. Những giải pháp enterprise do các tập đoàn công nghệ lớn phát triển chạy cực kỳ mượt mà.

Nhưng có một cái giá mà chúng ta bắt buộc phải đánh đổi khi dùng chúng: Quyền chủ quyền dữ liệu (Data Sovereignty).


Rào cản lớn nhất của Cloud AI: Bạn có thực sự sở hữu dữ liệu của mình?

Khi bạn đưa toàn bộ tài liệu, ghi chú của mình lên mây để AI đọc, bạn phải đối mặt với ba vấn đề lớn:

  1. Phụ thuộc chi phí: Data càng phình to, hóa đơn hàng tháng càng tăng.
  2. Luôn phải online: Không có Internet là coi như “mất não”.
  3. Chính sách bảo mật: Các ông lớn luôn cam kết tuân thủ GDPR, SOC2, không lưu giữ dữ liệu… Nhưng với các ngành đặc thù như Luật, Y tế hay Tài chính, việc để dữ liệu khách hàng rời khỏi máy tính cá nhân là một điều tối kỵ. Khách hàng của bạn có tin vào lời hứa của Google hay Anthropic không? Có người có, nhưng phần lớn là KHÔNG.

Mình muốn tự chủ. Mình không muốn bị khóa chặt vào một hệ sinh thái (vendor lock-in) nào cả. Đó là lý do mình muốn có một phiên bản NotebookLM bỏ túi chạy hoàn toàn offline ngay trên chiếc máy tính của mình.


Không phát minh lại chiếc bánh xe – Đứng trên vai những công cụ tốt nhất

Mình không cố gắng tự viết lại mọi thứ từ đầu. Thay vào đó, mình chọn cách kết hợp những mảnh ghép mạnh mẽ và quen thuộc nhất của giới nghiên cứu:

  • Obsidian: Để quản lý ghi chú, giao diện và xây dựng đồ thị tri thức (Knowledge Graph) cực kỳ trực quan.
  • Zotero: Để lưu trữ và quản lý tài liệu tham khảo khoa học một cách chuẩn chỉnh theo kiểu truyền thống.
  • LM Studio: Nền tảng tuyệt vời để chạy các mô hình ngôn ngữ và embedding database hoàn toàn cục bộ.

Tất cả những gì mình làm là dùng kinh nghiệm phát triển RAG của mình để viết một plugin kết nối chúng lại với nhau. Và thế là OmniMind ra đời.


OmniMind có gì?

OmniMind là một plugin mã nguồn mở dành riêng cho LM Studio, mang lại trải nghiệm tra cứu tài liệu thông minh giống như NotebookLM nhưng an toàn tuyệt đối:

  • 🔒 Chạy 100% Local: Dữ liệu của bạn không bao giờ rời khỏi máy. Không cần internet, không lo rò rỉ thông tin.
  • 📂 Đồng bộ thời gian thực: Tự động theo dõi các thư mục Obsidian (qua chokidar) và parse trực tiếp cơ sở dữ liệu SQLite của Zotero cùng các file PDF đi kèm.
  • 👁️ OCR Local: Nếu gặp file PDF dạng quét (không có text layer), hệ thống sẽ tự động gọi Vision LLM đang chạy trong LM Studio để nhận diện chữ viết hoàn toàn offline.

Có thể nó không nhanh hay mượt bằng việc chạy trên cụm server hàng ngàn GPU của các Big Tech, nhưng nó mang lại thứ giá trị nhất: Sự tự do và an tâm tuyệt đối.

Nếu bạn cũng là một người kỹ tính với dữ liệu của mình, thích tự chủ công nghệ và muốn biến chiếc máy tính cá nhân thành một trợ lý nghiên cứu bảo mật, hãy thử trải nghiệm OmniMind nhé.

👉 Link plugin: https://lmstudio.ai/phuocnguyen90/omnimind

Hướng dẫn sử dụng cho người mới

Giả định rằng người dùng đã cài đặt sẵn Obsidian Zotero trên máy

    1. Tải và Cài đặt LMStudio https://lmstudio.ai/

    2. Tải một mô hình LLM phù hợp với cấu hình máy của bạn như: gemma-4-e4b, một mô hình embeding như embeddinggemma-300m-qat-GGUF

    3. Tải thêm ggml-org/DeepSeek-OCR-GGUF để nhận diện chữ (OCR) với pdf không thuần text

    4. Tải và cài đặt plugin https://lmstudio.ai/phuocnguyen90/omnimind

    5. Kích hoạt plugin và cài đặt các đường dẫn đến thư viện Zotero và Obsidian trên máy (nếu không biết đường dẫn thì có thể thử mặc định tại C:\Users\<tên user bạn>\Zotero%APPDATA%\Obsidian\ )

    6. Ở lần chạy đầu tiên, plugin sẽ tiến hành tạo cơ sở dữ liệu. Tùy vào cấu hình máy và lượng dữ liệu hiện có, việc này có thể kéo dài từ vài phút đến vài tiếng. Bạn có thể theo dõi tiến trình này tại http://localhost:4733/

    7. Load mô hình và cài đặt system prompt

    8. Chat với mô hình đã load

    Để lại một bình luận

    Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *