Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Bàn về công nghệ 4.0
Bàn về công nghệ 4.0

Khám phá sức mạnh phân tích dữ liệu AI bảo mật với LocalTabula—ứng dụng Streamlit chạy offline, biến file Excel và CSV Google Sheet thành cơ sở dữ liệu trò chuyện. Tận dụng LLM cục bộ để sinh SQL bằng ngôn ngữ tự nhiên, tìm kiếm ngữ nghĩa và tùy chỉnh prompt engineering trên phần cứng giá rẻ. Hoàn hảo cho quản trị dữ liệu, triển khai tiết kiệm chi phí và hỗ trợ truy vấn đa ngôn ngữ.
Trong kỷ nguyên AI, việc “chat” trực tiếp với spreadsheet đang ngày càng trở nên phổ biến. Nhưng hầu hết giải pháp hiện nay đều dựa vào đám mây, khiến dữ liệu nhạy cảm dễ bị lộ. LocalTabula ra đời để giải quyết bài toán đó: một ứng dụng Streamlit cho phép bạn tải file Excel hoặc Google Sheet CSV lên, đặt câu hỏi bằng tiếng Anh hoặc tiếng Việt—và mọi thứ diễn ra hoàn toàn offline.
Từ việc tự động chuyển đổi sang SQLite, lập chỉ mục văn bản bằng Qdrant, đến động cơ routing thông minh giữa SQL và semantic search, LocalTabula mang lại trải nghiệm chat-to-data nhanh gọn mà vẫn đảm bảo chủ quyền dữ liệu.
Độ chính xác benchmark:
– Dùng pip-sql-1.3b (GGUF) đạt ~80% trên các câu hỏi cơ bản (Spider).
| Test | Processed | DB Skipped | Pipeline Success | Executed | Matched | Exec Accuracy | Matched / Processed |
|---|---|---|---|---|---|---|---|
| 1 | 50 | 0 | N/A | 48 | 39 | 96.00% | 78.00% |
| 2 | 100 | 11 | 86 | 53 | 38 | 61.63% | 38.00% |
| 3 | 300 | 0 | 246 | 105 | 63 | 42.68% | 21.00% |
Processed: số lượng câu hỏi đã thử (giới hạn hoặc mẫu).
DB Skipped: câu hỏi bỏ qua do lỗi thiết lập DB.
Pipeline Success: (Test 2 & 3) số trường hợp chọn đúng DB, route & sinh SQL thành công.
Executed: SQL sinh ra được chạy thành công.
Matched: SQL sinh ra cho kết quả khớp với kết quả chuẩn.
Exec Accuracy: Tỷ lệ chạy thành công trên tổng (Processed – Skipped).
Matched / Processed: tỷ lệ trả đúng đáp án trên tổng câu hỏi thử nghiệm
Nhưng với khả năng tinh chỉnh prompt và retry, LocalTabula cho phép người dùng điều chỉnh các thông số để model nhỏ cũng đạt hiệu suất gần tương đương SOTA.
.env, config/prompts.yaml và utils.py. Bạn có thể điều chỉnh model, template, số lần retry, metric Qdrant, và nhiều tham số khác trong code.LocalTabula mang lại cách tiếp cận an toàn, tiết kiệm và linh hoạt để “trò chuyện” với dữ liệu bảng. Phiên bản hiện tại đã vận hành ổn định pipeline lõi, UI đơn giản, và roadmap sẽ bổ sung: giao diện cấu hình trực quan, console SQL tương tác, và hỗ trợ Google Colab.