admin

admin

Local RAG với LMStudio, Obsidian và Zotero

Góc làm việc với máy tính cấu hình cao hiển thị giao diện quản lý AI cục bộ và sơ đồ mạng nơ-ron

Tại sao giữa năm 2026, tôi vẫn cặm cụi tự build RAG chạy offline? Việc xây dựng hệ thống RAG chạy cục bộ giúp người dùng duy trì quyền chủ quyền dữ liệu và đảm bảo tính bảo mật trong…

Khi Meta không biết “Left Join”

Bức tường dữ liệu kỹ thuật số bị nứt vỡ với các biểu tượng cảnh báo màu cam, tượng trưng cho lỗ hổng bảo mật

Sau gần 18 năm gắn bó, trải qua đủ mọi thăng trầm cùng kỷ nguyên mạng xã hội, cuối cùng mình đã bị đá ra khỏi Facebook một cách bất đắc dĩ. Lý do không phải vì mình vi phạm…

Cái bẫy “Yes Man” của LLM

Tại sao bạn nên dùng LLM để phản biện, chứ không phải kiểm chứng? Chúng ta đang hiểu sai cách sử dụng các mô hình ngôn ngữ lớn (Large Language Models – LLM) trong những tình huống đòi hỏi suy…

Cách AI hiểu bối cảnh 1M token

Đến 2025, LLM có ngữ cảnh triệu token, nhưng hiệu quả thực tế thường chỉ bằng một nửa. Bài viết đi sâu vào cách các kiến trúc attention, positional encoding và bộ nhớ khác nhau ảnh hưởng đến khả năng truy hồi, suy luận và lỗi của mô hình. Chọn mô hình đúng là chọn cách nó thành công và thất bại.

Benchmark docling OCR cho văn bản tiếng Việt

Mấy ngày trước IBM ra mắt mô hình mở Granite Docling VLM tích hợp vào thư viện Docling với kỳ vọng OCR “hiểu” được cấu trúc văn bản. Nhân dịp đó mình thử benchmark ba pipeline để xem tốc độ và độ phù hợp khi xử lý tài liệu pháp lý tiếng Việt.

Miễn trừ áp dụng Luật DLCN cho startup

Doanh nghiệp nhỏ có thật sự được miễn trừ theo Luật Dữ liệu mới? Lưu CV, dùng máy chấm công vân tay có thể khiến bạn mất quyền miễn trừ và phải lập hồ sơ chuyển dữ liệu xuyên biên giới