Hướng Dẫn Sử Dụng
Hướng dẫn đầy đủ về DocPrivy
DocPrivy là gì?
DocPrivy là công cụ trích xuất dữ liệu tài liệu miễn phí, sử dụng AI để đọc và chuyển đổi tài liệu (hóa đơn, hợp đồng, biên lai, v.v.) thành dữ liệu có cấu trúc mà bạn có thể xuất ra Excel, CSV, DOCX, PDF, JSON hoặc Markdown.
- Hoàn toàn miễn phí, không cần đăng ký tài khoản
- Bảo mật tuyệt đối — tài liệu được xử lý trong bộ nhớ và xóa ngay, không lưu trữ
- Hỗ trợ đa ngôn ngữ: Tiếng Việt, Anh, Trung, Nhật, Hàn, Pháp và nhiều ngôn ngữ khác
- Hỗ trợ 12+ loại tài liệu
Bắt Đầu Nhanh
Bước 1: Truy cập trang trích xuất
Vào trang trích xuất hoặc nhấn nút "Start Extracting" trên trang chủ. docprivy.com/extract
Bước 2: Tải tài liệu lên
- Kéo thả (drag & drop) file vào vùng upload
- Nhấn vào vùng upload để chọn file từ máy tính
Định dạng: PDF, JPEG, PNG, WebP — Tối đa 4MB/file, 10 file/lần
Bước 3: Chọn chế độ xử lý
| Chế độ | Mô tả | Khi nào dùng |
|---|---|---|
| Extract | AI trích xuất dữ liệu có cấu trúc | Hóa đơn, hợp đồng, biên lai |
| OCR | Chuyển hình ảnh/scan thành text | Tài liệu scan, ảnh chụp |
Bước 4: Thêm hướng dẫn (tùy chọn)
Ở chế độ Extract, bạn có thể nhập hướng dẫn bổ sung để AI trích xuất chính xác hơn.
- "Trích xuất số hóa đơn, ngày, tổng tiền và danh sách sản phẩm"
- "Lấy tên người gửi, người nhận và nội dung chính"
Bước 5: Nhấn nút xử lý
Nhấn "Extract Data" hoặc "Extract Text (OCR)" để bắt đầu. Thanh tiến trình sẽ hiển thị quá trình xử lý.
Xem Kết Quả
Kết quả hiển thị dạng chia đôi màn hình:
- Bên trái: Hình ảnh tài liệu gốc (preview)
- Bên phải: Dữ liệu trích xuất — loại tài liệu, tóm tắt, các trường, bảng biểu, ghi chú
Với nhiều file, dùng nút ← Prev / Next → hoặc các chấm tròn để chuyển giữa các file (chấm xám = thành công, chấm đỏ = lỗi).
Xuất Dữ Liệu (Export)
Xuất file đơn lẻ
JSON — dữ liệu có cấu trúc | MD — Markdown dễ đọc | XLSX/CSV — bảng tính
Xuất hàng loạt (Batch)
Khi trích xuất nhiều file thành công:
- DOCX (N) — xuất N file thành 1 file Word
- PDF (N) — xuất N file thành 1 file PDF
- XLSX/CSV (N) — xuất N file thành 1 bảng tính
Tùy Chỉnh Cột Trong XLSX/CSV
Khi nhấn nút XLSX/CSV, cửa sổ tùy chỉnh mở ra với bảng xem trước dữ liệu. Tại đây bạn có thể sắp xếp, ẩn/hiện, và gộp cột.
Sắp xếp thứ tự cột (Drag & Drop)
- Di chuột vào tiêu đề cột (hàng đầu tiên)
- Kéo và thả cột đến vị trí mong muốn
- Cột được sắp xếp lại ngay trong bảng xem trước
- Thứ tự này giữ nguyên khi xuất file
Ví dụ: Kéo cột "Tổng tiền" thả ngay sau "Ngày hóa đơn" để dễ đối chiếu.
Ẩn/Hiện cột (Click)
- Nhấn vào tiêu đề cột để ẩn (cột bị gạch ngang)
- Nhấn lại để hiện
- Cột bị ẩn không xuất hiện trong file tải về
Gộp nhiều cột làm một (Merge Columns)
Hữu ích khi AI trích xuất cùng một thông tin thành nhiều cột riêng biệt (ví dụ: "Địa chỉ dòng 1", "Phường", "Quận", "Thành phố" → gộp thành "Địa chỉ đầy đủ").
Cách thực hiện:
- Nhấn nút "Merge Columns" (màu tím) trên thanh công cụ
- Cửa sổ Merge mở ra — đánh dấu tick vào 2+ cột muốn gộp
- Đặt tên Key (tên kỹ thuật) và Label (tên hiển thị) cho cột mới
- Kiểm tra Preview ở cuối cửa sổ
- Nhấn "Merge (N)" để xác nhận
Sau khi gộp:
- Cột gộp hiển thị nền tím nhạt trong bảng xem trước
- Nhãn hiện số cột gốc: 3x = gộp từ 3 cột
- Giá trị được nối bằng ký tự phân cách (mặc định: " | ")
- Thay đổi ký tự phân cách tại ô "Separator" trên thanh công cụ
- Nhấn biểu tượng ✂ trên cột gộp để tách ngược (unmerge) về các cột gốc
Ví dụ thực tế:
Upload 10 hóa đơn → AI trích xuất: seller_name, seller_address, seller_tax_id. Gộp seller_address + seller_tax_id thành seller_info với separator " — ". Kết quả: "123 Nguyễn Huệ, Q.1, TP.HCM — 0312345678"
Loại Tài Liệu Được Hỗ Trợ
Giới Hạn Sử Dụng
| Kích thước file | Tối đa 4MB mỗi file |
| Số file mỗi lần | Tối đa 10 file |
| Định dạng | PDF, JPEG, PNG, WebP |
| Tốc độ | Rate limit để đảm bảo chất lượng |
Thanh Quota trên trang trích xuất cho biết số lần sử dụng còn lại.
Mẹo Sử Dụng
- Chụp ảnh rõ nét: Ảnh mờ hoặc nghiêng sẽ giảm độ chính xác. Chụp thẳng, đủ sáng, tránh bóng đổ.
- Dùng hướng dẫn cụ thể: Mô tả dữ liệu bạn cần thay vì để trống.
- Xử lý hàng loạt: Upload nhiều file cùng loại rồi xuất batch Excel để tiết kiệm thời gian.
- Kiểm tra flagged fields: Nếu AI đánh dấu trường cần kiểm tra, hãy so sánh với tài liệu gốc.
- Dùng OCR cho scan cũ: Tài liệu scan chất lượng thấp nên dùng OCR trước.
Câu Hỏi Thường Gặp
DocPrivy có thực sự miễn phí không?
Có. Hoàn toàn miễn phí, duy trì qua quảng cáo.
Tài liệu có được lưu trữ không?
Không. Xử lý trong bộ nhớ và xóa ngay.
Hỗ trợ loại file nào?
JPEG, PNG, WebP, PDF — tối đa 4MB, 10 file/lần.
Hỗ trợ ngôn ngữ nào?
Tiếng Việt, Anh, Trung, Nhật, Hàn, Pháp, Đức, Tây Ban Nha, và nhiều hơn.
Độ chính xác?
AI tiên tiến + chỉ số tin cậy (Verified / Needs Review / Failed) mỗi lần trích xuất.
Cần tài khoản không?
Không. Không đăng ký, không đăng nhập.