3 tính năng nổi bật
Hệ thống hiển thị 3 cards tính năng ngay đầu giao diện crawl:| Tính năng | Mô tả |
|---|---|
| 🎯 Tự động crawl | Nội dung web được thu thập tự động — không cần copy paste thủ công |
| ⚡ Xử lý nhanh | Hoàn thành trong 2–10 phút tùy số lượng trang |
| ✨ AI tối ưu | Nội dung được phân tích thông minh, lọc bỏ rác và vector hóa |
Quy trình crawl URL (2 bước)
Nhập URL và phân tích
Vào trang quản lý bot → tab Kiến thức → bấm + Thêm kiến thức → chọn URL.Dán link trang web vào ô Website URL. Hệ thống tự kiểm tra:
- URL hợp lệ hiển thị ✅ kèm badge domain
- URL không hợp lệ hoặc sai protocol (chỉ hỗ trợ
http://vàhttps://) hiển thị cảnh báo đỏ

Chọn trang con và bắt đầu crawl
Sau khi phân tích, hệ thống hiển thị danh sách tất cả URL tìm được dạng checkbox list:
- Mặc định tất cả URL đều được chọn
- Bạn có thể bỏ chọn các trang không muốn nạp
- Dùng checkbox Chọn tất cả để bật/tắt nhanh toàn bộ
- Hiển thị số lượng:
URLs tìm thấy (đã chọn/tổng)
- Chờ xử lý — đang chờ trong hàng đợi
- Đang xử lý — hệ thống đang đọc, trích xuất và vector hóa nội dung
- Hoàn thành — tri thức sẵn sàng, bot có thể sử dụng
- Thất bại — xảy ra lỗi trong quá trình xử lý

Thông tin quan trọng về quá trình crawl:
- Quá trình crawl diễn ra trong nền và mất 2–10 phút
- Bot có thể hoạt động bình thường trong lúc chờ
- Kiến thức sẽ tự động được thêm vào bot sau khi hoàn thành
Yêu cầu kỹ thuật
| Yêu cầu | Mô tả |
|---|---|
| Protocol | Chỉ hỗ trợ http:// và https:// |
| URL hợp lệ | Phải là URL hoàn chỉnh (bao gồm protocol) |
| Nội dung | Hệ thống đọc text hiển thị trên trang web |
| Phân tích | Bắt buộc phân tích trước khi crawl — không thể bỏ qua bước này |
Câu hỏi thường gặp
Crawl mất bao lâu?
Crawl mất bao lâu?
Từ 2–10 phút tùy số lượng trang con và dung lượng nội dung. Bot vẫn hoạt động bình thường trong lúc chờ.
Hệ thống crawl được những gì trên trang web?
Hệ thống crawl được những gì trên trang web?
Hệ thống đọc text hiển thị trên trang web (nội dung chính, tiêu đề, mô tả). Không crawl được nội dung ẩn sau login, AJAX load, hoặc nội dung render bằng JavaScript phía client.
Có thể cập nhật nội dung đã crawl không?
Có thể cập nhật nội dung đã crawl không?
Hiện tại cần xóa bản crawl cũ trong bảng quản lý tri thức, sau đó crawl lại URL. Hệ thống không tự đồng bộ khi nội dung trang web thay đổi.
Tiếp theo
Huấn luyện bằng tài liệu
6 phương thức nạp tri thức: Q&A, file, crawl, audio, video.
Cài đặt chatbot
Chỉnh sửa tính cách, giọng điệu và hành vi bot.

