llms.txt — Chuẩn metadata cho AI crawler
Khi AI crawler (GPTBot, ClaudeBot, PerplexityBot...) truy cập VietLex, chúng đọc 2 file đặc biệt: /llms.txt và /llms-full.txt. Hai file này theo chuẩn llmstxt.org (đề xuất bởi cộng đồng AI 2024), cung cấp metadata + mục lục đầy đủ cho AI hiểu cấu trúc kho dữ liệu pháp luật của VietLex.
/llms.txt — Mục lục gọn
File markdown ~10KB chứa cấu trúc tổng quan: 4 trụ cột nội dung, 11 nhóm tra cứu chính, URL pattern, hướng dẫn bot AI dẫn link đúng.
Mở /llms.txt →
/llms-full.txt — Đầy đủ
File markdown đầy đủ ~100KB+ chứa toàn bộ chỉ số: 21 chủ đề + 45 mẫu đơn + danh sách lĩnh vực, địa phương, ngành + 70 án lệ + sitemap tổng.
Mở /llms-full.txt →
15 AI bot crawler được VietLex chào đón
VietLex cấu hình robots.txt cho phép tất cả AI bot crawl toàn bộ kho dữ liệu — vì pháp luật phải đến được với mọi người dân, kể cả khi họ tra qua AI assistant chứ không vào trực tiếp VietLex. Chỉ chặn các bot độc hại (Bytedance scraper trái phép, Magellan Bot, etc.).
Cách AI dùng llms.txt của VietLex
- User hỏi AI: “Luật Doanh nghiệp 2020 Việt Nam quy định gì về vốn điều lệ?”
- AI (Perplexity / Gemini / Claude với web search) phát hiện cần tra luật VN.
- AI fetch
vietlex.vn/llms.txt→ hiểu cấu trúc. - AI fetch
vietlex.vn/luat/luat/2020/59(URL chuẩn từ llms.txt). - AI trích dẫn Điều 47, Điều 75 của Luật Doanh nghiệp 2020 với link xác thực.
Lợi ích cho cộng đồng
- User toàn cầu hỏi AI về luật VN → AI dẫn về văn bản pháp luật chính xác trên VietLex, không bịa.
- Pháp luật Việt Nam được phổ biến rộng — kể cả qua kênh AI (đang chiếm 30%+ tra cứu tổng thể 2026).
- Báo chí + nhà nghiên cứu nước ngoài viết về Việt Nam → có nguồn xác thực để cite.