在 AI 搜索和大型语言模型(LLMs)高速发展的今天,网站如何与 AI 系统更高效地对接,成为内容创作者与站长的新课题。继 robots.txt 和 sitemap.xml 之后,一种名为 LLMS.txt
的新兴标准正悄然走入视野。本文将带你全面了解 LLMS.txt 的定义、用途、文件格式及如何部署到你的网站。

LLMS.txt 是什么?
LLMS.txt 是“Large Language Model Sitemap”的缩写,由行业专家 Jeremy Howard 提出,标准发布在 llmstxt.org。它是一个放置在网站根目录下的 .txt
文件,旨在为 AI 模型(如 ChatGPT、Claude、Gemini 等)提供结构化内容指引。
与传统 robots.txt
控制爬虫抓取不同,llms.txt
更像是“给 AI 看的网站导览页”——用 Markdown 格式列出网站的重要页面,并附上说明,帮助 AI 更准确地理解、引用和总结你的内容。
LLMS.txt 有什么用?
1. 指导 AI 阅读结构:
大型语言模型往往不知道你网站的结构,也不会自动识别什么是核心内容。LLMS.txt 能清晰告诉模型:“这些是我网站最重要的页面。”
2. 控制 AI 访问与引用:
虽然 LLMS.txt 本身不直接控制权限,但它与 robots.txt
结合使用时,可标明哪些部分开放给 AI 读取,哪些应限制。你也可通过 HTTP Header 设置 X-Robots-Tag: llms-txt
。
3. 提高内容被 AI 正确引用的概率:
若你的内容经常被 AI 摘用,却没有准确归属来源或失真,设置 LLMS.txt 可以显著提高 AI 提取内容时的准确率和上下文完整性。
4. 增强版权意识和保护:
LLMS.txt 是一种公开声明:我的内容结构是什么、什么页面值得被引用、哪些不欢迎被采集。这有助于站长建立清晰的版权边界。
LLMS.txt 文件结构与语法格式
LLMS.txt 使用 纯文本(.txt)格式 编写,内容为 Markdown 语法。基本规则如下:
文件位置:
- 必须放在根目录,如
https://yourdomain.com/llms.txt
基本格式:
# 网站名称或项目名
> 一句话描述你的网站内容
## 主导航
- [页面名称](页面URL) : 简要说明
- [页面名称](页面URL) : 简要说明
## 核心教程
- [教程A](https://example.com/tutorial-a) : 教程简介
- [教程B](https://example.com/tutorial-b) : 教程简介
示例:
# SeekSEM 数字营销社区
> 提供免费高质量的 SEO/SEM 教程和案例分享。
## 核心内容
- [Google SEO 教程](https://seeksem.com/search-engine-optimization) : 零基础入门与进阶操作指南。
- [Google 广告入门](https://seeksem.com/learning-center/ads-tutorial) : 适合初学者的投放技巧教程。
## 推荐阅读
- [SEO vs GEO](https://seeksem.com/learning-center/ai-search) : 探讨 AI 时代 SEO 的转型路径。
如何设置 LLMS.txt 文件?
步骤一:撰写内容
用 Markdown 编辑器或纯文本工具,写出网站结构的重点页面,包含:
- 网站名称
- 简要介绍
- 页面标题 + URL + 简短描述
步骤二:上传至网站根目录
文件路径应为:https://yourdomain.com/llms.txt
LLMS.txt 与 robots.txt 有什么不同?
项目 | LLMS.txt | robots.txt |
---|---|---|
面向对象 | AI 模型 | 爬虫程序 |
文件格式 | Markdown | 特定语法(Disallow/Allow) |
主要用途 | 内容指引 | 抓取权限管理 |
文件位置 | /llms.txt | /robots.txt |
它们可以并存,共同工作。一个负责说“能不能抓”,一个负责说“抓什么最重要”。
长期更新
- 定期更新:网站页面有调整时及时同步到 LLMS.txt。
- 从读者视角撰写摘要:确保文件中的说明内容简洁、人类可读。
- 优先推荐结构化内容:如教程、常见问题页、权威资源链接。
- 避免添加短期页面或促销页:避免 AI 学习到短生命周期页面。
结语
AI 搜索将逐步替代传统关键字搜索,内容被 AI 引用的结构化能力,将是网站下一轮“权重”的核心。而 LLMS.txt,正是帮助你在这一轮中建立“AI 可读性”的关键武器。
暂无评论内容