← 返回洞察
行业洞察

AI 时代,为什么关键词堆砌在生成式引擎里反而失效?

如果一个页面只是把关键词埋得很满,却没有清晰回答用户问题、没有事实支撑、没有可引用的语句,那么它在生成式引擎里往往不会更占优势,反而更容易被忽略。

很多企业做惯了传统 SEO,所以进入 AI 搜索时代后,第一反应仍然是继续做关键词布局、拉高词频、覆盖更多长尾词。

但问题在于,生成式引擎已经不是传统的“结果页排名机器”了。

用户现在越来越常见的行为是直接问:

  • “有没有适合中小企业的 CRM 推荐?”
  • “哪家做 GEO 服务更靠谱?”
  • “这个产品和竞品相比差别在哪里?”

在这种场景下,AI 要做的不是把十个网页列出来,而是理解问题、抽取证据、组织语言、生成答案。这套链路天然决定了:它关注的核心不再只是关键词,而是语义、事实和可信度。

一、先纠正一个常见说法:那篇常被提到的 GEO 论文,不是斯坦福的

很多行业讨论里会把那篇 GEO 论文说成“斯坦福那篇论文”,但更准确地说,当前被大量引用的基础论文是:

《GEO: Generative Engine Optimization》

  • arXiv 首次提交时间:2023 年 11 月 16 日
  • KDD 2024 会议版本:2024 年 ACM SIGKDD Conference on Knowledge Discovery and Data Mining
  • 公开作者信息显示,作者主要来自 Princeton UniversityIndian Institute of Technology Delhi,另有独立研究者参与,并不是 Stanford 论文

这个纠正很重要,因为我们在引用研究时,最好把来源说准。

二、论文真正证明了什么?

这篇论文最重要的价值,不是喊出一个新概念,而是它第一次比较系统地把“生成式引擎优化”变成了一个可测量问题。

论文做了三件关键事情:

  • 提出了 GEO 的基本框架
  • 构建了一个包含 10000 个查询GEO-bench
  • 用一组可执行的内容改写策略,去测试哪些做法更容易提升内容在生成式引擎中的可见度

论文摘要和正文里最值得注意的几个结论是:

  • GEO 方法可让内容在生成式引擎回答中的可见度提升 最高 40%
  • 在不同查询里,加入引用、加入相关引语、加入统计数据 这类方法,能带来 超过 40% 的提升
  • 在真实部署的 Perplexity.ai 实验里,论文再次观察到 GEO 方法有效,而传统 SEO 方法 Keyword Stuffing(关键词堆砌)比基线还差约 10%

这已经非常接近我们今天想论证的核心观点了:生成式引擎不是更喜欢“词更多”的页面,而是更喜欢“更容易被理解和引用”的页面。

三、为什么说生成式引擎不是在按关键词工作?

论文里有一句非常关键的话,意思可以概括为:

传统 SEO 方法并不直接适用于生成式引擎,因为生成式引擎中的生成模型并不局限于关键词匹配,它会对文档文本和用户问题做更细致的理解。

这句话背后,其实就是 AI 搜索与传统搜索的根本分叉。

传统搜索更像“匹配器”

在传统搜索逻辑里,搜索引擎的任务首先是:

  • 识别 query 里有哪些词
  • 找到哪些页面和这些词高度相关
  • 再结合链接、权威度、页面质量等因素进行排序

关键词当然从来都不是唯一因素,但它长期是一个很强的入口信号。

生成式引擎更像“答案组织者”

而在生成式引擎里,流程通常更接近:

  1. 理解用户到底在问什么
  2. 把问题改写成更适合检索的子问题
  3. 找到一批候选来源
  4. 总结每个来源的有效信息
  5. 生成一个带引用的最终答案

也就是说,它不是只看“这个网页有没有这个词”,而是看:

  • 这个页面是不是在回答这个问题
  • 这段内容是否有足够清晰的事实表达
  • 这条信息能不能被提炼、转述、拼接进答案
  • 这个来源是否足够可信、可验证、可引用

所以,从机制上说,生成式引擎天然比传统搜索更偏向语义理解,而不是简单词频。

四、为什么“关键词埋得很满”反而可能没效果?

如果只从传统 SEO 的旧经验出发,很多人会自然推导出一个错误动作:

“既然 AI 也要读网页,那我就把目标词写得更多一点。”

但论文在 Perplexity 的真实实验里,直接给了这个思路一个反证:Keyword Stuffing 表现不佳,甚至比不优化还差约 10%。

这意味着什么?

意味着在生成式引擎里,过度重复关键词至少会带来三个问题:

1. 它不等于更强的语义回答力

关键词出现很多次,不代表页面更能回答问题。

比如一个页面反复出现“GEO 服务商”“GEO 优化公司”“GEO 排名提升”这些词,但没有解释:

  • GEO 到底解决什么问题
  • 适合什么企业
  • 为什么有效
  • 和传统 SEO 有什么不同
  • 有什么案例、数据、边界条件

那么 AI 在做总结时,可提取的信息其实很少。

2. 它不利于生成式引擎抽取“可引用句子”

生成式引擎喜欢的是能直接拿来组织答案的内容单元,比如:

  • 明确结论
  • 可验证数据
  • 有来源的表述
  • 带上下文的解释
  • 可以独立成立的问答句

关键词堆砌型页面往往句子空泛、重复、缺少信息密度。这样的内容即使被抓到,也不容易进入最终回答。

3. 它可能释放低质量信号

论文并没有把“关键词堆砌为什么差”拆成搜索引擎内部的全部因果链路,但它的实验结果已经足够说明一个方向:

当内容的优化方式更像“操控匹配”,而不是“增强理解与证据”时,生成式引擎并不会给出正反馈。

这也是为什么很多老 SEO 页面在 AI 搜索中表现一般:不是因为它们没词,而是因为它们缺少可供 AI 安全复述的高质量语义内容。

五、论文里哪些方法有效?为什么它们都更接近“语义增强”?

这篇论文最有意思的一点是:它不是只说“关键词没用”,而是给出了更有效的替代方向。

论文表现较好的几类方法包括:

  • Cite Sources:补充来源与引用
  • Quotation Addition:补充相关引语
  • Statistics Addition:补充统计数据
  • Fluency Optimization:提升表达清晰度与流畅度

这些方法表面上看很不同,但底层是一致的。它们都不是在机械重复词,而是在强化四类能力:

  • 语义明确:让页面更准确表达“它到底在说什么”
  • 事实支撑:让结论有证据,而不是只有立场
  • 可引用性:让 AI 更容易抽取句子进入答案
  • 可信度:让模型更敢把这段内容拿去回答用户

换句话说,论文真正支持的不是“从关键词转向另一个小技巧”,而是从词频思维转向语义与证据思维

六、这能不能直接理解成“AI 只看语义,不看关键词”?

不能这么说得过头。

更严谨的说法应该是:

在生成式引擎里,关键词不再是核心杠杆;相比词频本身,语义相关性、事实密度、结构清晰度和可引用性更重要。

这里要区分两层:

  • 论文直接证明的内容:关键词堆砌在 Perplexity 实验里效果较差;引用、统计、引语、流畅度优化更有效
  • 基于论文可合理推导的内容:生成式引擎的主导机制更偏向语义理解与证据整合,而不是传统意义上的关键词匹配

所以,如果企业今天还在用“多埋几个词,也许 AI 更容易抓到我”的方式做内容,大概率方向已经偏了。

七、对企业最实际的启发:页面该怎么改?

如果你的目标是让页面更容易进入 AI 的答案系统,那么优化重点应该从“词”切换到“信息单元”。

1. 把页面写成能回答问题,而不是只覆盖词

不要只围绕关键词写标题,而要围绕真实问题写内容,例如:

  • 什么企业适合做 GEO?
  • GEO 和 SEO 到底有什么区别?
  • 为什么 AI 搜索里品牌会被误读?
  • 做 GEO 需要哪些基础数字资产?

2. 提高事实密度

把这些内容补全:

  • 定义
  • 原理
  • 数据
  • 案例
  • 条件
  • 边界

AI 越容易抽取到完整事实,越容易引用你。

3. 让关键段落具备“可引用性”

页面里应该有更多能被独立摘出的段落,比如:

  • 一句话定义
  • 三点式判断
  • 对比表格
  • FAQ 问答
  • 带数据的总结句

这些结构都比简单重复关键词更适合被生成式引擎使用。

4. 引入第三方证据与来源

论文的实验已经很明确:来源、引语、统计数据 是有效信号。

这意味着企业页面不能总停留在“我们很好”的自述层面,而要逐步补足:

  • 行业研究
  • 客户案例
  • 可核查数据
  • 第三方报道
  • 公开标准或权威材料

5. 保持品牌语义一致

不同页面、不同渠道对同一个产品的定义、适用场景、核心能力,最好保持一致。因为生成式引擎在做整合时,非常依赖这种跨页面、跨来源的一致性。

八、一个更适合 AI 时代的判断标准

以后判断一篇页面写得好不好,不能只问:

  • 这个词出现了多少次?
  • 标题里埋了几个目标词?
  • 这个页面覆盖了多少长尾词?

还要多问四个问题:

  • 这篇内容有没有真正回答用户问题?
  • 有没有足够的事实和证据?
  • 有没有清晰到可以被 AI 直接引用的表达?
  • 这篇内容读完之后,AI 会不会更容易“正确理解”这个品牌?

如果这四个问题答不出来,那么即使关键词做得很满,这篇页面在生成式引擎里也未必有好结果。

结语:AI 搜索时代,赢的不是“词最多”的页面,而是“最容易被理解和引用”的页面

从这篇 KDD 2024 论文看,生成式引擎优化已经给出一个非常清晰的方向:

  • 传统 SEO 的部分方法不再直接适用
  • 关键词堆砌在真实生成式引擎实验里表现不佳
  • 更有效的方法是增强语义表达、补充证据、提高可引用性和内容可信度

所以,企业今天真正该优化的,不是“怎么把关键词埋得更深”,而是:

怎么把官网、文章、案例、FAQ 和品牌资料,写成一套 AI 更容易理解、更愿意引用、也更敢推荐的语义资产。

参考资料

  1. Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. GEO: Generative Engine Optimization. arXiv:2311.09735, first submitted on November 16, 2023. https://arxiv.org/abs/2311.09735
  2. Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '24), August 25-29, 2024, Barcelona, Spain. DOI: https://doi.org/10.1145/3637528.3671900

觉得这篇洞察有价值?

联系语策科技,探讨AI技术如何赋能您的业务。

联系我们 →