本博客由 Portent, Inc. 的前转换率优化策略师 Tim Mehta 撰写。
运行 A/B/n 实验(又名“拆分测试”)以提高您的搜索引擎排名在谷歌 SEO 工具包中的使用时间比许多人想象的要长。Moz 实际上早在 2015 年就发表了一篇文章来探讨这个主题,这是对如何运行这些测试的一个很好的总结。
我想在这里介绍的是了解运行谷歌 SEO 拆分测试的正确时间,而不是你应该如何运行它们。
我在一家以谷歌 SEO 闻名的机构运行 CRO 程序。谷歌搜索引擎优化团队在准备运行谷歌搜索引擎优化拆分测试时将我带入,以确保我们在实验方面遵循最佳实践。这让我有机会了解 google SEO 目前如何进行拆分测试,以及我们可以在哪些方面改进该过程。
在从事这些项目时,我最大的观察之一是最紧迫且经常被忽视的问题:“我们应该测试它吗?”
运行不必要的谷歌 SEO 拆分测试的风险
下面你会发现运行谷歌搜索引擎优化拆分测试的一些潜在风险。您可能愿意承担其中的一些风险,而您绝对希望避免其他一些风险。
资源浪费
使用页面拆分测试(不是 google SEO 拆分测试),您可以更加敏捷并每月启动多个测试,而无需花费大量资源。此外,通过我们的工具可轻松获得计算器和公式,可以更轻松地执行测试前和测试后分析。
使用 google SEO 拆分测试,计划测试、实际设置和执行测试需要大量的工作。
您实际上所做的是将站点上类似页面的现有模板拆分为两个(或更多)单独的模板。这需要大量的开发资源并带来更大的风险,因为如果事情进展不顺利,您不能简单地“关闭测试”。正如您可能知道的那样,一旦您做出改变以损害您的排名,要让他们回来是一场漫长的艰苦战斗。
用于预测您需要运行测试多长时间才能达到统计显着性的预测试分析更加复杂,并且在 google SEO 拆分测试中占用了大量时间。这并不像“哪个获得更多自然流量?”那么简单。因为您测试的每个变体都有其独特的属性。例如,如果您选择对一半产品与另一半产品的产品页面模板进行拆分测试,则每个变体中的实际产品都会对其性能产生影响。
因此,您必须根据其中存在的页面为每个变体创建有机流量的预测,然后将实际数据与您的预测进行比较。本质上,使用你的预测作为失败或成功的主要指标是危险的,因为预测只是有根据的猜测,不一定反映现实。
对于测试后分析,由于您正在测量自然流量与假设的投影,因此您必须查看其他数据点以确定成功。Portent 的高级谷歌 SEO 策略师 Evan Hall 解释说:
“总是使用确凿的数据。查看相关的关键字排名、关键字点击次数和点击率(如果您信任 Google Search Console)。如果您发现 GSC 数据与您的 Google Analytics(分析)数据非常匹配,您就可以放心地依赖它。”
计划测试、在实际站点上开发测试、“结束”测试(如果需要)以及事后分析测试的时间都是艰巨的任务。
正因为如此,您需要确保您在进行实验时有一个强有力的假设,并且变异与原始版本有足够的差异,您会发现它们的性能存在显着差异。您还需要证实可能指向成功的数据,因为有机流量与您的预测相比不够可靠,无法对您的结果充满信心。
无法缩放结果
有很多因素会影响您的搜索引擎排名,而这些因素是您无法控制的。这些会导致大量外部变量,这些变量会影响您的测试结果并导致误报或误报。
这会损害您从测试中学习的能力:是我们的变体模板还是导致结果的其他外部因素?不幸的是,对于谷歌和其他搜索引擎,从来没有一个明确的方法来回答这个问题。
如果没有验证和理解是您所做的确切更改导致了结果,您将无法将获胜的概念扩展到其他渠道或网站的部分。虽然,如果您更关注个人成果而不是学习,那么这对您来说可能不会有太大的风险。
何时运行 google SEO 拆分测试
关键字或查询性能的不确定性
如果您针对特定类别的一系列页面具有用户在查找该主题时搜索的各种关键字/查询,您可以安全地参与元标题或元描述谷歌 SEO 拆分测试。
从转化率的角度来看,拥有与用户意图更相关的关键字通常会带来更高的参与度。尽管如前所述,您的大多数测试都不会成为赢家。
例如,我们有一个轮胎零售行业的客户,他出现在 SERP 中进行各种“轮胎”查询。这包括诸如冬季轮胎、季节性轮胎、性能轮胎等。我们假设在冬季月份在我们的元标题中包含更具体的短语“冬季”轮胎而不是“轮胎”会导致更高的点击率和更多的自然流量来自 SERP。虽然我们的结果最终没有定论,但我们了解到更改此元标题不会损害自然流量或点击率,这为我们提供了进行后续测试的绝佳机会。
您还可以利用此策略在元数据中测试更高容量的关键字。但这种方法也从来都不是确定的事情,值得首先测试。正如 Moz 周五在白板上强调的那样,他们看到“在更新标题等中的元信息以定位更常搜索的变体后,自然流量下降了 20% 以上。”
换句话说,定位更高容量的关键字似乎很容易,但它总是值得首先测试。
大型站点的概念验证和风险缓解
这是运行 google SEO 拆分测试的最常见调用。因此,当这种情况变成测试的主要机会时,我们联系了一些专家以了解他们的看法。
JLH Marketing 总裁 Jenny Halasz 谈到使用 google SEO 拆分测试来证明尚未得到认可的概念或想法:
“我多次发现,建议客户在较小的页面或类别子集上尝试某些东西作为‘概念证明’非常有效。通过保持控制并关注趋势而不是整数,我可以经常向客户展示更改模板如何对搜索和/或转化产生积极影响。”
她接着引用了一个现有示例,该示例强调了除操作模板之外的替代测试策略:
“我现在正在与客户进行一项测试,以查看产品子集中的一些智能内部链接(使用 InLinks 和 OnCrawl 的 InRank)是否适用于他们。这个测试看起来真的很有趣,因为更改并不是真正的模板更改,而是类别内的导航更改。如果它按我的预期工作,这可能意味着对这个客户进行全面的重新设计。”
Ian Laurie 强调使用 google SEO 拆分测试作为风险缓解工具。他解释说:
“对我来说,这与规模有关。如果您要实施影响数万或数十万页的更改,则运行拆分测试是值得的。谷歌的不可预测性,改变这么多页面可能有很大的好处或坏处。通过测试,您可以管理风险并在企业网站上获得客户(外部或内部)的认可。”
如果您负责一个严重依赖非品牌自然搜索的大型网站,那么在发布对模板的任何更改之前进行测试是值得的,无论更改的大小如何。在这种情况下,您不一定希望获得“赢家”。你的愿望应该是“不会破坏任何东西”。
Evan Hall 强调,您可以利用拆分测试作为一种工具来证明您难以接受的较小更改:
“预算理由是用于测试需要大量开发人员时间或写作的更改。一些电子商务网站可能希望在每个 PLP 上添加一段文字简介,但这可能需要大量的文字才能保证某些东西能正常工作。如果测试表明内容将提供 1.5% 以上的自然流量,那么编写所有文本的努力是合理的。”
对模板进行重大更改
在实验中,有一个称为“最小可检测效应”(MDE)的指标。此指标表示您期望变体与原始版本的性能差异百分比。您的原始版本和您的变体之间的变化和差异越多,您的 MDE 就应该越高。
下图强调,您的 MDE(提升)越低,您需要越多的流量才能达到具有统计意义的结果。反过来,MDE(提升)越高,您需要的样本量就越少。
例如,如果您正在重新设计产品页面模板的网站架构,您应该考虑使其从视觉和后端(代码结构)角度都明显不同。虽然用户研究或页面 A/B 测试可能导致了新的架构或设计,但仍不清楚提议的更改是否会影响排名。
这应该是您运行 google SEO 拆分测试的最常见原因。鉴于测试前和测试后分析的所有主观性,您希望确保您的变体产生足够不同的结果,以确信变体确实产生了重大影响。当然,变化越大,风险也越大。
虽然较大的网站可以测试较小的东西,但它们仍然受制于自己的猜测。对于不太健壮的网站,如果您要在模板上运行 google SEO 拆分测试,它需要足够不同,不仅要让用户表现不同,而且要让 Google 以不同方式评估和排名您的页面。
谷歌 SEO 拆分测试的交流实验
无论您的谷歌搜索引擎优化专业知识如何,与利益相关者就实验进行沟通都需要一套自己的技能。
对测试的期望非常不稳定。有些人希望每次测试都能获胜。有些人希望你给他们明确的答案,告诉他们什么会更好。不幸的是,这些都是错误的期望。为了避免它们,您需要尽早为您的经理、客户或您为其进行拆分测试的任何人建立现实的期望。
期望 1:你的大部分测试都会失败
这种理解是所有成功的实验计划的支柱。对于不接近主题的人来说,它也是最难吞下的药丸。你必须让他们接受这样一个事实,即在测试的第一次迭代中投入的时间和精力很可能会导致一个不确定或失败的测试。
实验和拆分测试最有价值的方面是每个测试经历的迭代过程。成功实验的真正结果,无论是 google SEO 拆分测试还是其他类型,都是导致主要 KPI 逐渐增加的多项测试的结果。
期望 2:您正在处理概率,不确定的事情
这种期望尤其适用于 google SEO 拆分测试,因为您正在利用各种指标作为成功的间接信号。这有助于人们理解,即使您达到 99% 的显着性,一旦实施获胜变体,也无法保证结果。
这一原则还为您提供了测试前和测试后分析的回旋余地。这并不意味着您可以根据自己的喜好操纵数据,但确实意味着您不需要花费数小时来提出经验数据驱动的预测。它还允许您根据您正在分析的所有指标利用您的主观专家意见来确定成功。
期望 3:您需要足够大的样本量
如果没有足够大的样本量,您甚至不应该考虑运行 google SEO 拆分测试,除非您的利益相关者有足够的耐心等待几个月的结果。
SearchPilot 和 Distilled 的顾问 Sam Nenzer 解释了如何知道您是否有足够的流量进行测试:“在我们使用 google SEO 拆分测试的过程中,我们已经生成了一条经验法则:如果网站部分类似页面每天总共不会收到至少 1,000 个自然会话,因此很难衡量拆分测试的任何提升。”
因此,如果您的网站没有合适的流量,您可能希望默认采用低风险实施或竞争性研究来验证您的想法。
期望 4:实验的目标是通过潜在的性能改进来降低风险
这里的关键术语是“潜在的”性能改进。如果您的测试产生了一个成功的变体,并且您在整个站点上实施它,不要指望会发生与您在测试期间看到的相同的结果。所有测试的真正目标是向您的站点引入新想法,并且风险非常低,并且有可能改进指标。
例如,如果您正在更新 PDP 模板的架构或代码以适应 Google 算法更改,则目标不一定是增加自然流量。目标是减少您可能从算法更改中看到的负面影响。
让您的利益相关者知道您还可以利用拆分测试来提高业务价值或内部效率。这包括发布用户从未见过的代码更新,或者一次针对页面组或多个微型站点的 URL/CMS 更新。
概括
虽然运行 google SEO 拆分测试很诱人,但您必须了解它的内在风险,以确保您从中获得所需的真正价值。这将帮助您了解场景何时需要拆分测试或替代方法。您还需要从一开始就与现实的期望进行交流。
使用谷歌 SEO 拆分测试存在重大的固有风险,而 CRO 通常运行的页面测试是您看不到的,包括资源浪费和不可扩展的结果。
您应该对参与 google SEO 拆分测试充满信心的一些场景包括您不确定关键字和查询性能、大型网站的概念验证和风险缓解、需要强大资源的想法的理由,以及当您考虑对模板进行重大更改时。
请记住,实验的最大挑战之一是正确地与他人交流。每个人对测试都有不同的期望,因此您需要领先于它并立即满足这些期望。
如果您在自己的工作中看到过与 google SEO 拆分测试相关的其他场景或风险,请在下面的评论中分享。