通过NLP(自然语言处理)改善内容

仅针对搜索引擎优化内容的日子已经一去不复返了。对于现代谷歌搜索引擎优化,您的内容需要同时取悦机器人和人类。但是你怎么知道你正在写的东西可以检查人和机器的盒子?

在今天的 Whiteboard Friday 中,Ruth Burr Reedy 重点介绍了她最近在 MozCon 2019 上的部分演讲,并向我们介绍了 Google 如何使用 NLP(自然语言处理)来真正理解内容,以及如何利用这些知识来更好地优化您所写的内容人和机器人一样。

单击上面的白板图像以在新选项卡中打开高分辨率版本!

视频转录

你好,莫兹球迷。我是 Ruth Burr Reedy,是 UpBuild 的战略副总裁,UpBuild 是一家专门从事技术 google SEO 和高级网络分析的精品技术营销机构。我最近在 MozCon 上谈到了谷歌 SEO 的基本框架,并探讨了我们行业的变化,即考虑到谷歌 SEO,因为我们是向人类营销的人类,但我们使用机器作为中介。

这些视频将在某个时候在线提供。[编者注:现在就是这一点!] 但是今天我想谈谈我的演讲中的一个观点,我发现它真的很有趣,它改变了我处理内容创作的方式,这就是写内容的想法谷歌这个机器人更容易理解,实际上可以让你成为一个更好的作家,帮助你为人类写出更好的内容。这是双赢的。 

实体、单词之间的关系以及人们如何搜索

为了了解谷歌目前是如何解析内容并理解内容是什么,谷歌在神经匹配和自然语言处理等方面花费了大量时间、精力和大量资金,它们基本上试图理解人们何时说话,他们在说什么?

这伴随着搜索的发展,使其更具对话性。但是很多时候有人在搜索,但他们并不完全知道自己想要什么,而谷歌仍然希望他们得到他们想要的东西,因为这就是谷歌赚钱的方式。他们花费大量时间试图了解实体之间和单词之间的关系以及人们如何使用单词进行搜索。

丹尼沙利文在网上举的例子,我认为这是一个很好的例子,如果有人在他们的电视上体验肥皂剧效果。如果你看过肥皂剧,你会注意到它们看起来有点奇怪。有人可能正在经历这种情况,但不知道这叫什么,他们无法通过 Google 搜索肥皂剧效果,因为他们对此一无所知。

他们可能会搜索诸如“为什么我的电视看起来很有趣?”之类的内容。神经匹配帮助谷歌理解当有人搜索“为什么我的电视看起来很有趣?”时 一个可能的答案可能是肥皂剧效应。所以他们可以提供这样的结果,人们很高兴。 

了解显着性

当我们考虑自然语言处理时,自然语言处理的一个核心组成部分是理解显着性。

显着性、内容和实体

显着性是一个词的方式来总结这段内容关于这个特定实体的程度如何?在这一点上,谷歌真的很擅长从一段内容中提取实体。实体基本上是名词,人,地方,事物,专有名词,常规名词。

实体是事物、人等,数字之类的事物。谷歌真的很擅长把这些拿出来,然后说:“好的,这是这段内容中包含的所有实体。” Salience 试图了解它们之间的关系,因为 Google 在抓取页面时真正试图了解的是:该页面是关于什么的,这是关于该主题的页面的一个很好的示例吗?

显着性真的进入了第二部分。任何给定实体在多大程度上是一段内容的主题?一个人创建的内容实际上与任何事物无关的程度通常令人惊讶。我想我们都经历过。

你正在搜索,然后你来到一个页面,你就像,“这太模糊了。这太宽泛了。这说它是关于一件事,但实际上是关于另一件事。我没有找到什么我需要。这对我来说不是很好的信息。” 作为营销人员,我们经常站在另一边,试图让我们的客户说出他们的产品在他们的网站上的实际作用,或者说,“我知道你认为你为假期创建了 Instagram 指南。但你实际上写了一段关于假期,然后是七段关于你的新 Instagram 工具。这实际上不是关于假期 Instagram 的博客文章。这是关于你的工具的一段内容。这些是我们作为营销人员进行的战斗。 

自然语言处理 (NLP) API

幸运的是,现在有许多不同的 API 可用于理解自然语言处理: 

  • IBM 有一个:https://www.ibm.com/watson/services/natural-language-understanding/ 
  • Google 实际上有一个自然语言处理 API,就在 https://cloud.google.com/natural-language/

它和他们在自己的东西上使用的一样复杂吗?可能不是。但是你可以测试一下。放入一段内容,看看 (a) Google 能够从中提取哪些实体,以及 (b) Google 认为这些实体中的每一个对于整个内容的重要性。再一次,关于这件事的这段内容到什么程度?

所以这个自然语言处理 API,你可以免费试用,如果你想用它构建一个工具,它实际上并不昂贵,它将分配每个实体,它可以提取 0 到 1 之间的显着分数,说, “好吧,我们有多确定这段内容是关于这个东西而不是仅仅包含它?”

因此,您越接近 1 或越接近 1,该工具就越有信心认为这段内容是关于这件事的。0.9 会非常非常好。0.01 表示它存在,但他们不确定它的相关性如何。 

显着性和实体如何工作的一个很好的例子

我在这里举的例子,这不是取自真实的内容——这些数字是虚构的,只是一个例子——如果你有巧克力曲奇食谱,你会想要巧克力曲奇或巧克力曲奇食谱,巧克力曲奇,像这样的东西是第一实体,最突出的实体,你会希望它有一个相当高的突出分数。

您会希望该工具感到非常自信,是的,这段内容是关于这个主题的。但是您还可以看到它正在提取的其他实体,以及它们在多大程度上对主题也很重要。所以你可以看到像如果你有一个巧克力曲奇食谱,你会期望看到像饼干,黄油,糖,350,这是你加热烤箱的温度,所有不同的东西结合在一起制作一个巧克力曲奇食谱。

但我认为,对于我们作为谷歌 SEO 的我们来说,了解显着性是相关关键字的未来是非常非常重要的。我们已经超出了优化巧克力曲奇食谱的时间,我们还将寻找巧克力食谱、巧克力片、巧克力曲奇食谱之类的东西。词干、变体、TF-IDF,这些都是用于理解一段内容的旧方法。

相反,我们需要了解的是,谷歌使用其庞大的知识体系、使用 Freebase 之类的东西、使用大部分互联网,谷歌在哪里看到这些实体以他们认为合理的速度共同出现确信某个实体上的一段内容为了突出该实体会包括这些其他实体?

使用专家是创建主题突出内容的最佳方式

所以巧克力曲奇的配方,我们现在还要确保我们添加了黄油、面粉、糖之类的东西。如果你真的有一个巧克力曲奇食谱可以放在那里,这实际上很容易做到。这就是我认为我们将开始看到的谷歌搜索引擎优化中的内容趋势是,创建主题突出内容的最佳方法是让该主题的实际专家创建该内容。

对某个主题有深入了解的人自然会包含同时出现的术语,因为他们知道如何创建与它应该是什么有关的东西。坦率地说,我认为我们将开始看到人们将不得不开始为内容营销支付更多费用。不幸的是,许多公司似乎认为内容营销是而且应该是便宜的。

内容营销人员,我觉得你。糟透了,现在已经不是这样了。我们需要开始投资内容并投资专家来创建内容,以便他们能够创建每个人真正需要的深刻、丰富、突出的内容。 

你如何使用这个 API 来改进你自己的谷歌搜索引擎优化? 

我喜欢用这类信息做的一件事是看——这是我多年来一直在做的事情,只是不是在这种情况下——但一般来说,一个主要的优化目标是为一个主题排名的页面,但它们在第 2 页上排名。

这通常意味着谷歌理解该关键字是页面的主题,但它不一定理解它是关于该主题的一个很好的内容,该页面实际上仅与该内容有关,它是一个好资源。换句话说,信号在那里,但很弱。

您可以做的是获取排名但不是很好的内容,通过此自然语言 API 或其他自然语言处理工具运行它,并查看实体是如何提取的,以及 Google 如何确定它们彼此相关。有时您可能需要做一些消歧。所以在这个例子中,你会注意到虽然巧克力饼干被称为艺术品,我同意,这里的饼干实际上被称为其他。

这是因为 cookie 不仅仅意味着一件事。有饼干,烘焙食品,还有饼干,数据包。这两者都是“cookie”一词的合法使用。单词有多种含义。如果您注意到 Google,这种自然语言处理 API 无法正确分类您的实体,那么现在是进行消除歧义的好时机。

确保围绕该术语的术语清楚地表明:“不,我指的是烘焙食品,而不是软件数据。” 这是提高你的显着性的一种非常好的方法。看看你的主要实体是否有很高的突出分数。您会惊讶于您可以将多少内容插入此工具,而最重要的、最显着的实体仍然只是 0.01、0.14。

很多时候,API 就像“我认为这就是它的意义所在”,但并不确定。现在是进入并提升内容、使其更加健壮并研究如何使这些实体更易于提取和相互关联的好时机。这让我想到了第二点,这是我在世界上最喜欢的新事物。

为人类写作和为机器写作,你现在可以同时做这两件事。您不再需要,而且您真的很长时间都不需要这样做了,但是您可以为 Google 设置关键字或以其他方式为您的用户可能看不到或不关心的内容创建内容的想法是方式,方式,方式超过。

现在,您可以为 Google 创建对用户也更好的内容,因为机器可读性和人类可读性的原则越来越接近。 

编写人类和机器可读性的提示:

减少语义距离!

我在这里所做的是我做了一些研究,不是关于自然语言处理,而是关于写作以提高人类可读性,这是作家和写作专家关于如何写得更好、更清晰、更容易阅读、更容易理解的内容的建议。然后我拿出了一些建议,这些建议也可以作为自然语言处理写作的建议。因此,自然语言处理再次是谷歌或任何可能正在处理语言的东西试图理解实体在给定内容主体中如何相互关联的过程。

简短而简单的句子

简短、简单的句子。简单写。不要使用太多华丽的语言。简短的句子,并尽量保持每个句子一个想法。 

每句话一个想法

如果你继续前进,如果你有很多不同的从句,如果你使用了很多代词并且你正在谈论的内容变得混乱,这对读者来说不是很好。

它还使机器更难解析您的内容。 

将问题与答案联系起来

然后将问题与答案紧密联系起来。所以不要说,“烤饼干的最佳温度是多少?好吧,让我给你讲一个关于我祖母和我童年的故事”,500 字之后就是答案。将问题与答案联系起来。 

这三个可读性技巧的共同点是它们归结为减少实体之间的语义距离。

如果您希望自然语言处理了解您的内容中的两个实体密切相关,请将它们在句子中靠得更近。将单词靠得更近。减少杂乱,减少绒毛,减少机器人可能必须在一个实体和另一个实体之间进行的语义跳数以理解关系,您现在已经创建了更具可读性的内容,因为它更短且更容易浏览,但也更容易让机器人解析和理解。

先具体,再解释细微差别

回到“烘烤巧克力曲奇的最佳温度是多少?”的例子。现在,烘烤巧克力饼干的最佳温度的真正答案取决于它。你好。嗨,我是谷歌 SEO,我刚刚回答了一个问题,这取决于。它确实取决于。

这是真的,那是真的,但这不是一个好的答案。它也不是机器人可以提取和复制的东西,例如语音搜索或特色片段。如果有人说,“好吧,谷歌,烤饼干的最佳温度是多少?” 谷歌说,“这取决于”,这对任何人都没有帮助,即使这是真的。因此,为了编写机器和人类可读性,首先要具体,然后你可以解释细微差别。

然后你可以进入细节。因此,对于“烘烤巧克力曲奇的温度是多少?”,这是一个更好的正确答案。烘烤巧克力曲奇的最佳温度通常在 325 到 425 度之间,具体取决于您的海拔高度和您喜欢曲奇的脆度。这和它所依赖的一样真实,事实上,它所依赖的意思是一样的,但它更具体。

它要精确得多。它使用实数。它提供了一个真实的答案。我缩短了问题和答案之间的距离。我没有说这取决于第一。我说这取决于最后。这就是你可以做的事情,以提高人类和机器的可读性和理解力。

言归正传(不要埋没领导)

言归正传。不要埋没铅。你们所有试图成为内容营销人员的记者,然后内容营销中的每个人都说,“哦,你需要等到最后才明白你的意思,否则他们不会读完整篇文章,”你就像, “不要埋没铅,”你是对的。对于那些不熟悉新闻业的人来说,不埋头苦干基本上意味着要先入为主,在顶部。

包括某人真正需要从该内容中获取的所有信息。如果他们不阅读其他任何内容,他们会阅读那一段并且他们已经掌握了要点。那么想深入的人就可以深入。这就是人们真正喜欢消费内容的方式,令人惊讶的是,这并不意味着他们不会阅读内容。这只是意味着如果他们没有时间,如果他们需要一个快速的答案,他们就不必阅读它。

机器也是如此。切入正题。立即弄清楚你的内容的主要实体、主要主题、主要焦点是什么,然后进入细节。您将拥有更易于从各个方面解析的结构更好的内容。 

避免行话和“营销言论”

避免行话。避免营销言论。它不仅可怕而且很难理解。你经常看到这个。我再次回到让你的客户说出他们的产品做什么的例子。您与很多 B2B 公司合作,您会经常遇到这种情况。是的,但它有什么作用?它提供了简化工作流程的解决方案,等等。好的,它有什么作用?对于公司来说,这是一种非常非常难以摆脱的事情,但对于用户和机器来说,它是如此重要。

避免行话。避免营销言论。不要太重言式,但一个词越深奥,它就越不常用。这实际上就是深奥的意思。这意味着一个词使用得越少,谷歌就越不可能理解它与其他实体的语义关系。

把事情简单化。请明确点。说出你的意思。抹去所有的行话。通过消除行话和营销语言以及内容中可能发生的绒毛,您还可以再次减少实体之间的语义距离,使它们更易于解析。 

组织您的信息以匹配用户旅程

组织它并将其映射到用户旅程。想想某人可能需要的信息以及他们可能需要它的顺序。 

用标题划分子主题

然后用小标题把它分开。这就像非常非常基本的写作建议,但你们都没有这样做。所以如果你不打算为你的用户做这件事,那就为机器做。 

用项目符号或数字格式化列表

您还可以通过使用项目符号或数字划分列表来真正影响用户的略读能力。

这样做的好处是,用项目符号或数字划分列表也使机器人更容易解析和提取信息。如果这些提示中的许多看起来与您用于获取精选片段的提示相同,那么它们就是,因为精选片段实际上是一个很好的指标,表明您正在创建机器人可以找到、解析、理解的内容,然后提取,这就是你想要的。

因此,如果您的目标是精选片段,那么您可能已经做了很多这样的事情,干得好。 

语法和拼写计数!

最后一件事,我不应该说,但我要说的是语法,拼写和标点符号以及类似的东西绝对重要。他们计入用户。它们不计入所有用户,但它们计入用户。他们也算搜索引擎。

诸如语法、拼写和标点符号之类的东西对于机器来说是非常非常容易找到和解析的信号。谷歌在一些事情上很具体,比如“质量评估指南”,这是一份写得很好、结构良好、拼写正确、语法正确的文件,这些都是权威性的标志。我并不是说拥有一个非常拼写的文档就意味着你会立即飞升到结果的顶部。

我是说,如果你不在那些东西上,它可能会伤害你。所以花点时间确保一切都很好而且整洁。你可以使用普通话英语。你不必一直都是完美的“AP 风格指南”。但请确保您从语法和技术角度正确格式化。我喜欢这一切,这只是一篇好文章。

这是一篇好文。这很容易理解。很容易解析。仍然很难,尤其是在营销领域,要摆脱行话的世界,直截了当,停止写 2000 个单词,因为我们认为我们需要 2000 个单词,真正思考我们创造的内容是什么我们认为这是关于。

使用这些工具来了解您的内容的可读性、可解析性和可理解性

所以我对谷歌搜索引擎优化世界和你的希望是,你可以使用这些工具,而不仅仅是考虑如何输入完美的关键字密度或任何东西,以在自然语言处理 API 的显着性上获得近乎完美的分数。我希望您将使用这些工具来帮助自己了解您的内容的可读性、可解析性和可理解性,您的内容与您所说的内容和您认为的内容有关,以便您可以创建为用户提供更好的东西。

它使互联网成为一个更好的地方,它可能也会让你赚到一些钱。所以这些是我的想法。如果您现在正在使用自然语言处理 API,如果您已经用它构建了一个工具,如果您想用它构建一个工具,我很乐意在评论中听到,您对此有何看法,如何做你用这个,怎么样了。告诉我这一切。Holla atc​​ha 女孩。

有一个伟大的星期五。

Speechpad.com 的视频转录

发表评论

立即获取出海数字营销方案

请输入您的资料

你也可以直接右下角客服直接跟我们联系
=

请输入您的资料

seo
你也可以直接右下角客服直接跟我们联系
=

request a quote