搜索不仅仅是匹配关键词——当我们谈论语义搜索时,这更是如此。
语义搜索是在合适的时间为搜索者找到合适的信息。
这不仅仅是找到正确的关键词和概念,以及推测搜索者将如何与结果互动。
人工智能(AI)重新排名将获取来搜索的人的信息,并根据个人定制搜索结果。
这可以在队列水平上进行,根据趋势、季节性和流行程度改变结果。
也可以单独进行,根据当前搜索者的愿望更改结果。
虽然人工智能重新排名不容易在搜索引擎中实现,但它为转化率和搜索者满意度带来了巨大的价值。
用人工智能重新排序
人工智能驱动的重新排名可以改善搜索结果,无论搜索引擎使用的是哪种底层排名算法。
这是因为好的搜索结果不仅仅是文本相关性和商业指标,比如原始流行度。
好的结果考虑了其他信号,并在每个查询级别上这样做。
要了解为什么这很重要,让我们关注流行度的商业指标。
这是一个很好的总体排名信号,但可能无法满足特定的查询。“红色连衣裙”的搜索查询可能会在第一个结果中显示两种不同的连衣裙:“带有红色口音的无背连衣裙”和“亮红色的夏季连衣裙”
无背的
服装可能作为整体服装和产品更受欢迎。
但在这种情况下,具体来说,这不是客户想要的。
他们想要一件红色的衣服,而不是一件带有红色口音的衣服,因此他们点击购买。
难道搜索引擎不应该把这作为一个信号,让夏季服装排名更高吗?
搜索分析
正如上面的例子所示:理解搜索者在做什么是重新排序的必要条件。
要跟踪的两个最常见事件是点击和转换。
通常,这是仅有的两个必要事件,并且必须是来自搜索的事件。
上面的示例还强调了另一个重要的考虑:事件应该与特定查询关联。
这允许搜索引擎从不同结果集和用户交互之间的相互作用中学习。在“红色连衣裙”查询的搜索结果中,它将夏季连衣裙推到更高的位置。
同一产品在其他查询中可能不如其邻居受欢迎。
当看你的不同事件时,你也会想以不同的方式衡量它们。
点击结果是兴趣的标志,而购买(或任何其他转换指标)是承诺的标志。
排名应该反映这一点。
权重不需要复杂。
你可以简单地说转换值得双击。
您应该为自己的搜索测试正确的比率。
您还可能希望根据搜索者看到的结果排名对事件进行折扣。
我们知道结果的位置影响其点击率(CTR)。
如果不考虑事件,您可能会遇到这样的情况:顶级结果变成e
甚至更根深蒂固,因为他们得到了更多的互动,这使他们排名更高——并且无限重复。
新鲜度和季节性
对抗这种自增强循环的一种简单方法是根据事件发生后经过的时间对事件进行折扣。
这是因为过去发生的每个事件对重新排名的影响越来越小。也就是说,直到某个时候,它根本没有影响。
例如,您可以将每个事件的影响除以2,每天30天。30天后,停止使用事件进行排名。
在重新排序算法中使用新鲜度的一个好处是,它还将季节性引入结果。
你不仅停止推荐几年前非常受欢迎的视频,而且对今天的人们来说很无聊;您还将在夏季推荐“学会游泳”视频,在冬季推荐“学会滑雪”视频。
YouTube在其算法中加入了季节性和新鲜度,正是为了这个目的。
使用信号重新排序
现在你已经得到了信号并随着时间衰减,你可以将它们应用于搜索结果。
当我们看到“人工智能”时,我们通常会想到非常复杂和难以理解的东西。
然而,人工智能也可以像我们在这里所做的那样,简单地随着时间的推移获取数据并使用它来做出决策。
一种简单的方法是获取一定数量的结果,然后简单地根据分数对它们重新排序。
出于性能原因,这个结果的数量通常相当小(10,可能20)。然后,按分数对它们进行排序。
正如我们上面所讨论的,分数可以简单地加上n
转换次数乘以2,再加上单击次数。
添加衰减函数会增加复杂性,基于结果位置的贴现也是如此——但同样的一般原则适用。
学习排名
这种重新排序系统的一个缺点是,您只能对较少数量的结果进行重新排序。
如果你的结果本来会很受欢迎,但排名不高,那么这个结果就不会得到应有的关注。
该系统还需要记录上的事件和要重新排序的查询。
它不适用于全新的产品发布或用户生成的内容(UGC),这些内容经常出现在搜索索引中。
学习排名(LTR)可以解决这些问题。
与我们上面讨论的重新排序非常相似,LTR也基于这样一种想法,即搜索者与之交互的记录比没有交互的记录更好。
之前的重新排序方法是在绑定到特定查询时直接提升或掩埋结果。
同时,LTR更加灵活。它的工作原理是基于其他流行结果提升或隐藏结果。
LTR使用机器学习来理解哪些查询是相似的(例如,“视频游戏”和“游戏控制台”)。
然后,它可以基于与更常见查询的交互,对不太流行的查询结果重新排序。
LTR不只是泛化查询;它在记录上也有普遍性。
LTR模型学习某一类型的结果是流行的;例如,任天堂切换游戏《塞尔达传奇:野性的呼吸》
然后,它可以开始连接到其他类似的结果(例如,“塞尔达传说:天空之剑”)并提升这些结果。
那么,如果LTR看起来比典型的重新排序功能强大得多,并且提供了更多的查询和记录覆盖,那么为什么不使用LTR呢?
(换言之:它的泛化效果更好。)
简而言之,LTR要复杂得多,需要更专业的内部机器学习(ML)专业知识。
此外,理解为什么某些结果在某些地方排名更为困难。
通过第一种类型的重新排序,您可以查看一条记录与另一条记录的点击次数和转换次数。
同时,在LTR中,您有一个ML模型,该模型建立的连接可能并不总是显而易见的。
(野生气息和音色真的很相似吗?)
个性化
虽然重新排名对所有搜索者都有效,但个性化就像它听起来的那样:个性化。
个性化的目标是获取已经相关的结果,并根据个人喜好重新排序。
虽然对于像谷歌这样的网络搜索引擎在其结果中使用个性化的程度存在争议,但个性化通常会影响现场搜索引擎中结果的性能。
这是一种有用的机制,可以增加搜索交互和搜索转换。
搜索分析
正如重新排名一样,个性化取决于und
了解用户如何与搜索结果交互。
通过跟踪点击和转换,您将更清楚地了解用户想要看到的结果类型。
在这方面,重新排名和个性化之间的一个显著区别是,根据您的搜索,您可能需要调整如何应用个性化。
例如,如果您销售杂货,您肯定希望推荐以前购买的产品。
但是如果你的网站销售书籍,你不会想推荐一本顾客已经买过的书。事实上,您甚至可能希望在搜索结果中向下移动这些书籍。
然而,你也不应该把个性化推得如此之大,以至于用户只能看到他们之前与之交互过的东西。
搜索增强了查找和发现能力。因此,如果他们返回搜索栏,你应该对他们想看到新东西的可能性持开放态度。
不要仅通过个性化对结果进行排名;将其与其他排名信号混合。
正如重新排名一样,个性化也从事件衰减中受益。
减少旧事件的影响使得搜索更准确地表示用户当前的口味。
在某种程度上,你可以把它看作是个人的季节性。
跨用户的个性化
到目前为止,我们所看到的个性化是基于个人自身的交互,但您也可以将其与其他人在搜索中所做的结合起来。
这种方法在用户以前没有与搜索结果中的项目进行交互的情况下显示了巨大的影响。
因为用户不与搜索结果项交互,所以您可以
根据定义,不要基于过去的互动来提升或埋葬。
相反,您可以查看与当前用户相似的用户,然后根据他们与之交互的内容进行个性化设置。
例如,假设您有一个用户从未到您这里来购买过衣服,但却购买了许多手提包。
然后,您可以寻找其他用户,他们有相似的品味,也与服装进行过互动。
直觉上,与我们的搜索者一样喜欢相同类型手提包的其他客户也应该喜欢相同的衣服。
为发现重新排序和个性化
搜索只是重新排名和个性化可以产生影响的一个例子。您也可以使用这些相同的工具进行发现。
秘密是将主页和分类页面视为搜索结果。
然后,很明显,您可以使用与搜索相同的工具,并获得相同的好处。
例如,主页类似于没有查询的搜索页面,不是吗?类别登录页面看起来确实像是应用了类别过滤器的搜索页面。
如果您为这些页面添加个性化和重新排名,它们的静态性会降低。他们将为用户提供他们喜欢的服务,并且他们可以将更受客户欢迎的商品推高。
别担心,伙计
化和重新排序可以与这些页面或内部搜索的编辑决策相混合。
处理这一问题的最佳方法是在某些地方固定期望的结果,并围绕它们重新排序。
我们已经看到,个性化和重新排名是两种方法,通过用户与相关信号的交互,使搜索更好。
您可以让您的用户群通过使用交互来影响结果。
一点一点地,这些交互告诉搜索引擎哪些项目应该排名更高。
最终,搜索者会从更好的搜索体验中受益,您也会从更多的点击和转换中受益。