在我的上一篇文章中,我解释了使用网络可视化工具如何帮助您极大地改进您的内容营销公关/外展策略——了解哪些新闻媒体拥有最大的联合网络,使您的外展团队能够优先考虑高联合出版物而不是低联合出版物。结果?您投放的内容享有更广泛的链接拾取。
今天,我将带您深入一点——我们将研究一些技术,以更好地了解您特定领域中的发布商联合网络。我将这项技术分为两部分:
- 技巧一——利用 Buzzsumo 影响者数据和推特抓取来寻找最有影响力的记者撰写任何主题
- 技术二——利用 Gdelt 数据集通过上下文链接揭示出版商之间的深度故事联合网络。
为什么要这样做?
如果您对大规模生成高价值链接感兴趣,这些技术提供了不可否认的竞争优势——它们可以帮助您深入了解作家和新闻出版物如何相互联系和联合。
在我们的 Fractl 看来,具有强大新闻钩子的数据驱动的内容故事,找到会发现内容引人注目的作家和出版物,并有效地推销它们是可能的最高投资回报率的谷歌 SEO 活动。如果操作正确,完全有可能生成数十个,有时甚至数百或数千个带有一个或几个内容活动的高权限链接。
让我们潜入水中。
使用 Buzzsumo 了解任何主题的记者影响者网络
首先,您想弄清楚谁是您的热门影响者是您的主题。Buzzsumo 的一个非常方便的功能是它的“影响者”工具。您可以在影响选项卡上找到它,然后按照以下步骤操作:
- 仅选择“记者”。这会将结果仅限于已知为记者和主要出版物记者的 Twitter 帐户。博主和较低权限的发布者将被排除在外。
- 使用主题关键字进行搜索。如果它很简单,一两次搜索应该没问题。如果它更复杂,请创建一些相关查询,并整理所有这些查询中出现的 Twitter 帐户。或者,在搜索中使用布尔“和/或”来缩小结果范围。确保您的搜索结果返回的记者与您的目标条件尽可能匹配,这一点至关重要。
- 理想情况下,您至少需要 100 个结果。只要您确定结果很好地代表了您的目标标准,通常越多越好。
- 对搜索结果满意后,单击导出以获取 CSV。
下一步是抓住这些知名记者网红所关注的所有人——目标是了解这 100 名左右的网红中哪一位对其他 100 名影响最大。此外,我们希望在这 100 人中找到许多共同关注的群体之外的人。
为此,我们利用了 Twint,这是一个在 Github 上提供的方便的 Twitter 抓取工具,可以吸引这些有影响力的记者关注的所有人。使用我们抓取的数据,我们构建了一个边缘列表,它允许我们在 Gephi 中可视化结果。
这是一个交互式版本供您探索,下面是它的截图:
该图向我们展示了哪些节点(影响者)具有最多的 In-Degree 链接。换句话说:它告诉我们,在我们的媒体影响者中,谁最受关注。
这些是前 10 个节点:
- Maia Szalavitz (@maiasz) 神经科学记者,副和时代
- Radley Balko (@radleybalko) 意见记者,华盛顿邮报
- Johann Hari (@johannhari101) 纽约时报畅销书作家
- David Kroll (@davidkroll) 自由医疗保健作家,福布斯希思
- Max Daly (@Narcomania) 全球药物编辑,VICE
- Dana Milbank (@milbank) 华盛顿邮报专栏作家
- Sam Quinones (@samquinones7),作者
- Felice Freyer (@felicejfreyer),波士顿环球报记者,心理健康和成瘾
- Jeanne Whalen (@jeannewhalen) 华盛顿邮报商业记者
- Eric Bolling (@ericbolling) 纽约时报畅销书作家
谁是最有影响力的?
使用 Gephi 给出的“Betweenness Centrality”分数,我们可以粗略了解网络中哪些节点(影响者)充当信息传输的枢纽。那些具有最高“Betweenness Centrality”的人可以被认为是网络的“连接器”。这些是前 10 位影响者:\
- Maia Szalavitz (@maiasz) 神经科学记者,副和时代
- David Kroll (@davidkroll) 自由医疗保健作家,福布斯希思
- Jeanne Whalen (@jeannewhalen) 华盛顿邮报商业记者
- Travis Lupick (@tlupick),记者,作家
- Johann Hari (@johannhari101) 纽约时报畅销书作家
- Radley Balko (@radleybalko) 意见记者,华盛顿邮报
- Sam Quinones (@samquinones7),作者
- Eric Bolling (@ericbolling) 纽约时报畅销书作家
- Dana Milbank (@milbank) 华盛顿邮报专栏作家
- Mike Riggs (@mikeriggs) 作家兼编辑,Reason Mag
@maiasz、@davidkroll 和 @johannhari101 是杰出的。“In-Degree”和“Betweenness Centrality”的获胜者之间有相当多的重叠,但它们仍然有很大的不同。
我们还能学到什么?
可视化的中间包含许多最大尺寸的节点。此视图中的节点大小由“In-Degree”决定。位于中心的大型节点不成比例地被图中的其他成员所关注,并且在所有方面都享有盛誉(来自许多其他有影响力的节点)。这些是其他人通常跟随的记者。筛选这些位于中心的节点会发现许多记者,这些记者的行为是最初从 BuzzSumo 中撤出的群体的影响者。
因此,如果您有一个关于利基主题的活动,您可以考虑向从这些数据中浮现的影响者进行宣传——根据我们的可视化,在他们的网络中共享的一篇文章将具有最大的影响力和潜在的投资回报率
使用 Gdelt 通过上下文链接分析找到关于某个主题的最有影响力的网站
第一个例子是在利基市场找到最好的记者的好方法,但顶级记者通常是最受推销的。很多时候,在主要出版物上从鲜为人知的作家那里得到提货会更容易。出于这个原因,了解哪些主要出版商最有影响力,并在特定主题、主题或节拍上享受最广泛的联合,可能会很有帮助。通过使用 Gdelt 庞大且全面的数字新闻故事数据库以及 Google BigQuery 和 Gephi,可以更深入地挖掘以产生重要的战略信息,从而帮助您确定内容投放的优先级。
我们从 Gdelt 的数据库中提取了所有已知在给定时间范围内与特定主题有关的文章。在这种情况下(与前面的示例一样),我们查看了“行为健康”。对于我们在 Gdelt 数据库中找到的符合我们标准的每篇文章,我们还抓取了仅在文章上下文中找到的链接。
这是如何完成的:
- 在 Google BigQuery 上连接到 Gdelt — 您可以在此处找到教程。
- 从 Gdelt 中提取数据。您可以使用以下命令:SELECT DocumentIdentifier,V2Themes,Extras,SourceCommonName,DATE FROM [gdelt-bq:gdeltv2.gkg] where (V2Themes like ‘%Your Theme%’)。
- 在此处选择您找到的任何主题 – 只需替换百分比之间的部分。
- 提取每篇文章中的链接并构建边缘文件。这可以通过一个相对简单的 python 脚本来完成,从查询结果中提取所有 <PAGE_LINKS>,清理链接以仅显示其根域(而不是完整 URL)并将它们放入边缘文件格式。
注意:边缘文件由 Source–>Target 对组成。源是文章,目标是文章中的链接。边缘列表将如下所示:
- 第 1 条,文章中找到的第一个链接。
- 第 1 条,文章中的第二个链接。
- 第2条,文章中的第一个链接。
- 第 2 条,文章中的第二个链接。
- 第 2 条,文章中的第三个链接。
从这里,边缘文件可用于构建网络可视化,其中节点发布者和它们之间的边缘表示从我们的 Gdelt 数据中找到的上下文链接,围绕我们想要的任何主题拉动。
这个最终的可视化是出版商的网络表示,他们写过关于成瘾的故事,以及这些故事链接到哪里。
我们可以从这张图中学到什么?
这告诉我们哪些节点(发布者网站)具有最多的 In-Degree 链接。换句话说:谁是最相关的。我们可以看到与该主题最相关的是:
- tmz.com
- people.com
- cdc.gov
- cnn.com
- go.com
- nih.gov
- ap.org
- latimes.com
- jamanetwork.com
- nytimes.com
哪个出版商最有影响力?
使用 Gephi 给出的“Betweenness Centrality”分数,我们可以粗略了解网络中哪些节点(发布者)充当信息传输的枢纽。具有最高“Betweenness Centrality”的节点可以被认为是网络的“连接器”。从这些高中介中心性节点中获取信息可以为该特定主题/主题提供更大的联合可能性。
- Dailymail.co.uk
- Nytimes.com
- People.com
- CNN.com
- Latimes.com
- washingtonpost.com
- usatoday.com
- cvslocal.com
- huffingtonpost.com
- sfgate.com
我们还能学到什么?
与第一个示例类似,介数中心性数、入度链接数越高,并且在图中的位置越中心,通常可以说该节点越“重要”。以此为指导,可以轻松识别最重要的投球目标。
了解一些边缘集群可以进一步了解其他潜在机会。包括一些特定于不同地区或州地方新闻的集群,以及一些外语出版物集群。
包起来
我概述了我们在 Fractl 使用的两种不同技术,以了解围绕特定主题领域的影响网络,包括出版物和这些出版物的作者。所描述的可视化技术并不是显而易见的指南,而是用于梳理大量数据并找到隐藏信息的工具。使用这些技术发掘新机会并确定优先级,因为您准备好寻找最佳地点来推介您辛辛苦苦创作的内容。
您是否有任何类似的想法或策略来确保您的内容向最好的作家和出版商推销?在下方评论!