• 注册
  • APP下载安卓
  • 注册
  • 查看作者
    • 2
    • TF-TDF工具实操3天就有排名「SEO上词排名利器」

      今天跟大家聊聊最新研究的SEO实战效果,主角是TF-IDF,玩SEO的老鸟们应该不陌生,但是很少有SEOer们将这个快速上词玩法合盘托出的,那今天飞优将毫无保留地告诉大家究竟是如何做的。

      TF-TDF工具实操3天就有排名「SEO上词排名利器」

      目前飞优主要是利用这个算法及工具针对文章「数字营销月报如何撰写?(SEO和SEM运营常见数字营销报告思路)」做了全面测试,实战结果一如既往地给力,测试当天就拿到首页排名(不吹牛X),先看效果,如图:

      TF-TDF工具实操3天就有排名「SEO上词排名利器」

      数字营销报告撰写排名效果图

      以搜索数字营销报告撰写为例,SERP给出的页面就是排名在首页,其实这里需要引入索引的概念了。索引又分为上层索引及下层索引,上层索引为搜索引擎给予排名的页面,会带来更多的流量,因此会排在首页,而下层索引一般为语料库中的底层,按照正常逻辑是不会有给予排名的,因此大部分的玩家经常遇到为什么我的页面有索引但是没有排名呢,之所以要跟大家先介绍索引的概念,索引(这里主要说的是上层索引)是构成排名的第一步,了解这个后更容易理解TF-IDF的工作原理。先整体介绍下概念:

      TF-IDF是什么

      TF-IDF(termfrequency–inverse document frequency,词频-逆向文档频率)是一种用于信息检索和文本分析的技术,可以用以评估单词对于文档的重要性程度。

      TF-IDF的主要表达的中心思想是:一个单词在一篇文章中出现的频率越高,且在其他文章中出现的频率越低,则该单词对当前文本的重要程度就越高,TF-IDF值就越大。

      以上图为例说明,我们先分析下原文标题,从标题中很容易推测到文章的目的是为那些写数字营销月报困难的用户提供常见的思路,帮助用户培养撰写月报的思维能力,所以从Title上看主要核心关键词是数字营销月报,延展需求是撰写及思路,为什么要用这样的标题,内在核心机制是搜索引擎的工作原理:搜索引擎目前依靠的算法依旧是Query下触发索引模块处理文本的原理,简言之,核心就是围绕Term及语料库的检索排序任务。当然现在也有一定的升级(这里暂且不讨论)。回到主题,那其实就是针对关键词做分词技术处理,因此从文章字面上看,搜索引擎会自动将语句切词为:

      数字营销,月报,撰写,SEO,SEM,运营,报告,思路

      TF-IDF怎么计算

      因此按照切词结果判断,每一个词在文章都有相应的词频,也就是TF值,何为TF值?顾名思义,

      TF就是指关键词在文档中出现的频次,在某种意义上约等于关键词密度(Keywords Identity)

      TF值越高,则越代表这个关键词在文章中的重要程度越高。具体的计算公式:

      TF(关键词)=(关键词出现的次数/文章总词数)*100%

      假定,我们通过搜索这些词,在文章中找到数字营销,月报,撰写,SEO,SEM,运营,报告,思路这些词出现次数分别是:20次,10次,15次,8次,5次,12次,4次,而文章总词数为7500左右,因此计算其TF值依次为:

      TF(数字营销)=0.00267

      TF(月报)=0.00133

      TF(撰写)=0.002

      TF(SEO)=0.00107

      TF(SEM)=0.00067

      TF(运营)=0.0016

      TF(报告)=0.00053

      因此,单词对文档影响力的重要程度就会根据最终计算的值进行排序。自然而然,数字营销>撰写>运营>月报>SEO>报告>SEM。

      那按照此种逻辑是不是说只要在文章中布局keywords越多就越能体现排名呢,答案是NO。因为这里还有一种可能,一篇文章或者文档中出现大部分的“的”、“是”、“如果”、“我”、“了”等这些词,我们认为是无关且出现频率较大的,因此按照TF的计算公式,这肯定得出的值会非常高,按照原理,这个肯定会被判定为较重要的词,但是事实上不是这么回事,因此我们需要在引入IDF的概念(逆文档频率),IDF直接将这些词所谓的停用词(对文档无关紧要的词)进行清算干掉后在计算其值,同样地,它也有一个计算公式:

      IDF=log(总文档数量/出现的关键词文档+1)

      从功能上看,IDF代表了单词对于文档的区分度,如果一个单词在一篇文章中出现,并且在其他文章中很少出现,则认为该单词对于当前文档的区分能力较强,即IDF值较大,否则认为该单词对文档的区分能力较差。对于“的”、“是”、“如果”、“我”、“了”等通用词汇,由于它们几乎会出现在任何一篇文档中,因此这些单词的IDF值很小。

      所以,最后将TF值和IDF值相乘,即可得到一个单词的TF-IDF值。

      TF-IDF=TF*IDF={(关键词出现的次数/文章总词数)*100%}*{log(总文档数量/出现的关键词文档+1)}

      TF-IDF综合考虑了“单词的重要性与它在文档中出现频率成正比,与该单词在全部文档(语料库中的总文档)中出现频率成反比”两方面因素,来衡量一个单词的重要程度。如果一个单词的TF和IDF值都很高,说明该单词既是一个高频词又不是通用词,对于当前文档而言是一个重要的词汇。故这篇文章的关键词与文章的关联度会越强,整体的内容越有用。

      同样地,假定上述词中在整个语料库中有1亿的文档数,出现这些关键词的文档分别是2W、5W、4W、3W、6W、1W、10W,那么按照计算公式是可以算出其IDF值,这里我就不一一演示了。因此最后算出一个关键词与文章的相关度越高,那么这个TF-IDF值就越高。

      TF-IDF实操效果

      回到我们的文章主题,我们随便切词,按照这些词进行组合,都能一一得到SERP排名到首页的结果。

      TF-TDF工具实操3天就有排名「SEO上词排名利器」

      数字营销月报撰写排名效果图

      TF-TDF工具实操3天就有排名「SEO上词排名利器」

      SEM运营报告思路

      因此,在了解清楚这个算法后再来回归到SEO日常业务中,我们会清晰知道利用该算法会有效指导我们做好SEO,目前按此原理打包了一个工具,下面以该文档做一个demo演示,如下:

      所以此工具对我们SEOer在布局关键词是非常有益的,可以做到如何布局合理且能做到排名的关键词。需要工具的可以私聊飞优。关于工具使用很简单,直接将文档复制输出就好。

      再看看搜索排名结果!

      隐藏内容需要付费才可以看见

      马上购买
      广东·深圳
    • 12
    • 2
    • 0
    • 2
    • 1.5k
    • jack今晚不睡觉_Coffee Mocha坚持沉默微笑等待晴天翰林学士勾嘴笑水果软糖女孩Sevia波比麻麻诸子百家文韬武略小助手

      请登录之后再进行评论

      登录
    • 0
      诸子百家MA·6精神小伙
      购买了付费内容

      物质与意识的辩证关系:物质决定意识,意识反作用于物质。

    • 8
      jackMA·2
      购买了付费内容
    • 1635关注·2讨论
      1617关注·1讨论
      1637关注·2讨论
      1669关注·1讨论
      1589关注·5讨论
      1614关注·1讨论
      1688关注·2讨论
      1727关注·1讨论
      1727关注·4讨论
      1687关注·2讨论
      和我们一起在QQ上讨论Hot
      官方人员的回复时间
      小于5分钟
      加入群聊
    • 赚金币
    • 换头衔
    • 新动态
    • 客服
    • 购物车
    • VIP权益
    • 单栏布局 侧栏位置: