黑帽SEO逆冬:黑帽SEO技术网解读“TF-IDF”算法结合黑帽优

黑帽SEO逆冬:黑帽SEO技术网解读“TF-IDF”算法结合黑帽优

SEO优化26569912002020-10-08 0:46:501.6 KA+A-

好久以前就相关注到TF-IDF的关联介绍,大片面的疏解都是缠绕观点来讲,非常多人把TF-IDF称作“算法”,笔者通读了非常多文章,乃至在本人的网站举行了应用。鉴于非常多同事说波及到太多公式,不轻易明白,本文用简略的实例介绍,谈谈我对TF-IDF的少许看法,不讲繁杂的公式,有望能赞助到列位!
 


 

开始,TF词频的观点与搜索引擎优化发起
 

TF是指词频,盘问的环节词在文档中发现的次数统计。关联文档是如许介绍的,假定盘问环节词在统一个文档中发现的次数越多,代表这个环节词越紧张,越能代表文档的主题意义,文章主题与环节词意义越靠近,辣么做黑帽搜索引擎优化怎样应用这个常识点呢?
 

假定有一篇文章的题目是:“黑帽搜索引擎优化技术服无外包”,从字面上明白,文章要紧因此黑帽搜索引擎优化技术服无为焦点,“外包”为拓展词。假定文章内容里搜索引擎优化技术服无发现20次,服无发现25次,外包发现10次,根据TF词频的规律,辣么黑帽搜索引擎优化技术服无是文章主题,这个非常好明白。

 

现实上有些时分写文章时,留心义非常明白的环境下,会不祥主词。好比黑帽搜索引擎优化技术服无外包费用、黑帽搜索引擎优化技术服无外包流程、黑帽搜索引擎优化技术服无外包公司介绍,会缩写成:外包费用、外包流程、外包公司介绍。如许会造成外包发现的次数大于服无,TF词频则会觉得外包是主题,发现毛病的校验。

 

那既然是如许,做搜索引擎优化环节词结构的时分,应当要得当思量主环节词的发现频率大于副词。固然搜索引擎校验网络主题有非常多维度,这里只是单从TF词频的角度思量,片面觉得如许做会收缩搜索引擎校验网络主题的时间,对搜索引擎优化来说是有益的。
 

第两怎样疾速明白“IDF逆文档频率”
 

这个观点若看文档的话有点难明白,起先笔者看百度百科好几次才清楚。波及到繁杂的公式在这里就不讲,连结TF一路来明白,TF-IDF的意义是,一篇文章中某环节词发现的次数越多,且在搜索引擎的材料库中包括该环节词文档数越少,则介绍这个环节词越能代表此网络的主题。
 

举个例子来介绍,假定有一篇文章,有两个环节词:“搜索引擎优化优化”和“搜索引擎优化服无”,在文章中,这两个环节词发现的材料都是20次,不过在百度的材料库中,包括搜索引擎优化优化的文档统共有一万万个,包括搜索引擎优化服无的文档有五百万个,辣么则介绍,搜索引擎优化服无越能代表这文章的意义。大概搜索引擎材料库中包括环节词的文档数目同样,文章中发现次数越多的环节词越能代表网络主题。
 

从黑帽搜索引擎优化的层面讲,IDF这个值是客观存在的,无谓去穷究,只有清楚差别环节词之间的文档数几许就行,以百度为例,搜索任何一个环节词,在搜索框底下会有一个:“百度为您找到关联后果大概XXX个”的如许句子,内部的数值能够作为文档数参考。每个搜索引擎的包括环节词的文档数大概差别样,不过整体的比较比例值应当是差未几的。并且跟着时间的推移,文档数也会接续产生转变。

 


点击这里复制本文地址 以上内容由铁柱网整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!


扫码关注“铁柱网”微信公众号
更多精彩,等你来撩

有好的文章或资源希望【铁柱网】帮助分享推广,猛戳这里我要投稿

支持Ctrl+Enter提交
qrcode

铁柱资源网 © All Rights Reserved.  

嘿,欢迎咨询