关键词堆积不可取正向索引与倒排索引的区别

  网页中原本不会也不需要么多次的关键词,而"优化"员为了增加关键词密度故意堆加关键词,造成关键词规程的现象.而出现堆积的地方主要是.。

  1.网页标题标签。

  2.说明标签。

  3.关键词标签。

  4.页面可见正文。

  5.图片ALT文字。

  6.页面内部链接锚文字中,特别容易出现在页脚部分。

  网站设计。

  7.页面HTML代码中的评论部分。

  8.隐藏在表格中等。

  关键词规程在程度上有很大区别,所以也是一个比较模糊的作弊概念.有的"网站"属于轻度规程,比如标题本来可以写成""网站"设计与制作"却偏写成网站,网站设计,网站制作.这样使得效果不好,还可能受"搜索引擎"惩罚,得不偿失.。

  网站建设。

  正向索引是经过文字,分词,消噪,去重后,"搜索引擎"得到的就是独特的,能反映页面主体内容的,以词为单位的内容,接下来"搜索引擎"索引程序就可以提取关键词,按照分词程序划分好的词,把页面转换为一个关键词组成的集全,同时记录每一个关键词在页面上的出现频率,出现次数,格式,位置.这样网站优化,每个页面都可以记录为一串关键词集全,其中每个关键词的词频,格式,位置等权重信息也都记录在案.。

  正向索引不能直接用于排名,如果只存在正向索引,排名程序需要扫描所有索引库中的文件,找出包含关键词的2个文件,再进行相关性计算,这样的计算量无法满足实时返回排名结果的要求.。

  所以搜索引擎会将正向索引数据仓库重新构造为倒排索引,把文件对应到关键词的映射转换为关键词到文件的映射.在倒排索引中关键词是主键,每个关键词都对应着一系列文件,这些文件中都出现了,这个关键词,这样当用户搜索某个关键词时,排序程序在倒排索引中定位到这个关键词就可以马上找出所有包含这个关键词的文件.关键词排名。

您可能还会对下面的文章感兴趣: