搜索引擎排名的基础之一,就是关键词与网页的相关性。
机器算法和人不一样的地方是人可以直接理解词的意思,文章的意思,机器和算法不能理解。人看到
但搜索引擎可以掌握词之间的关系,这就牵扯到语义分析。
两年前搜索引擎优化业界很热烈的谈论过一阵潜在语义索引(Latent Semantic Indexing)。因为时间比较久,记得也不是很清楚,大概介绍一下。
所谓潜在语义索引指的是,怎样通过海量文献找出词汇之间的关系。当两个词或一组词大量出现在同一个文档中时,这些词之间就可以被认为是语义相关。
举个例子,
要注意的是,潜在语义索引并不依赖于语言,所以SEO和搜索引擎优化虽然一个是英语,一个是中文,但这两个词大量出现在相同的网页中,虽然搜索引擎还不能知道搜索引擎优
1 | 2 | 3 |