设为首页|加入收藏|网站地图|RSS
请选择搜索分类 新闻 留学 专题

网页重复内容产生的原因

发布时间:2011-12-19 16:46 来源:工大在线字号:T|T

复制内容也可以称为重复内容,指的是两个或多个URL内容相同,或非常相似。复制内容既可以产生于同一个网站上也可以产生于不同的网站上。
产生复制内容有以下几个原因:
1.打印版本。很多网站除了正常供浏览的页面外,还提供了更适合于打印的页面版(电子版),如果没有用适当的方法去禁止搜索引擎抓取,这些打印版的网页就会变成复制内容。
2.网页内容由RSS生成。有很多新闻网采用其他网站上的RSS Feed生成网站内容,这些内容在原始出处和很多相类似的网页上出现多次。
3.使用session id。搜索引擎蜘蛛在不同时间访问网页的时候,被给予了不同的session id,实际上网页内容是一样的,由于session id参数不同,被当成了不同的网页了。
4.转载及抄袭。转载或抄袭其他网站上的内容,会被认为是复制内容,无论转载和抄袭的意图是否合理。
5.镜像网站。镜像网站曾经非常流行,当一个网站太忙太慢的时候,用户可以通过替代镜像来看内容或者下载,但这样的做法会被认为是复制整站,被k的可能性更加高。
6.

图库

更多

网友评论