10年南宁企业品牌网站建设服务保障!

原创网页设计公司

网站建设云平台

免费网站诊断

周到售后服务

南宁网站设计,南宁企业品牌网站建设-南宁互联品牌网站设计机构
网站重复内容常见的起因和主要解决方法(1)

添加时间:2011/1/22

浏览:2060 次

编辑:www.nniis.com

像谷歌等搜索引擎有一个问题。他们称之为“重复内容”。你的内容展示在网站各个不同页面,他们不知道该展示那个地址。尤其是当人们链接到你所有的不同版本的内容时,这个重复内容会更严重。这篇文章旨在让你了解造成重复内容的不同原因,然后找出各个的解决之道。

重复内容原因

1、误解URL概念

2、session ID‘s

3、URL 跟踪参数

4、内容搜刮&内容聚合

5、参数顺序

6、评论分页

7、打印页面

8、www vs. 无www

概念上的解决方法 “canonical”标签

1、识别重复内容

2、谷歌网站管理员工具

3、搜索指令查询title

解决重复内容的实践操作

1、避免重复内容

2、301重定向

4、使用rel=“canonical”标签

5、链接链向原始内容

总结:重复内容是可以解决的也应该解决

你可以把重复内容比作你站在你一个十字路口,道路标志上有两个不同方向都指向同一个目的地,究竟该走哪一条路?更有甚者在当你的目的地不一样时,情况会更糟糕。作为一个读者,不会管内容从哪里来,但是搜索引擎不得不挑选一个展示在搜索结果中,因为他们不想把同样的内容展示两次。

比方说,关于关键词X的内容展示在http://www.example.com/keyword-x/这个URL上,同样的内容也出现在http://www.example.com/article-category/keyword-x/上,这种情况可不是虚构的哦,在很多cms系统中都存在这个问题。比如你的文章已经被一些网友收藏转载了,一些人链向你的第一个URL,一些人链向你的第二个URL。这时重复内容问题就来啦。如果所有关于这个关键字的链接都指向一个URL的话,关键词在首页的几率也会高很多。

重复内容起因

有很多因素可以导致重复内容。绝大部分都是技术上的,一个人决定把同样的内容放在两个不同的地方,并不指出原始出处这种情况不是很常见,绝大部分人都会觉得不舒服。技术上的理由也是很充分。它产生的绝大部分原因是程序员没有站在浏览器或者用户角度,也没管搜索引擎蜘蛛,只是按照程序员的思维。假设之前提到的那篇文章它出现在http://www.example.com/keyword-x/ 和 http://www.example.com/article-category/keyword-x/? 如果你问程序员,他会说它是仅出现一次啊。

误解URL的概念

那么程序员都疯了吗?不,没有,他只是再说另一种语言。你看到的整个网站可能都是数据库驱动的。在那个数据库里面,只有一篇文章,网站程序允许数据库中的一篇文章可以通过不同的URL访问得到。因为在程序员眼里,唯一的标志是数据库中的文章只有唯一的ID,而不是URL。对于搜索引擎,URL才是一篇文章的唯一识别符。如果你这样跟你的程序员说,他才会意思到问题原因,接着他会像与我共事的大部分程序员一样,想搜索引擎愚蠢在哪里以及为什么他不能解决这个问题。如此他又走向另一个错误的思维。

Session ID

你常想着去追踪你的访问者的轨迹,比如存储他们在购物车购买的物品。要做到这一点,你必须给他们一个session(会话)。一个session会话基本上是访客在你网站所做的简短历史,可能包含内容比如购物车里面的物品。为了保持访客从点击一个网页到另一个网页的会话session,需要存储子某个地方。最常见的解决方法是cookies,然而搜索引擎通常不会存储cookies。

在这一点上发生了什么,一些网站系统在URL中使用session ID来返回。在这一点上每个网站上的内部链接都会被追加上session ID,而session ID又是唯一的,这样产生了新的URL,因此重复内容产生了。

使用追踪和排序的URL参数

另一个引起重复内容的原因是URL参数的使用,虽然参数不会改变页面内容,比如在跟踪链接里面。你会看到 http://www.example.com/keyword-x/ 和 http://www.example.com/keyword-x/?source=rss等对搜索引擎来说都不是同样的URL。后者可能是允许你跟踪来源,它可能会使你的排名变得有点困难,一个非常不好的负面效果。

这个不仅适用于跟踪参数,它还适用每一个你加在URL后面的参数不会改变你网页上的实际内容。涉及到参数会改变网页上产品的顺序或者展示另外一个sidebar这些都会导致重复内容。

内容搜刮和内容聚合

虽然引起重复内容的绝大部分原因在于你自己,或者至少是你网站的过失,有时是其他网站有没有经你同意使用你的内容。他们并不总是链向你的原始内容,搜索引擎也不知道就会不得不处理你的同样文章的另外版本。

你的网站越来越流行,遇到的搜刮也越来越多,问题也会越来越严重。