10年南宁企业品牌网站建设服务保障!

原创网页设计公司

网站建设云平台

免费网站诊断

周到售后服务

南宁网站设计,南宁企业品牌网站建设-南宁互联品牌网站设计机构
网站重复内容常见的起因和主要解决方法(2)

添加时间:2011/1/22

浏览:2481 次

编辑:www.nniis.com

参数顺序

另一个较常见的原因就是cms不会使用简洁干净的URL,而是使用比如 /?id=1&cat=2,这里的ID指示文章,cat指示分类。在大部分的建站系统中,这个URL /?cat=2&id=1 也将会渲染同样的内容,但是对搜索引擎来说他们就是完全不同的。

评论分页

在wordpress系统或者其他程序里面会有一个评论分页的选项。这将会导致文章内容在 文章本身的URL 还有文章的URL+/comment-page-1/, /comment-page-2/ 等的重复。

打印页面

如果你的cms会产打印页面而且从你的文章页面还有链接,在绝大部分情况下谷歌会发现这些页面,除非你特别阻止他们。谷歌该展示那一个版本?一个有广告和周边内容的页面或者一个只有你文章的页面。

WWW vs. non-WWW

这是一个最老的问题了,但是当两个版本都可以访问时,有时搜索引擎还是会混淆WWW vs. non-WWW重复内容。

一个不常见的情形还有就是http vs https 重复内容。

概念上的解决方法 “canonical”标签

正如上面确定的,不同的URL产生同样的内容会导致重复内容是一个问题,但是它可以被解决的。人类在发表文章时通常可以很容易地告诉你某个文章的正确的URL应该是什么。搞笑的是有时你问同一公司的3个人会得到3个不同的答案。

总结:重复内容是可以解决的也应该解决

在这些情形中问题需要解决,因为在最后只能有一个URL。文章正确的URL可以被搜索引擎命名的Canonical。

识别重复内容

你可能不知道你网站上是否有重复内容。就让我来给你一些方法。

谷歌网站管理员工具

谷歌网站管理员工具是一个很好的识别重复内容的工具。如果你转到谷歌网站管理员工具查看你的网站,检查诊断——》HTML建议,你就看到这样的

google-webmaster-tools-duplicate-content.jpg

如果页面有重复的title或者重复描述的话,那里几乎没有什么好事情。点击它会显示那些URL有重复标题或者描述将帮助你识别出问题。问题是如果你有一篇文章关于“keyword -X”显示在两个分类里面,他们的title可能会不一样。比如他们的标题会是“Keyword X - Category X - Example Site” 和 “Keyword X - Category Y - Example Site”。 谷歌不会把他们作为重复标题,但是你可以通过搜索找到他们。

查找title或者其他片段

有几个搜索运算符在这种情况下是非常有帮助的。如果你想找到你网站上包含你的关键字“X”文章的所有URL,你可以输入在谷歌搜索框中输入以下指令:

site:example.com intitle:"Keyword X”

复制代码

谷歌将会展示你在example.com上所有页面包含那个关键词的。你搜索title部分的关键词越具体,也越容易找到重复内容并清除他们。你也可以使用同样的方法来识别别人网站上有没有你的重复内容。比如说,你文章的完整title是Keyword X - why it is awesome,你可以搜索

intitle:"Keyword X - why it is awesome”

复制代码

谷歌会返回所有网站上包含这个title的。有时你也可以搜索你文章中的一两个句子,因为有些内容搜刮 的人可能会改掉你的title。在某些情况下,当你搜索的时候,谷歌可以会在结果最后显示如下的提示:

 

这就是一个信号说谷歌已经删除了重复的数据结果。这显然是不好的,你可以继续点击进去查看其他的结果来看是否有助于你解决这些问题。