更多



查询一个网站有多少网页被Google列为补充结果 晴

郝聪 , 2006/09/15 14:58 , 搜索引擎优化(SEO) » SEO工具 , 评论(4) , 阅读(19747) , Via 本站原创 | |

     我们在Google上搜索关键词,在搜索结果页里列出的网页都是来自Google的主索引数据库。然而对于某些网站,尽管它们上面很多网页都被Google收录了,但并非每个被收录的网页都会出现在搜索结果页里,因为Google把其中一些放进了补充索引数据库里。一般情况下,在Google的补充索引数据库里的网页出现在正常的Google搜索结果里的机会非常微小。被加入Google的补充索引数据库里的网页一般称为"补充结果"(Supplemental Results)。

  查看到底自己的网站有多少网页被Google当成是补充结果,即直接在Google搜索栏里输入:




site:域名 ***
     比如site:www.bloghuman.com ***


点击在新窗口中浏览此图片
   

网页为什么被纳入补充结果

  当然,这又是一个牵涉到很多因素的问题,但从主要方面看,主要有如下原因(以下内容摘自SEO探索):

  复制内容(Duplicate Content)页面

  这又分为几种情况:
   1、网站没有原创性的内容,内容拷贝自其他网站,如很多Clone DOMZ目录内容的网站最近被Google封杀或相应内容被放入补充结果。注意,这里的Duplicate Content不仅仅指内容完全一样,也包括页面中一定数量的文字相近或相似的情况。

  2、链接地址的不规范,尤其对动态网页地址而言,这种情况极其普遍。如Discuz程序,虽然号称国内最好的论坛程序,但对SEO而言实在要命,其网页地址中以“?”“&”所加的很多参数纯粹莫名其妙,导致同一个页面可以用无穷多个URL访问,这不可避免地被判定为Duplicate Content。

  3、Canonical Issues,同样的Url不规范问题。所谓Canonical Issues,主要指网站的主访问路径,如果网站存在多种访问方式,搜索引擎会选择一种其认为最佳的方式确定为“权威地址”,比如说,对大多数网站而言,其主页可以用以下三种URL访问:

www.yourname.com
yourname.com/
www.yourname.com/index.html

  但从技术上讲,这三个Url是不同的,可以分别显示单独的内容。对这种情况,Google会确定其认为最佳的一种为“权威地址”,比如说yourdomain.com,将其收录进主索引数据库,同时,Url以http://www.yourdomain.com/格式开头的网页(包括内部网页)则会被置入补充结果。

  无内容或内容过少的网页

  如果Google在页面内找不到足够的内容,那么,这类空页面被会被放入补充结果

  成为“孤岛”的网页

  如果出于某种原因,指向某个网页的链接丢失,这包括源自外部网站和源自网站内部的链接,Google的Spider在最近的一次抓取中找不到访问该页面的路径,那么,补充结果便成了其归宿。

网页被纳入补充结果后怎么办及如何预防
  如果网站只是近期才发生页面被放入补充结果的情况,倒不必太过担心,这可能只是Google BigDaddy更新中的瑕疵,Google正在修正中,Matt Cutts在其Gone Supplemental的讨论中证实了这一点,


So the upshot is that if you’re one of these people who was paying attention to this issue, I think it has already improved quite a bit, and I would expect to see more pages indexed in the coming week or two. Some sites may see improvements earlier than others because of where a site happens to be in Google’s crawl cycle.


  随着Google更新的进程,主索引数据库会逐步重建,相应的网页会回复正常。

  而对于其他情况,则应仔细检查相应网站或网页,根据上面介绍的网页被纳入补充结果的原因,进行修正:

  如果是因为Duplicate Content的缘故,那么,停止拷贝别人的网站,创作具有原创性的内容,使用301 redirect避免Canonical Issues,等等。

  对于因被视作空页面而纳入补充结果的网页,确保网页中具有足够的内容。

  对于孤岛网页,首先在网站内部建立链接指向它,条件允许的话,尽量为其建立来自外部权威网站或网页,anchor text中包含合适关键词的链接,当然,链接来源网页必须与该本页涉及主题相同或相近。

  这并不是全部的工作,正如上文所言,一旦网页被纳入补充结果,Google的Spider便很少再去访问它,要使我们的修改被Google发现,还需要别的措施,如向google sitemap提供相应的地址,指引Spider的爬行。

  但实事求是地说,这样的措施并不一定会起到作用,考虑到补充结果是网页坟墓的说法,如果我们的修改在一段时期内未被Google发现和接受,那么,最后的选择便只能是用新的Url重新发布那些内容了。



 不过,现在使用以上办法已经无法查询网站内补充结果数量了。seoegghead介绍了另一个途径,即使用如下的命令格式

site:www.bloghuman.com *** -this_is_a_random_string

  当然,要把域名改为要查询的网站地址,而“this_is_a_random_string”则可设为其他任意字符串,以在Google的多个数据中心查询。

  从不同数据中心得出结果的巨大波动来看,如比较“site:www.bloghuman.com *** -abc”与“site:www.bloghuman.com *** -cba”,Google目前的更新仍在进行中,也许一切都要再等等。

  当然,这个方法能够使用多久仍属未定之数,也许Google很快也会将这个漏洞补上。

引用

作者: 黑色梦中
原载: Luke's Seo Blog
版权所有。转载时必须以链接形式注明作者和原始出处及本声明


最后编辑: 郝聪 编辑于2006/10/19 11:54
Tags: , ,
油罐车 Email
2011/11/13 18:30
很是实用。。。。。。
114
2008/09/22 15:02
过于专业化了,一知半解
433 Email
2008/09/20 14:00
国内有多少网站莫名其妙的被谷歌封杀???
谷歌不厚道,恶意屏敝国内网站,中国人把它赶出中国。微软对它恨之入骨。莫名其妙的被谷歌封杀的网站站起来!抵制谷歌。支持的点!!!!
ffdv
2008/04/11 16:18
www.hhinfo.net.cn 怀化综合信息网
分页: 1/1 第一页 1 最后页
发表评论

昵称

网址

电邮

打开HTML 打开UBB 打开表情 隐藏 记住我 [登入] [注册]