避免网站过度优化

[晴 2006/09/09 20:29 | by 黑色梦中 ]
谈了不少具体的SEO技巧,做网站优化的朋友还要注意一点,那就是千万不要过度优化网站

同样这又是一个度和平衡的问题。

SEO的人应该了解所有可以被优化的地方,应该了解怎样优化这些地方,但同时也应该了解不能同时优化所有这些地方,不然网站很容易被某种形式的惩罚。

典型的过度优化的网站特征包括

1)外部链接锚文字都是一样的,一般都是最主要的目标关键词。

2)外部链接在短时期内快速增长,然后就停止增长。很多站长都倾向于花一段时间来交换链接,等效果达到了就停止建立链接了。

3)外部链接的锚文字和网页标题高度吻合。

4)网页上该针对关键词优化的地方都优化过了,比如标题标签,关键词和描述标签,H1,H2,黑体,链接,图片ALT属性,网页第一段文字,内部链接锚文字,正文,URL。这些地方都是可以做SEO优化的地方,但真的把这些地方都优化了,再加上其他因素,离被惩罚的门槛就不远了。

5)内部链接和外部链接缺少变化,绝大部分都是以目标关键词为锚文字指向首页。自然的链接会有URL形式的,会有链向深层页的。

6)具有这些特征的网站,如果是新网站,呆在sandbox的时间可能会更长。如果是老的网站,当这些因素全都加起来,达到某一个门槛的时候,可能受到某种程度某种形式的惩罚,比如最主要关键词排名急剧下降。

如果你的网站排名下降很多,找不到其他原因,网站过度优化是要考虑的重要因素之一。

解决的方法就是去优化,比如把网页标题做一个改变,稀释关键词,使整个优化程度降到要被惩罚的门槛之下。当然也可以从网页里面其他因素着手。

总之,不要把能优化的地方都优化,要使网站和网页显得自然平衡。
百度的搜索结果又一次令我失望。在百度上搜索"天极下载":

点击在新窗口中浏览此图片

搜索结果第2位的标题赫然写着几个大字:天极网下载频道

看来是找到预定目标了,于是顺手进入,看了眼TITLE:关机大师 V2.6 (热键精灵修正版) - 天空软件站 - 软件分类 - 系统工具 - 开关定时

怎么跑到天空软件站了???于是仔细观察搜索结果:
SEO角度分析,Yahoo和Google在关键词搜索结果排名上有何区别?

1, Google注重语义分析和链接,Yahoo注重title和H1,H2,H3。
2, Google比Yahoo更新的快得多。

Yahoo更加看重网页本身的质量,这里提到的质量包含内容和表现形式,所以针对Yahoo的SEO策略往往只要把页面本身优化好,就能在Yahoo中取得很好的排名,而这些页面优化都是自己可以控制的,所以说针对Yahoo的SEO所用时间相对GOOGLE要短,特别是对于热门关键词,两者的区别更明显。而GOOGLE更加注重外部链接以及相关性,所以如果手头有较多的链接资源可以利用的话,GOOGLE的SEO开展起来要顺利的多;

我想特别强调一下Google的强大的语义分析能力。在Google中搜"seo入门", 结果排在第一名的是一个关于"seo基础"的网页。这个网页针对"seo基础"作了很好的优化。我看了这个网页的源文件,没有出现一个"入门"。这个网站是个新站,没有多少外部链接,首页PR为0,为什么这个内页会排在很多含"seo入门"的网页之?而且第一页中有七个页面都是针对"seo基础"的,并用红体字突出显示,足见Google把"入门"和"基础"看成极为接近的词。再在Yahoo中搜"seo入门",发现排在前三页的没有针对"seo基础"的,全都针对"seo入门"。
眼下最热、最重要的一个话题就是Google幽灵现象。一般情况下,把一个网站递交到互联网上,在每月固定更新之前,你会发现这个网站出现在索引里。有时,这个网站能够获得很高的排名,但可怕的 是,几天或一周以后,这个网站会突然消失。这种幽灵现象困扰着网络新手们,同时也给经验丰富的网络行家出了一道难题。其实,这种现象很容易理解。

Google有两种网络爬虫,主爬虫和新爬虫。主爬虫主要负责发现新的网页。一个网页在新索引建立之后,马上会被主爬虫发现。如果一个网页建立索引需要经过一个月的时间,这个网页就会失效。

新索引的建立还需要考虑其他非询问式的决定因素。这些决定因素关系着网页排名的高低。为了充分利用这些网页,而不是浪费时间等着下一次索引算法的更新,Google必须采取一些简单的措施来猜测排 名,猜测访客难以利用的新内容是什么。

URL网址规范化问题

[晴 2006/09/04 01:58 | by 黑色梦中 ]
网址URL规范化(URL canonicalization)是近一年来在Google搜索结果中出现的一个很大的问题。它指的是搜索引擎挑选最好的URL网址作为真正网址的过程。举例来说,下面这几个URL一般来说指的是同一个文件或网页:


http://www.domainname.com
http://domainname.com
http://www.domainname.com/index.html
http://domainname.com/index.html


但是从技术上来讲,这几个URL网址都是不同的。虽然在绝大部分情况下,这些网址所返回的都是相同的文件,也就是你的主页。但是从技术上来说,主机完全可以对这几个网址返回不同的内容。
词干技术(keyword stemming)在英文网站优化中比较明显,但对中文网站优化也有一定的借鉴意义。

词干技术指的是英文中某些词是由一个主要的词干衍生出来的,比如说work是一个词干,由这个词可以产生很多意义相同或相关但不同的时态,语态,单复数等形式,如working,worked,worker, works, workers。

在网页内容的写作中,应该尽量把同一词干衍生出的不同形式自然的融合在句子当中,而不要仅使用单一形式。也就是说,如果你的目标关键词是work,最好working,worked,worker, works, workers等这些词也要适当出现。
今天搜索引擎界有一件被Matt Cutts称为九级地震的事,Danny Sullivan将离开SEW(搜索引擎观察)SES(搜索引擎战略大会),详细的介绍大家可以在点石论坛SeoVista看到。

SEO的技术含量

[晴 2006/08/30 22:20 | by 黑色梦中 ]
  近几日网上随处可见关于SEO究竟有没有技术含量的讨论,老实说,这很让人奇怪,在本人以前的意识中,总觉得SEO有无技术含量是个已成定论的问题 ,Anyway,王通先生的一篇文章能引起这么广泛的反响也说明他在国内SEO界的重要地位,换成别的一个无关紧要的人,也许就算观点再吸引眼球,没准大家也会提不起兴致支持或驳斥。

  应如何看待SEO有无技术含量这个问题呢?虽然王通先生那篇名为SEO没太多技术含量的文章提出了鲜明的观点,不过,恕我愚笨,并没有找到足够支持该观点成立的论据,事实上,细细揣摩那篇文章,与其说王通先生在阐述SEO没有技术含量,倒不如说是在强调对SEO而言“经验”与“资源”的重要性——由此也可看出
网页标题的重要性,无论对搜索引擎还是对用户 ——,而相对而言,经验与资源对“专业的SEO公司”总是最不缺的,在许多“专业SEO公司”的宣传材料均可看到将此部分作为重点,毕竟,用户技术能力的不足可以通过学习与研究得以弥补,但缺乏经验、资源之类的神圣东东,尤其是资源则是用户的主观努力所无法解决的,当然,这也无可厚非,毕竟这是人家的优势嘛,当然要教育用户清醒地认识到,所谓的宣传本便如何,就象女人化装一样,只有恰当地掩盖缺陷并突出优点,方能达到展现诱惑的目的。
Tags: ,
某设计公司的网站刚刚被搜索引擎google收录才几天,就发现网站再次用site:命令检测为结果0。
到底是何原因导致被google删除,必须分析清楚网站被删除的原因

1。分析网站的外部链接:网站拥有的反向链接整体质量不高,是一些不知名的网址站、分类目录站,但因为这些网站本身并没有被google删除,链接页面有正常的PR值,也非“链接基地”网站,因此排除了外部链接不当导致除名的可能。

2。分析网站自身情况:没有诸如隐藏文字、超小文字、超淡文本、堆砌关键词等;网站没有跳转程序,没有桥页,不过是一个普普通通的静态企业网站;

3:用IP检测工具检测网站所在IP下的其他网站被GOOGLE收录的情况,发现其他网站均在google上有收录,说明服务器IP并没有被GOOGLE列入黑名单;

4:再检查域名的历史情况,这的确是一个新域名,以前没有使用过,排除域名因素;

5:该公司网站以前并未做过搜索引擎优化SEO

到底是什么原因导致的呢?按理说,Google删除一个网站,一定是有原因的。

看到这里,可能你也在想问题所在。。。
为解决问题,我们来说说网站的情况吧

这个网站是企业网站,与其它众多设计公司网站一样,网站是自己做的,完全采用平面设计的思维来做网页。网页铺天盖地的大图片,首页创意非凡,看得出花了很多心思打造这个网站。导航和菜单全部采用图片;内容页面的业务介绍2/3的面积是高深莫测的创意拼图,1/3为文字——文字同样以图片的方式呈现,而且为了表现创意,文字说明都在图片中表达了。网页中唯一的文本内容是他们在每个页面底部老老实实放置了与网站业务有关的文本链接及一些文字介绍,各自链接到业务介绍页面。

也许你找到问题所在了——复制网页。

虽然这个网站的每个页面有不同的设计画面、文字介绍、菜单名称,但是由于这些核心内容全部被做到图片或FLASH中,底部有限的文本内容又是全站统一的格式及内容,因此在无法分析图片的搜索引擎蜘蛛眼中,每个页面的内容全部相同。页面底部的文字链接到的不同URL,而这些URL的页面内容一模一样,这就无意间触犯了搜索引擎关于复制网页作弊的禁忌

所有 HTTP 状态代码及其定义。

代码 指示
2xx  成功
200  正常;请求已完成。
201  正常;紧接 POST 命令。
202  正常;已接受用于处理,但处理尚未完成。
203  正常;部分信息 — 返回的信息只是一部分。
204  正常;无响应 — 已接收请求,但不存在要回送的信息。
3xx  重定向  
301  已移动 — 请求的数据具有新的位置且更改是永久的。
302  已找到 — 请求的数据临时具有不同 URI。
303  请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。
304  未修改 — 未按预期修改文档。
305  使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。
306  未使用 — 不再使用;保留此代码以便将来使用。
4xx  客户机中出现的错误
400  错误请求 — 请求中有语法问题,或不能满足请求。
401  未授权 — 未授权客户机访问数据。
402  需要付款 — 表示计费系统已有效。
403  禁止 — 即使有授权也不需要访问。
404  找不到 — 服务器找不到给定的资源;文档不存在。
407  代理认证请求 — 客户机首先必须使用代理认证自身。
410   请求的网页不存在(永久);
415  介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。
5xx  服务器中出现的错误
500  内部错误 — 因为意外情况,服务器不能完成请求。
501  未执行 — 服务器不支持请求的工具。
502  错误网关 — 服务器接收到来自上游服务器的无效响应。
503  无法获得服务 — 由于临时过载或维护,服务器无法处理请求。

比如说:
2004-12-03 07:33:25 61.135.145.208 - *.*.*.* 80 GET /index/119.htm - 304 Baiduspider+(+http://www.baidu.com/search/spider.htm)
这就意味着百度蜘蛛在2004-12-03 07:33:25爬过/index/119.htm这一页,它发现这页是没有更新过的。

再比如说:2004-12-03 07:33:25 61.135.145.208 - *.*.*.* 80 GET /index/120.htm - Googlebot/2.1
(http://www.google.com/bot.html)
这就意味着Google蜘蛛在2004-12-03 07:33:25爬过/index/119.htm这一页,它发现这页是新的,并全部爬完。
分页: 9/15 第一页 上页 4 5 6 7 8 9 10 11 12 13 下页 最后页
[ 显示模式: 摘要 | 列表 ]