和搜索引擎交朋友:玩转搜索引擎周边产品、关注搜索引擎行业动态、、研究搜索引擎设计原理和排序算法思考搜索引擎发展态势
利用Google高级搜索功能做SEO调研
[
2008/04/30 19:02 | by 黑色梦中 ]
2008/04/30 19:02 | by 黑色梦中 ]
Google高级搜索提供了输入项、网页语言、网页区域、文件格式、日期、关键词位置、网域、权限等自定义搜索结果。
Google让蜘蛛自动填表提交 以抓取更多网页
[
2008/04/14 09:16 | by 黑色梦中 ]
2008/04/14 09:16 | by 黑色梦中 ]
据国外媒体报道:美国搜索巨头谷歌公司最近开始在网页抓取蜘蛛中实施一项新技术:他们可以让蜘蛛自动填写某些网页中的表格,并且自动提交到服务器上,对反馈页面进行抓取,从而获取更多有关这个网站的详细信息。
Google Sitelinks研究分析
[
2008/04/07 03:12 | by 黑色梦中 ]
2008/04/07 03:12 | by 黑色梦中 ]
Google Sitelinks是什么?
Google Sitelinks是指Google搜索结果页面中第一个搜索结果的网站描述信息下方显示出的该网站其他页面的文字链接。比如,在Google中搜索“黑色梦中”,参看图中显示的样式,这就是Sitelinks。
Google Sitelinks是指Google搜索结果页面中第一个搜索结果的网站描述信息下方显示出的该网站其他页面的文字链接。比如,在Google中搜索“黑色梦中”,参看图中显示的样式,这就是Sitelinks。
Google要为百度谋福利?
[
2008/03/17 00:08 | by 黑色梦中 ]
2008/03/17 00:08 | by 黑色梦中 ]
Google一直在致力于提高搜索结果的准确性、合理性、公正性。举两个例子,比如,早前钓鱼网站盛行时期,Google有效识别了钓鱼站点并成功阻止了模仿站点在搜索结果获得较好的排名,无论是利用人工数据库还是复制网页、网站权威度这样的系数,这样的调整的确降低了搜索用户受到利益危害的可能性;再比如,Google不断惩罚SPAM SEO站点,对无实际价值的站点进行降低权重或直接在数据库中删除,这无疑都是在力报搜索结果质量。在SEO优化研究中,我需要不断了解搜索结果的变化趋势,这个过程也使我切身感受到Google在提高用户搜索体验的过程中可谓不於余力。这的确需要每个SEO人都认真思考,到底是SEO在改变搜索结果还是搜索结果在改变SEO!
Google数据更新前后网页排名截然不同的变化
[
2008/02/18 22:15 | by 黑色梦中 ]
2008/02/18 22:15 | by 黑色梦中 ]
1月25号下午发文”北京火车票订票点地址和订票电话 ",提供这个资料主要是为了提醒关注俺BLOG的用户及早动手及时订票(因为25号我去拿票的时候票点的人已N多人);后来飘易博客的Flymorn问我是否在做”北京 火车票“的关键词,说实话,我看了评论后有点吃惊,原因有两方面:1、www.bloghuman.com是SEO博客,引入非相关流量意义不大,即便是可以通过Google Adsense CPC广告来盈利,可中文GG广告超低的单价让人实在缺乏兴趣;我怀疑是不是由于以前发表的文章”中国票务在线火车票频道网站优化案例“引起的,特此声明:本人非票务领域的专业人士。2、在我的SEO理念里,即便是对单网页进行较细致的SEO优化,获取优势排名的可能性也不大,因为它脱离了整个BLOG的话题范围,bloghuman.com的主题是SEO、UE、网络营销、WEB2.0、网站运营等IT专业类内容,我是当其实用工具的初衷来发表该文;而且,对于一个非主推的话题或内容,网页可能获取的反向链接数量将即为有限,即便是RSS聚合网站(据我观察有一些RSS聚合网站聚合了www.bloghuman.com的文章)可能会采用该文章,但一般情况都会对文章所属类型进行审核和归类,所以真正聚合该文章的情况会很少(目前只发现一家RSS聚合网站采用了该文章),于是该网页导入链接自然也很少,一个新网页在当前火车票相关关键词竞争激烈的情况下是很难有好的表现的。刻意说,那篇文章兵没有刻意的SEO技术优化,有的仅仅是设计标题的规范,否则为提高关键词展示,我可能会将”售票处电话“有计划的改成”订票电话“。
Google AdSense 2007合作伙伴推广暨优化论坛
[
2007/12/03 13:52 | by 黑色梦中 ]
2007/12/03 13:52 | by 黑色梦中 ]
10月30号下午,Google Adsense小组在东城区港澳中心国际会议中心,举办了Google AdSense 2007合作伙伴推广暨优化论坛;之前几天,得到Adsense小组工作人员的电话通知,于是欣然报名参加。
印象中,黑色梦中接触Google Adsense计划已三年多了,参与该计划大概可以追溯到05年,那时候是我最心爱的"时刻吧",一直以
来我都是将Adsense作为网站收入来源,虽然并不多,但也能解决带宽支出。
个人感觉,Adsense广告计划应该是个人站长最值得信赖的广告联盟,信誉很好,除了支付比较麻烦之外,其他我都比较满意;至于网上流传的收入快到100¥时被K掉的说法,我没有经历过,也不好发表评论,我大致想Google应该不会太过在意那100¥吧;参与Adsense计划,最忌讳的是自己点击广告和软件模拟点击(曾经风靡一时也曾经造就了N多收入丰厚的站长),除此之外还有很多条款需要遵守,基本上我从来不看具体的条款,因为一向是放上广告代码后就不再管了 。
印象中,黑色梦中接触Google Adsense计划已三年多了,参与该计划大概可以追溯到05年,那时候是我最心爱的"时刻吧",一直以
来我都是将Adsense作为网站收入来源,虽然并不多,但也能解决带宽支出。
个人感觉,Adsense广告计划应该是个人站长最值得信赖的广告联盟,信誉很好,除了支付比较麻烦之外,其他我都比较满意;至于网上流传的收入快到100¥时被K掉的说法,我没有经历过,也不好发表评论,我大致想Google应该不会太过在意那100¥吧;参与Adsense计划,最忌讳的是自己点击广告和软件模拟点击(曾经风靡一时也曾经造就了N多收入丰厚的站长),除此之外还有很多条款需要遵守,基本上我从来不看具体的条款,因为一向是放上广告代码后就不再管了 。
百度欲在中国复制“eBay+谷歌”模式
[
2007/11/29 19:31 | by 黑色梦中 ]
2007/11/29 19:31 | by 黑色梦中 ]
互联网企业正成为当下的市场热点———就在阿里巴巴赴港IPO进入倒计时之际,前期股价步步飙升的百度(BIDU.US)又抛出了重磅炸弹:百度宣布进军C2C市场,与阿里巴巴集团旗下的淘宝网和腾讯旗下的拍拍网展开争夺战。至此,三家市值最大的中国互联网公司(皆超过百亿美元)都将目光瞄向了发展潜力无限的C2C市场。
2007年7月美国搜索引擎市场份额数据
[
2007/11/29 19:15 | by 黑色梦中 ]
2007/11/29 19:15 | by 黑色梦中 ]
iResearch艾瑞咨询根据Hitwise发布的美国搜索引擎搜索量市场份额数据发现,2007年7月美国搜索引擎搜索量市场份额中Google占据了64.4%;雅虎搜索居其次,占据搜索量市场份额的22.1%;而MSN/Live搜索占市场份额的8.8%;ASK搜索则占搜索量市场份额的3.2%.
Google(谷歌)是怎样处理垃圾网站举报?
[
2007/09/23 11:26 | by 黑色梦中 ]
2007/09/23 11:26 | by 黑色梦中 ]
发表者 谷海一粟, WebSpam 组
转载自谷歌中文网站管理员博客 谷歌网站管理员工具不仅能帮助我们和网站管理员沟通,也提供了举报垃圾网站的在线渠道。感谢我们的用户,我们收到了很多垃圾网站举报。这些举报对我们改进搜索质量,给出更相关、有用的结果有很大帮助。谷歌用户可以很方便地通过两个渠道(认证的和不需认证的)进行垃圾网站举报。我们往往优先处理通过认证的渠道(譬如站长工具)递交的垃圾网站。当然,你也可以提交未经认证报告。由于未经认证报告是匿名举报,我们给他们赋予的优先级会相对较低。这里我们想讲一讲我们是如何处理从站长管理员工具得到的垃圾网站举报的。
我们评估垃圾网站举报
我们非常重视垃圾网站的举报,并有专门人员及时处理。
转载自谷歌中文网站管理员博客 谷歌网站管理员工具不仅能帮助我们和网站管理员沟通,也提供了举报垃圾网站的在线渠道。感谢我们的用户,我们收到了很多垃圾网站举报。这些举报对我们改进搜索质量,给出更相关、有用的结果有很大帮助。谷歌用户可以很方便地通过两个渠道(认证的和不需认证的)进行垃圾网站举报。我们往往优先处理通过认证的渠道(譬如站长工具)递交的垃圾网站。当然,你也可以提交未经认证报告。由于未经认证报告是匿名举报,我们给他们赋予的优先级会相对较低。这里我们想讲一讲我们是如何处理从站长管理员工具得到的垃圾网站举报的。
我们评估垃圾网站举报
我们非常重视垃圾网站的举报,并有专门人员及时处理。
你知道google和百度两个关键词的相关度是多少么?--最后我将来回答这个问题
通常我们对于文本信息之间得相关性得计算都是采用向量的办法,我在以前的PPT里曾经提到过。然而对于文本信息更深层次的分析不能单纯从字面上分析一篇文章的关键词,更重要的是它隐含的扩展的意义。
传统的关于计算文本相关度和【网页和查询的相关性】的计算都是采用匹配的方式进行的,然而这只能是基于字面意义上的统计计算。这里介绍的做法是采用关键词相关性扩展的做法从而得到更加精确的相关度计算。
通常我们对于文本信息之间得相关性得计算都是采用向量的办法,我在以前的PPT里曾经提到过。然而对于文本信息更深层次的分析不能单纯从字面上分析一篇文章的关键词,更重要的是它隐含的扩展的意义。
传统的关于计算文本相关度和【网页和查询的相关性】的计算都是采用匹配的方式进行的,然而这只能是基于字面意义上的统计计算。这里介绍的做法是采用关键词相关性扩展的做法从而得到更加精确的相关度计算。
【最短路径】
圆明园的北部有一个迷宫,据说古时候每次有庆典在圆明园的时候,皇帝会派一些宫女走迷宫,看谁最先走到迷宫内的亭子,会有不错的奖赏。
迷宫问题对数学家们来讲虽然是小儿科但在计算机课程上却非常重要,因为不同的求解会涉及到递归,广度优先和深度优先等算法。
迷宫毕竟是一个放置在2维空间的有限联系的网络,也就是说,迷宫里的每一个点,最多只和周围的4个点(上下左右)发生关系,而且这些点的位置是固定的。
圆明园的北部有一个迷宫,据说古时候每次有庆典在圆明园的时候,皇帝会派一些宫女走迷宫,看谁最先走到迷宫内的亭子,会有不错的奖赏。
迷宫问题对数学家们来讲虽然是小儿科但在计算机课程上却非常重要,因为不同的求解会涉及到递归,广度优先和深度优先等算法。
迷宫毕竟是一个放置在2维空间的有限联系的网络,也就是说,迷宫里的每一个点,最多只和周围的4个点(上下左右)发生关系,而且这些点的位置是固定的。
本文通过搜索结果归纳分析+切词通用算法分析的方式对百度预处理阶段的查询处理和中文分词两项技术进行了阐述、总结,如果你对数据结构、算法有一定了解的话,理解起来会相对容易些;个人感觉,得出正向最大匹配算法不够准确,无论是专用词典还是普通词典里的词,都是有不同权重的,这根搜索频率应该有一定关系,基于这点,在出现多个专用词典里的词时,是需要采用双向最大匹配算法来检测到底哪一个专有词汇应该先被切出来,当然,这是个人猜想,有待考究。
理解分词技术对SEO工作具有极大意义,可以从科学的角度来分析关键词,并构想关键词部署策略;如果正向最大匹配算法的结论是正确的,那基本上可以断定,切词后的分词的权重是按照正向排序的
我还想搞明白的是专用词典和普通词典,哪一个权重会更高?
理解分词技术对SEO工作具有极大意义,可以从科学的角度来分析关键词,并构想关键词部署策略;如果正向最大匹配算法的结论是正确的,那基本上可以断定,切词后的分词的权重是按照正向排序的
我还想搞明白的是专用词典和普通词典,哪一个权重会更高?
发表者: 谷海一粟
转载自谷歌中文网站管理员博客
转载自谷歌中文网站管理员博客
Google宣布去掉“补充材料”标记
[
2007/08/01 17:24 | by 黑色梦中 ]
2007/08/01 17:24 | by 黑色梦中 ]
所谓的“补充材料”,也即Google搜索结果里的“Supplemental Results”标记。简单地说,Google有两大索引数据库,一个是主索引数据库,当你在Google里搜索时,得到的常规搜索结果就是直接来自主索引数据库;当网站的某些网页链接过于复杂(比如参数过多),或者网页的PR值很低,又或者网页内容和其它网页重复等等,这些原因都可能导致Google将网页收录进补充索引数据库里。被收录进补充索引数据库的网页,一般会被Google标记为“补充材料”。这种做法始于2003年。
Google AdSense防欺骗原理
[
2007/07/16 22:28 | by 黑色梦中 ]
2007/07/16 22:28 | by 黑色梦中 ]
Google AdSense防欺骗原理:
随着在线广告的流行,pay by per click (每次点击付钱)的模式 逐渐被大家接受。可是随之而来的问题就是fraud clicking的预防迫在眉捷,因为这将直接关系到这种广告模式能否长久生存和能否成为一种真正的网站拥有者的收入来源。
下面介绍Google Adsense系统如何从系统角度出发防止点击欺骗,希望对其它的在线广告系统防止虚假点击能有很好的指导作用:
随着在线广告的流行,pay by per click (每次点击付钱)的模式 逐渐被大家接受。可是随之而来的问题就是fraud clicking的预防迫在眉捷,因为这将直接关系到这种广告模式能否长久生存和能否成为一种真正的网站拥有者的收入来源。
下面介绍Google Adsense系统如何从系统角度出发防止点击欺骗,希望对其它的在线广告系统防止虚假点击能有很好的指导作用:
如何解决GOOGLE“该网站可能会损害您的计算机”
[
2007/07/04 11:51 | by 黑色梦中 ]
2007/07/04 11:51 | by 黑色梦中 ]
最近在Google搜索结果中发现一些新的情况,某些网站在SERP中被标识了“该网站可能会损害您的计算机”的提示语句。病毒、木马的危害对于中国网民而言,将会使非常可怕的事情;试想,如果网民在SERP页面发现即将点击的站点被列在有危害可能的网站,可想而知,该网站的点击率将会下降。
PR的下降与网站内容质量有关?
[
2007/05/13 00:40 | by 黑色梦中 ]
2007/05/13 00:40 | by 黑色梦中 ]
谷歌发布网站广告优化器
[
2007/04/07 15:04 | by 黑色梦中 ]
2007/04/07 15:04 | by 黑色梦中 ]
4月6日消息,Google(谷歌)正式发布网站优化器。据称。该工具是可以帮助AdWords 广告主将更多的访问量转化为销售量、注册量或下载量。
据悉,谷歌网站优化器是一款多功能的登陆页面优化工具,可以让营销人员得以测试各种有关网页内容的想法,例如标题、促销性副本或图像等。该应用提供了易于阅读的报告,让广告主清晰地看到究竟哪一种变化最能引起站点访问者的共鸣。它是一种自助式应用,让站长自己动手设置和运行不同类型的登陆页面实验。
官方透露,Google(谷歌)网站优化器(www.google.com/websiteoptimizer)目前为试用版,它整合到了Google(谷歌)AdWords计划中,并免费提供给AdWords广告主。
据称今后的几个星期,谷歌网站优化器应用自动对所有广告主的帐号开放。站长可以根据最高的转化率来判断哪些内容是最有效的。
据悉,谷歌网站优化器是一款多功能的登陆页面优化工具,可以让营销人员得以测试各种有关网页内容的想法,例如标题、促销性副本或图像等。该应用提供了易于阅读的报告,让广告主清晰地看到究竟哪一种变化最能引起站点访问者的共鸣。它是一种自助式应用,让站长自己动手设置和运行不同类型的登陆页面实验。
官方透露,Google(谷歌)网站优化器(www.google.com/websiteoptimizer)目前为试用版,它整合到了Google(谷歌)AdWords计划中,并免费提供给AdWords广告主。
据称今后的几个星期,谷歌网站优化器应用自动对所有广告主的帐号开放。站长可以根据最高的转化率来判断哪些内容是最有效的。
百度中文分词算法分析之三
[
2007/02/01 14:10 | by 黑色梦中 ]
2007/02/01 14:10 | by 黑色梦中 ]
百度分词算法的进一步分析
上面说过,经过分析得出百度的分词系统采用双向最大匹配分词,但是后来发现推理过程中存在一个漏洞,而且推导出来的百度分词算法步骤还是过于繁琐,所以进一步进行分析,看看是否前面的推导有错误.
上面说过,经过分析得出百度的分词系统采用双向最大匹配分词,但是后来发现推理过程中存在一个漏洞,而且推导出来的百度分词算法步骤还是过于繁琐,所以进一步进行分析,看看是否前面的推导有错误.
百度中文分词算法分析之二
[
2007/02/01 14:08 | by 黑色梦中 ]
2007/02/01 14:08 | by 黑色梦中 ]
Spelling Checker拼写检查错误提示(以及拼音提示功能)
拼写检查错误提示是搜索引擎都具备的一个功能,也就是说用户提交查询 给搜索引擎,搜索引擎检查看是否用户输入的拼写有错误,对于中文用户来说一般造成的错误是输入法造成的错误.那么我们就来分析看看百度是 怎么实现这一功能的.
我们分析拼写检查系统关注以下几个问题:
(1)系统如何判断用户的输入是有可能发生错误的查询呢?
(2)如果判断是可能错误的查询输入,如何提示正确的词汇呢?
拼写检查错误提示是搜索引擎都具备的一个功能,也就是说用户提交查询 给搜索引擎,搜索引擎检查看是否用户输入的拼写有错误,对于中文用户来说一般造成的错误是输入法造成的错误.那么我们就来分析看看百度是 怎么实现这一功能的.
我们分析拼写检查系统关注以下几个问题:
(1)系统如何判断用户的输入是有可能发生错误的查询呢?
(2)如果判断是可能错误的查询输入,如何提示正确的词汇呢?




2007/09/14 14:24 | by

