SEO中文意思是搜索引擎优化,SEO英文全称为Search Engine Optimization。搜索引擎优化(SEO)建立在用户搜索体验为中心的基础之上,通过提高网页级别、建立合理且顺畅的网站链接结构、丰富网站内容及展现形式,使网站自身结构设计、网页代码适合搜索引擎的信息抓取并对搜索引擎具备友好性,进而在搜索结果上获得较高的排序权重。搜索引擎优化(SEO)贯穿于网站策划、建设、运营、推广全过程,通过制定和执行有针对性的网站优化策略,依靠搜索引擎平台为企业引入目标用户,是企业网站、商业网站开展网络营销推广的重要方式。

网站优化与搜索引擎优化是不同的两个概念,两者之间是包涵关系;网站优化包括网站搜索引擎优化、网络环境优化和用户体验优化。网站优化为企业网络营销策略的制定和实施提供保障。

郝聪[黑色梦中]:网络营销探索者与实践者,曾为多家商业网站提供过网站优化服务。研究:搜索引擎优化(SEO)技术、用户体验(UE)、网络营销、搜索引擎算法、数据分析与挖掘;思考:SEO应用模式与电子商务运营。博客原创文章欢迎转载,转载时请注明本人并以链接形式标注此博客。

商业服务:中英文关键词排名优化、整站网站优化、网站诊断分析服务、营销顾问咨询
联系方式:黑色梦中SEO博客 | 黑色梦中SEO博客

百度分词算法详解

[晴 2007/09/10 17:48 | by 黑色梦中 ]
本文通过搜索结果归纳分析+切词通用算法分析的方式对百度预处理阶段的查询处理和中文分词两项技术进行了阐述、总结,如果你对数据结构、算法有一定了解的话,理解起来会相对容易些;个人感觉,得出正向最大匹配算法不够准确,无论是专用词典还是普通词典里的词,都是有不同权重的,这根搜索频率应该有一定关系,基于这点,在出现多个专用词典里的词时,是需要采用双向最大匹配算法来检测到底哪一个专有词汇应该先被切出来,当然,这是个人猜想,有待考究。

理解分词技术对SEO工作具有极大意义,可以从科学的角度来分析关键词,并构想关键词部署策略;如果正向最大匹配算法的结论是正确的,那基本上可以断定,切词后的分词的权重是按照正向排序的

我还想搞明白的是专用词典和普通词典,哪一个权重会更高?
百度分词算法的进一步分析

上面说过,经过分析得出百度的分词系统采用双向最大匹配分词,但是后来发现推理过程中存在一个漏洞,而且推导出来的百度分词算法步骤还是过于繁琐,所以进一步进行分析,看看是否前面的推导有错误.  
Spelling Checker拼写检查错误提示(以及拼音提示功能)   
拼写检查错误提示是搜索引擎都具备的一个功能,也就是说用户提交查询 给搜索引擎,搜索引擎检查看是否用户输入的拼写有错误,对于中文用户来说一般造成的错误是输入法造成的错误.那么我们就来分析看看百度是 怎么实现这一功能的.
  我们分析拼写检查系统关注以下几个问题:
  (1)系统如何判断用户的输入是有可能发生错误的查询呢?  
  (2)如果判断是可能错误的查询输入,如何提示正确的词汇呢?
查询处理以及分词技术

随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为技术人员,会把有代表性的搜索引擎作为研究对象. 搜索引擎经济的崛起,又一次向人们证明了网络所蕴藏的巨大商机。网络离开了搜索将只剩下空洞杂乱的数据,以及大量等待去费力挖掘的金矿。

GOOGLE搜索引擎剖析

[晴 2006/09/24 14:35 | by 黑色梦中 ]
GOOGLE搜索引擎剖析

撰文/Sergey Brin.   Lawrence Page     翻译/万思

文章来自《程序员》
英文原文可以在这里找到http://dev.csdn.net/develop/article/12/12657.shtm

作为一种功能强大的搜索引擎,Googic的背后似乎隐藏着巨大的奥秘,本文是Googic的两位创始人在1998年国际互联网大会上发表的论文,通过对Google进行完整地剖析,帮助读者理解Google的实现过程
     在编写网页搜索的过程中,网页臃余和内容臃余是个非常严重的问题,信息片算法就是为了解决这个问题而设计的算法。

    传统的搜索引擎对网页原代码基本上都是完全保存的,baidu,google都有他们的网页快照,而这些快照的内容就是他们的蜘蛛程序在发现连接后读取到的内容,仔细想一下我们有必要将网页全文收录吗?假设你和我一样追求最低成本,最快速度,回答便是否定的,尽管搜索的是索引文件,而非这个全文目录。首先一个网站他的网页有可能好多都是重复的,当然你非说你的网站网页完全不重复我也没意见,毕竟这只是最坏的打算,其次,网页的内容块可能存在很多重复的,比如网页的导航条,页脚的版权信息,最新文章10篇等等,假设有一种算法可以获得每张网页的新信息,抛弃臃余,这样不是很好吗?
分页: 1/1 第一页 1 最后页 [ 显示模式: 摘要 | 列表 ]