æœç´¢å¼•æ“Žç»„æˆåŠå·¥ä½œåŽŸç†
æœç´¢å¼•æ“Žç³»ç»Ÿä¸€èˆ¬ç”±èœ˜è››ï¼ˆä¹Ÿå«ç½‘页爬行器)ã€åˆ‡è¯å™¨ã€ç´¢å¼•å™¨ã€æŸ¥è¯¢å™¨å‡ 部分组æˆã€‚蜘蛛负责网页信æ¯çš„抓å–工作,一般情况下切è¯å™¨å’Œç´¢å¼•å™¨ä¸€èµ·ä½¿ç”¨ï¼Œå®ƒä»¬è´Ÿè´£å°†æŠ“å–的网页内容进行切è¯å¤„ç†å¹¶è‡ªåŠ¨è¿›è¡Œæ ‡å¼•ï¼Œå»ºç«‹ç´¢å¼•æ•°æ®åº“ã€‚æŸ¥è¯¢å™¨æ ¹æ®ç”¨æˆ·æŸ¥è¯¢æ¡ä»¶æ£€ç´¢ç´¢å¼•æ•°æ®åº“并对检索结果进行排åºå’Œé›†åˆè¿ç®—,如并集ã€äº¤é›†è¿ç®—,å†æå–网页简å•æ‘˜è¦ä¿¡æ¯å馈给查询用户。
Googleæœç´¢å¼•æ“Žä»ŽåŠŸèƒ½ä¸ŠåŒæ ·åˆ†ä¸ºä¸‰å¤§éƒ¨åˆ†ï¼šç½‘页爬行ã€æ ‡å¼•å…¥åº“和用户查询。网页爬行主è¦è´Ÿè´£ç½‘页的抓å–,由URLæœåŠ¡å™¨ã€çˆ¬è¡Œå™¨ã€å˜å‚¨å™¨ã€åˆ†æžå™¨å’ŒURL解æžå™¨ç»„æˆ, çˆ¬è¡Œå™¨æ˜¯è¯¥éƒ¨åˆ†çš„æ ¸å¿ƒï¼›æ ‡å¼•å…¥åº“ä¸»è¦è´Ÿè´£å¯¹ç½‘页内容进行分æžï¼Œå¯¹æ–‡æ¡£è¿›è¡Œæ ‡å¼•å¹¶å˜å‚¨åˆ°æ•°æ®åº“é‡Œï¼Œç”±æ ‡å¼•å™¨å’Œåˆ†ç±»å™¨ç»„æˆï¼Œè¯¥æ¨¡å—涉åŠè®¸å¤šæ–‡ä»¶å’Œæ•°æ®ï¼Œæœ‰å…³äºŽæ¡¶çš„æ“ä½œæ˜¯è¯¥éƒ¨åˆ†çš„æ ¸å¿ƒï¼›ç”¨æˆ·æŸ¥è¯¢ä¸»è¦è´Ÿè´£åˆ†æžç”¨æˆ·è¾“入的检索表达å¼ï¼ŒåŒ¹é…相关文档,把检索结果返回给用户,由查询器和网页级别评定器组æˆï¼Œå…¶ä¸ç½‘页ç‰çº§çš„è®¡ç®—æ˜¯è¯¥éƒ¨åˆ†çš„æ ¸å¿ƒã€‚
æœç´¢å¼•æ“Žçš„主è¦å·¥ä½œæµç¨‹æ˜¯ï¼šé¦–先从蜘蛛开始,蜘蛛程åºæ¯éš”一定的时间,自动å¯åŠ¨å¹¶è¯»å–网页URLæœåŠ¡å™¨ä¸Šçš„URL列表,按深度优先或广度优先算法,抓å–å„URL所指定的网站,将抓å–的网页分é…一个唯一文档ID(DocId),å˜å…¥æ–‡æ¡£æ•°æ®åº“。一般在å˜å…¥æ–‡æ¡£æ•°æ®åº“之å‰è¿›è¡Œä¸€å®šçš„压缩处ç†ã€‚并将当å‰é¡µä¸Šçš„所的超连接å˜å…¥åˆ°URLæœåŠ¡å™¨ä¸ã€‚在进行抓å–çš„åŒæ—¶ï¼Œåˆ‡è¯å™¨å’Œç´¢å¼•å™¨å°†å·²ç»æŠ“å–的网页文档进行切è¯å¤„ç†ï¼Œå¹¶æŒ‰è¯åœ¨ç½‘页ä¸å‡ºçŽ°çš„ä½ç½®å’Œé¢‘率计算æƒå€¼ï¼Œç„¶åŽå°†åˆ‡è¯ç»“æžœå˜å…¥ç´¢å¼•æ•°æ®åº“。整个抓å–工作和索引工作完æˆåŽæ›´æ–°æ•´ä¸ªç´¢å¼•æ•°æ®åº“和文档数æ®åº“ï¼Œè¿™æ ·ç”¨æˆ·å°±å¯ä»¥æŸ¥è¯¢æœ€æ–°çš„网页信æ¯ã€‚查询器首先对用户输入的信æ¯è¿›è¡Œåˆ‡è¯å¤„ç†ï¼Œå¹¶æ£€ç´¢å‡ºæ‰€æœ‰åŒ…å«æ£€ç´¢è¯çš„记录,通过计算网页æƒé‡å’Œçº§åˆ«å¯¹æŸ¥è¯¢è®°å½•è¿›è¡ŒæŽ’åºå¹¶è¿›è¡Œé›†åˆè¿ç®—,最åŽä»Žæ–‡æ¡£æ•°æ®åº“ä¸æå–å„网页的摘è¦ä¿¡æ¯å馈给查询用户。
最后编辑: 郝聪 编辑于2008/02/19 16:48
Googleæœç´¢å¼•æ“Žä»ŽåŠŸèƒ½ä¸ŠåŒæ ·åˆ†ä¸ºä¸‰å¤§éƒ¨åˆ†ï¼šç½‘页爬行ã€æ ‡å¼•å…¥åº“和用户查询。网页爬行主è¦è´Ÿè´£ç½‘页的抓å–,由URLæœåŠ¡å™¨ã€çˆ¬è¡Œå™¨ã€å˜å‚¨å™¨ã€åˆ†æžå™¨å’ŒURL解æžå™¨ç»„æˆ, çˆ¬è¡Œå™¨æ˜¯è¯¥éƒ¨åˆ†çš„æ ¸å¿ƒï¼›æ ‡å¼•å…¥åº“ä¸»è¦è´Ÿè´£å¯¹ç½‘页内容进行分æžï¼Œå¯¹æ–‡æ¡£è¿›è¡Œæ ‡å¼•å¹¶å˜å‚¨åˆ°æ•°æ®åº“é‡Œï¼Œç”±æ ‡å¼•å™¨å’Œåˆ†ç±»å™¨ç»„æˆï¼Œè¯¥æ¨¡å—涉åŠè®¸å¤šæ–‡ä»¶å’Œæ•°æ®ï¼Œæœ‰å…³äºŽæ¡¶çš„æ“ä½œæ˜¯è¯¥éƒ¨åˆ†çš„æ ¸å¿ƒï¼›ç”¨æˆ·æŸ¥è¯¢ä¸»è¦è´Ÿè´£åˆ†æžç”¨æˆ·è¾“入的检索表达å¼ï¼ŒåŒ¹é…相关文档,把检索结果返回给用户,由查询器和网页级别评定器组æˆï¼Œå…¶ä¸ç½‘页ç‰çº§çš„è®¡ç®—æ˜¯è¯¥éƒ¨åˆ†çš„æ ¸å¿ƒã€‚
æœç´¢å¼•æ“Žçš„主è¦å·¥ä½œæµç¨‹æ˜¯ï¼šé¦–先从蜘蛛开始,蜘蛛程åºæ¯éš”一定的时间,自动å¯åŠ¨å¹¶è¯»å–网页URLæœåŠ¡å™¨ä¸Šçš„URL列表,按深度优先或广度优先算法,抓å–å„URL所指定的网站,将抓å–的网页分é…一个唯一文档ID(DocId),å˜å…¥æ–‡æ¡£æ•°æ®åº“。一般在å˜å…¥æ–‡æ¡£æ•°æ®åº“之å‰è¿›è¡Œä¸€å®šçš„压缩处ç†ã€‚并将当å‰é¡µä¸Šçš„所的超连接å˜å…¥åˆ°URLæœåŠ¡å™¨ä¸ã€‚在进行抓å–çš„åŒæ—¶ï¼Œåˆ‡è¯å™¨å’Œç´¢å¼•å™¨å°†å·²ç»æŠ“å–的网页文档进行切è¯å¤„ç†ï¼Œå¹¶æŒ‰è¯åœ¨ç½‘页ä¸å‡ºçŽ°çš„ä½ç½®å’Œé¢‘率计算æƒå€¼ï¼Œç„¶åŽå°†åˆ‡è¯ç»“æžœå˜å…¥ç´¢å¼•æ•°æ®åº“。整个抓å–工作和索引工作完æˆåŽæ›´æ–°æ•´ä¸ªç´¢å¼•æ•°æ®åº“和文档数æ®åº“ï¼Œè¿™æ ·ç”¨æˆ·å°±å¯ä»¥æŸ¥è¯¢æœ€æ–°çš„网页信æ¯ã€‚查询器首先对用户输入的信æ¯è¿›è¡Œåˆ‡è¯å¤„ç†ï¼Œå¹¶æ£€ç´¢å‡ºæ‰€æœ‰åŒ…å«æ£€ç´¢è¯çš„记录,通过计算网页æƒé‡å’Œçº§åˆ«å¯¹æŸ¥è¯¢è®°å½•è¿›è¡ŒæŽ’åºå¹¶è¿›è¡Œé›†åˆè¿ç®—,最åŽä»Žæ–‡æ¡£æ•°æ®åº“ä¸æå–å„网页的摘è¦ä¿¡æ¯å馈给查询用户。
相关日志
è°·æŒç©¿è¶Šæœç´¢-è°·æŒå®˜æ–¹æ„šäººèŠ‚玩笑
Google将在æœç´¢ç»“果排å算法ä¸è€ƒè™‘æ¥è‡ªTwitterã€Quoraç‰ç¤¾ä¼šåŒ–网络社区的内容
桥页SEO:网站自我æ¯ç工具
《Google官方SEO入门指å—》å四: 对网站管ç†å‘˜æœ‰ç”¨çš„资æº(完)
《Google官方SEO入门指å—》å三:充分利用网站分æžå·¥å…·
《Google官方SEO入门指å—》å二:充分利用å…费的网站管ç†å‘˜å·¥å…·
《Google官方SEO入门指å—》å一:以æ°å½“çš„æ–¹å¼æŽ¨å¹¿ä½ 的网站
《Google官方SEO入门指å—》åï¼šä¸ºé“¾æŽ¥æ·»åŠ nofollow属性
《Google官方SEO入门指å—》ä¹ï¼šæœ‰æ•ˆä½¿ç”¨robots.txt
《Google官方SEO入门指å—》八:网页图片优化
è°·æŒç©¿è¶Šæœç´¢-è°·æŒå®˜æ–¹æ„šäººèŠ‚玩笑
Google将在æœç´¢ç»“果排å算法ä¸è€ƒè™‘æ¥è‡ªTwitterã€Quoraç‰ç¤¾ä¼šåŒ–网络社区的内容
桥页SEO:网站自我æ¯ç工具
《Google官方SEO入门指å—》å四: 对网站管ç†å‘˜æœ‰ç”¨çš„资æº(完)
《Google官方SEO入门指å—》å三:充分利用网站分æžå·¥å…·
《Google官方SEO入门指å—》å二:充分利用å…费的网站管ç†å‘˜å·¥å…·
《Google官方SEO入门指å—》å一:以æ°å½“çš„æ–¹å¼æŽ¨å¹¿ä½ 的网站
《Google官方SEO入门指å—》åï¼šä¸ºé“¾æŽ¥æ·»åŠ nofollow属性
《Google官方SEO入门指å—》ä¹ï¼šæœ‰æ•ˆä½¿ç”¨robots.txt
《Google官方SEO入门指å—》八:网页图片优化
最后编辑: 郝聪 编辑于2008/02/19 16:48