Googleæœç´¢åŽŸç†çš„è®ºæ–‡(äºŒ)

郝聪 , 2006/09/24 14:28 , 搜索引擎研究 , 评论(0) , 阅读(13109) , Via 本站原创

Googleæœç´¢åŽŸç†çš„è®ºæ–‡(ä¸€)

4.3æŠ“ç½‘é¡µè¿è¡Œ
    ç½‘ç»œçˆ¬è¡Œæœºå™¨äººæ˜¯ä¸€é¡¹å…·æœ‰æŒ‘æˆ˜æ€§çš„ä»»åŠ¡ã€‚æ‰§è¡Œçš„æ€§èƒ½å’Œå¯é æ€§ç”šè‡³æ›´é‡è¦ï¼Œè¿˜æœ‰ä¸€äº›ç¤¾ä¼šç„¦ç‚¹ã€‚ç½‘ç»œçˆ¬è¡Œæ˜¯ä¸€é¡¹éžå¸¸è–„å¼±çš„åº”ç”¨ï¼Œå®ƒéœ€è¦æˆç™¾ä¸Šåƒçš„webæœåŠ¡å™¨å’Œå„ç§åŸŸåæœåŠ¡å™¨çš„å‚ä¸Žï¼Œè¿™äº›æœåŠ¡å™¨ä¸æ˜¯æˆ‘ä»¬ç³»ç»Ÿæ‰€èƒ½æŽ§åˆ¶çš„ã€‚ä¸ºäº†è¦†ç›–å‡ åäº¿çš„ç½‘é¡µï¼ŒGoogleæ‹¥æœ‰å¿«é€Ÿçš„åˆ†å¸ƒå¼ç½‘ç»œçˆ¬è¡Œç³»ç»Ÿã€‚ä¸€ä¸ªURLæœåŠ¡å™¨ç»™è‹¥å¹²ä¸ªç½‘ç»œçˆ¬è¡Œæœºå™¨äººï¼ˆæˆ‘ä»¬é‡‡ç”¨3ä¸ªï¼‰æä¾›URLåˆ—è¡¨ã€‚URLæœåŠ¡å™¨å’Œç½‘ç»œçˆ¬è¡Œæœºå™¨äººéƒ½æ˜¯ç”¨Pythonå®žçŽ°çš„ã€‚æ¯ä¸ªç½‘ç»œçˆ¬è¡Œæœºå™¨äººå¯ä»¥åŒæ—¶æ‰“å¼€300ä¸ªé“¾æŽ¥ã€‚æŠ“å–ç½‘é¡µå¿…é¡»è¶³å¤Ÿå¿«ã€‚æœ€å¿«æ—¶ï¼Œç”¨4ä¸ªç½‘ç»œçˆ¬è¡Œæœºå™¨äººæ¯ç§’å¯ä»¥çˆ¬è¡Œ100ä¸ªç½‘é¡µã€‚é€ŸçŽ‡è¾¾æ¯ç§’600Kã€‚æ‰§è¡Œçš„é‡ç‚¹æ˜¯æ‰¾DNSã€‚æ¯ä¸ªç½‘ç»œçˆ¬è¡Œæœºå™¨äººæœ‰å®ƒè‡ªå·±çš„DNS cacheï¼Œæ‰€ä»¥å®ƒä¸å¿…æ¯ä¸ªç½‘é¡µéƒ½æŸ¥DNSã€‚æ¯ä¸€ç™¾ä¸ªè¿žæŽ¥éƒ½æœ‰å‡ ç§ä¸åŒçš„çŠ¶æ€ï¼šæŸ¥DNSï¼Œè¿žæŽ¥ä¸»æœºï¼Œå‘é€è¯·æ±‚ï¼ŒæŽ¥æ”¶å›žç”ã€‚è¿™äº›å› ç´ ä½¿ç½‘ç»œçˆ¬è¡Œæœºå™¨äººæˆä¸ºç³»ç»Ÿæ¯”è¾ƒå¤æ‚çš„éƒ¨åˆ†ã€‚å®ƒç”¨å¼‚æ¥IOå¤„ç†äº‹ä»¶ï¼Œè‹¥å¹²è¯·æ±‚é˜Ÿåˆ—ä»Žä¸€ä¸ªç½‘ç«™åˆ°å¦ä¸€ä¸ªç½‘ç«™ä¸åœçš„æŠ“å–ç½‘é¡µã€‚è¿è¡Œä¸€ä¸ªé“¾æŽ¥åˆ°500å¤šä¸‡å°æœåŠ¡å™¨çš„ç½‘é¡µçˆ¬è¡Œæœºå™¨äººï¼Œäº§ç”Ÿ1åƒå¤šä¸‡ç™»é™†å£ï¼Œå¯¼è‡´äº†å¤§é‡çš„Emailå’Œç”µè¯ã€‚å› ä¸ºç½‘æ°‘ä¼—å¤šï¼Œæ€»æœ‰äº›äººä¸çŸ¥é“ç½‘ç»œçˆ¬è¡Œæœºå™¨äººæ˜¯ä½•ç‰©ï¼Œè¿™æ˜¯ä»–ä»¬çœ‹åˆ°çš„ç¬¬ä¸€ä¸ªç½‘ç»œçˆ¬è¡Œæœºå™¨äººã€‚å‡ ä¹Žæ¯å¤©æˆ‘ä»¬éƒ½ä¼šæ”¶åˆ°è¿™æ ·çš„Emailâ€œå“¦ï¼Œä½ ä»Žæˆ‘ä»¬çš„ç½‘ç«™çœ‹äº†å¤ªå¤šçš„ç½‘é¡µï¼Œä½ æƒ³å¹²ä»€ä¹ˆï¼Ÿâ€è¿˜æœ‰ä¸€äº›äººä¸çŸ¥é“ç½‘ç»œæœç´¢æœºå™¨äººé¿å…åè®®ï¼ˆthe robots exclusion protocolï¼‰ï¼Œä»¥ä¸ºä»–ä»¬çš„ç½‘é¡µä¸Šå†™ç€â€œç‰ˆæƒæ‰€æœ‰ï¼Œå‹¿è¢«ç´¢å¼•â€çš„å—æ ·å°±ä¼šè¢«ä¿æŠ¤ä¸è¢«ç´¢å¼•ï¼Œä¸å¿…è¯´ï¼Œè¿™æ ·çš„è¯å¾ˆéš¾è¢«web crawlerç†è§£ã€‚å› ä¸ºæ•°æ®é‡å¦‚æ¤ä¹‹å¤§ï¼Œè¿˜ä¼šé‡åˆ°ä¸€äº›æ„æƒ³ä¸åˆ°çš„äº‹æƒ…ã€‚ä¾‹å¦‚ï¼Œæˆ‘ä»¬çš„ç³»ç»Ÿæ›¾ç»ä¼å›¾æŠ“ä¸€ä¸ªåœ¨çº¿æ¸¸æˆï¼Œç»“æžœæŠ“åˆ°äº†æ¸¸æˆä¸çš„å¤§é‡åžƒåœ¾ä¿¡æ¯ã€‚è§£å†³è¿™ä¸ªé—®é¢˜å¾ˆç®€å•ã€‚ä½†æ˜¯æˆ‘ä»¬ä¸‹è½½äº†å‡ åƒä¸‡ç½‘é¡µåŽæ‰å‘çŽ°äº†è¿™ä¸ªé—®é¢˜ã€‚å› ä¸ºç½‘é¡µå’ŒæœåŠ¡å™¨çš„ç§ç±»ç¹å¤šï¼Œå®žé™…ä¸Šä¸åœ¨å¤§éƒ¨åˆ†Internetä¸Šè¿è¡Œå®ƒå°±æµ‹è¯•ä¸€ä¸ªç½‘é¡µçˆ¬è¡Œæœºå™¨äººæ˜¯ä¸å¯èƒ½ã€‚æ€»æ˜¯æœ‰å‡ ç™¾ä¸ªéšå«çš„é—®é¢˜å‘ç”Ÿåœ¨æ•´ä¸ªwebçš„ä¸€ä¸ªç½‘é¡µä¸Šï¼Œå¯¼è‡´ç½‘ç»œçˆ¬è¡Œæœºå™¨äººå´©æºƒï¼Œæˆ–è€…æ›´ç³Ÿï¼Œå¯¼è‡´ä¸å¯é¢„æµ‹çš„ä¸æ£ç¡®çš„è¡Œä¸ºã€‚èƒ½å¤Ÿè®¿é—®å¤§éƒ¨åˆ†Internetçš„ç³»ç»Ÿå¿…é¡»ç²¾åŠ›å……æ²›å¹¶ç²¾å¿ƒæµ‹è¯•è¿‡ã€‚ç”±äºŽè±¡crawlerè¿™æ ·å¤§åž‹å¤æ‚çš„ç³»ç»Ÿæ€»æ˜¯äº§ç”Ÿè¿™æ ·é‚£æ ·çš„é—®é¢˜ï¼Œå› æ¤èŠ±è´¹ä¸€äº›èµ„æºè¯»è¿™äº›Emailï¼Œå½“é—®é¢˜å‘ç”Ÿæ—¶è§£å†³å®ƒï¼Œæ˜¯æœ‰å¿…è¦çš„ã€‚

4.4 Webç´¢å¼•åˆ†æž
    ä»»ä½•è¿è¡Œåœ¨æ•´ä¸ªWebä¸Šçš„åˆ†æžå™¨å¿…é¡»èƒ½å¤Ÿå¤„ç†å¯èƒ½åŒ…å«é”™è¯¯çš„å¤§åž‹é›†åˆã€‚èŒƒå›´ä»ŽHTMLæ ‡è®°åˆ°æ ‡è®°ä¹‹é—´å‡ Kå—èŠ‚çš„0ï¼ŒéžASCIIå—ç¬¦ï¼Œå‡ ç™¾å±‚HTMLæ ‡è®°çš„åµŒå¥—ï¼Œå„ç§å„æ ·ä»¤äººéš¾ä»¥æƒ³è±¡çš„é”™è¯¯ã€‚ä¸ºäº†èŽ·å¾—æœ€å¤§çš„é€Ÿåº¦ï¼Œæˆ‘ä»¬æ²¡æœ‰é‡‡ç”¨YACCäº§ç”Ÿä¸Šä¸‹æ–‡æ— å…³æ–‡æ³•CFGåˆ†æžå™¨ï¼Œè€Œæ˜¯é‡‡ç”¨çµæ´»çš„æ–¹å¼äº§ç”Ÿè¯æ±‡åˆ†æžå™¨ï¼Œå®ƒè‡ªå·±é…æœ‰å †æ ˆã€‚åˆ†æžå™¨çš„æ”¹è¿›å¤§å¤§æé«˜äº†è¿è¡Œé€Ÿåº¦ï¼Œå®ƒçš„ç²¾åŠ›å¦‚æ¤å……æ²›å®Œæˆäº†å¤§é‡å·¥ä½œã€‚æŠŠæ–‡æ¡£è£…å…¥barrelå»ºç«‹ç´¢å¼•â€”åˆ†æžå®Œä¸€ç¯‡æ–‡æ¡£ï¼Œä¹‹åŽæŠŠè¯¥æ–‡æ¡£è£…å…¥barrelä¸ï¼Œç”¨å†…å˜ä¸çš„hashè¡¨â€”å—å…¸ï¼Œæ¯ä¸ªè¯æ±‡è¢«è½¬æ¢æˆä¸€ä¸ªwordIDã€‚å½“hashè¡¨å—å…¸ä¸åŠ å…¥æ–°çš„é¡¹æ—¶ï¼Œç¬¨æ‹™åœ°å˜å…¥æ–‡ä»¶ã€‚ä¸€æ—¦è¯æ±‡è¢«è½¬æ¢æˆwordIDï¼Œå®ƒä»¬åœ¨å½“å‰æ–‡æ¡£çš„å‡ºçŽ°å°±è½¬æ¢æˆhitlistï¼Œè¢«å†™è¿›æ£å‘barrelã€‚ç´¢å¼•é˜¶æ®µå¹¶è¡Œçš„ä¸»è¦å›°éš¾æ˜¯å—å…¸éœ€è¦å…±äº«ã€‚
    æˆ‘ä»¬é‡‡ç”¨çš„æ–¹æ³•æ˜¯ï¼ŒåŸºæœ¬å—å…¸ä¸æœ‰140ä¸‡ä¸ªå›ºå®šè¯æ±‡ï¼Œä¸åœ¨åŸºæœ¬å—å…¸ä¸çš„è¯æ±‡å†™å…¥æ—¥å¿—ï¼Œè€Œä¸æ˜¯å…±äº«å—å…¸ã€‚è¿™ç§æ–¹æ³•å¤šä¸ªç´¢å¼•å™¨å¯ä»¥å¹¶è¡Œå·¥ä½œï¼Œæœ€åŽä¸€ä¸ªç´¢å¼•å™¨åªéœ€å¤„ç†ä¸€ä¸ªè¾ƒå°çš„é¢å¤–è¯æ±‡æ—¥å¿—ã€‚æŽ’åºâ€”ä¸ºäº†å»ºç«‹åå‘ç´¢å¼•ï¼ŒæŽ’åºå™¨è¯»å–æ¯ä¸ªæ£å‘barrelï¼Œä»¥wordIDæŽ’åºï¼Œå»ºç«‹åªæœ‰æ ‡é¢˜anchor hi tçš„åå‘ç´¢å¼•barrelå’Œå…¨æ–‡åå‘ç´¢å¼•barrelã€‚è¿™ä¸ªè¿‡ç¨‹ä¸€æ¬¡åªå¤„ç†ä¸€ä¸ªbarrelï¼Œæ‰€ä»¥åªéœ€è¦å°‘é‡æš‚å˜ç©ºé—´ã€‚æŽ’åºé˜¶æ®µä¹Ÿæ˜¯å¹¶è¡Œçš„ï¼Œæˆ‘ä»¬ç®€å•åœ°åŒæ—¶è¿è¡Œå°½å¯èƒ½å¤šçš„æŽ’åºå™¨ï¼Œä¸åŒçš„æŽ’åºå™¨å¤„ç†ä¸åŒçš„æ¡¶ã€‚ç”±äºŽbarrelä¸é€‚åˆè£…å…¥ä¸»å˜ï¼ŒæŽ’åºå™¨è¿›ä¸€æ¥ä¾æ®wordIDå’ŒdocIDæŠŠå®ƒåˆ†æˆè‹¥å¹²ç¯®åï¼Œä»¥ä¾¿é€‚åˆè£…å…¥ä¸»å˜ã€‚ç„¶åŽæŽ’åºå™¨æŠŠæ¯ä¸ªç¯®åè£…å…¥ä¸»å˜è¿›è¡ŒæŽ’åºï¼Œå¹¶æŠŠå®ƒçš„å†…å®¹å†™å›žåˆ°çŸåå‘barrelå’Œå…¨æ–‡åå‘barrelã€‚

4.5æœç´¢
    æœç´¢çš„ç›®æ ‡æ˜¯æä¾›æœ‰æ•ˆçš„é«˜è´¨é‡çš„æœç´¢ç»“æžœã€‚å¤šæ•°å¤§åž‹å•†ä¸šæœç´¢å¼•æ“Žå¥½åƒåœ¨æ•ˆçŽ‡æ–¹é¢èŠ±è´¹äº†å¾ˆå¤§åŠ›æ°”ã€‚å› æ¤æˆ‘ä»¬çš„ç ”ç©¶ä»¥æœç´¢è´¨é‡ä¸ºé‡ç‚¹ï¼Œç›¸ä¿¡æˆ‘ä»¬çš„è§£å†³æ–¹æ¡ˆä¹Ÿå¯ä»¥ç”¨åˆ°é‚£äº›å•†ä¸šç³»ç»Ÿä¸ã€‚
GoogleæŸ¥è¯¢è¯„ä»·è¿‡ç¨‹
1. åˆ†æžæŸ¥è¯¢ã€‚
2. æŠŠè¯æ±‡è½¬æ¢æˆwordIDã€‚
3. åœ¨çŸbarrelä¸æŸ¥æ‰¾æ¯ä¸ªè¯æ±‡doclistçš„å¼€å¤´ã€‚
4. æ‰«ædoclistç›´åˆ°æ‰¾åˆ°ä¸€ç¯‡åŒ¹é…æ‰€æœ‰å…³é”®è¯çš„æ–‡æ¡£
5. è®¡ç®—è¯¥æ–‡æ¡£çš„rank
6. å¦‚æžœæˆ‘ä»¬åœ¨çŸbarrelï¼Œå¹¶ä¸”åœ¨æ‰€æœ‰doclistçš„æœ«å°¾ï¼Œå¼€å§‹ä»Žå…¨æ–‡barrelçš„doclistçš„å¼€å¤´æŸ¥æ‰¾æ¯ä¸ªè¯ï¼Œgoto ç¬¬å››æ¥
7. å¦‚æžœä¸åœ¨ä»»ä½•doclistçš„ç»“å°¾ï¼Œè¿”å›žç¬¬å››æ¥ã€‚
8. æ ¹æ®rankæŽ’åºåŒ¹é…æ–‡æ¡£ï¼Œè¿”å›žå‰kä¸ªã€‚å›¾4 GoogleæŸ¥è¯¢è¯„ä»·åœ¨æœ‰é™çš„å“åº”æ—¶é—´å†…ï¼Œä¸€æ—¦æ‰¾åˆ°ä¸€å®šæ•°é‡çš„åŒ¹é…æ–‡æ¡£ï¼Œæœç´¢å¼•æ“Žè‡ªåŠ¨æ‰§è¡Œæ¥éª¤8ã€‚è¿™æ„å‘³ç€ï¼Œè¿”å›žçš„ç»“æžœæ˜¯åä¼˜åŒ–çš„ã€‚æˆ‘ä»¬çŽ°åœ¨ç ”ç©¶å…¶å®ƒæ–¹æ³•æ¥è§£å†³è¿™ä¸ªé—®é¢˜ã€‚è¿‡åŽ»æ ¹æ®PageRankæŽ’åºhitï¼Œçœ‹æ¥èƒ½å¤Ÿæ”¹è¿›è¿™ç§çŠ¶å†µã€‚

4.5.1 Rankingç³»ç»Ÿ Googleæ¯”å…¸åž‹æœç´¢å¼•æ“Žä¿å˜äº†æ›´å¤šçš„webä¿¡æ¯ã€‚æ¯ä¸ªhitlishåŒ…æ‹¬ä½ç½®ï¼Œå—å·ï¼Œå¤§å°å†™ã€‚å¦å¤–ï¼Œæˆ‘ä»¬è¿˜è€ƒè™‘äº†é“¾æŽ¥æè¿°æ–‡å—ã€‚Rankç»¼åˆæ‰€æœ‰è¿™äº›ä¿¡æ¯æ˜¯å›°éš¾çš„ã€‚rankingå‡½æ•°è®¾è®¡ä¾æ®æ˜¯æ²¡æœ‰æŸä¸ªå› ç´ å¯¹rankå½±å“é‡å¤§ã€‚é¦–å…ˆï¼Œè€ƒè™‘æœ€ç®€å•çš„æƒ…å†µâ€”å•ä¸ªè¯æŸ¥è¯¢ã€‚ä¸ºäº†å•ä¸ªè¯æŸ¥è¯¢ä¸ä¸€ä¸ªæ–‡æ¡£çš„rankï¼ŒGooleåœ¨æ–‡æ¡£çš„hitlistä¸æŸ¥æ‰¾è¯¥è¯ã€‚Googleè®¤ä¸ºæ¯ä¸ªhitæ˜¯å‡ ç§ä¸åŒç±»åž‹ï¼ˆæ ‡é¢˜ï¼Œé“¾æŽ¥æè¿°æ–‡å—anchorï¼ŒURLï¼Œæ™®é€šå¤§å—å·æ–‡æœ¬ï¼Œæ™®é€šå°å—å·æ–‡æœ¬ï¼Œâ€¦â€¦ï¼‰ä¹‹ä¸€ï¼Œæ¯ç§æœ‰å®ƒè‡ªå·±çš„ç±»åž‹æƒé‡ã€‚ç±»åž‹æƒé‡å»ºç«‹äº†ä¸€ä¸ªç±»åž‹ç´¢å¼•å‘é‡ã€‚Googleè®¡ç®—hitlistä¸æ¯ç§hitçš„æ•°é‡ã€‚ç„¶åŽæ¯ä¸ªhitæ•°è½¬æ¢æˆcount-weightã€‚Count-weightå¼€å§‹éšhitæ•°çº¿æ€§å¢žåŠ ï¼Œå¾ˆå¿«é€æ¸åœæ¢ï¼Œä»¥è‡³äºŽhitæ•°ä¸Žæ¤ä¸ç›¸å…³ã€‚æˆ‘ä»¬è®¡ç®—count-weightå‘é‡å’Œtype-weightå‘é‡çš„æ ‡é‡ç§¯ä½œä¸ºæ–‡æ¡£çš„IRå€¼ã€‚æœ€åŽIRå€¼ç»“åˆPageRankä½œä¸ºæ–‡æ¡£çš„æœ€åŽrank å¯¹äºŽå¤šè¯æŸ¥è¯¢ï¼Œæ›´å¤æ‚äº›ã€‚çŽ°åœ¨ï¼Œå¤šè¯hitlistå¿…é¡»åŒæ—¶æ‰«æï¼Œä»¥ä¾¿å…³é”®è¯å‡ºçŽ°åœ¨åŒä¸€æ–‡æ¡£ä¸çš„æƒé‡æ¯”åˆ†åˆ«å‡ºçŽ°æ—¶é«˜ã€‚ç›¸é‚»è¯çš„hitä¸€èµ·åŒ¹é…ã€‚å¯¹æ¯ä¸ªåŒ¹é…hit çš„é›†åˆè®¡ç®—ç›¸é‚»åº¦ã€‚ç›¸é‚»åº¦åŸºäºŽhitåœ¨æ–‡æ¡£ä¸çš„è·ç¦»ï¼Œåˆ†æˆ10ä¸ªä¸åŒçš„binå€¼ï¼ŒèŒƒå›´ä»ŽçŸè¯åŒ¹é…åˆ°æ ¹æœ¬ä¸ç›¸å…³ã€‚ä¸ä»…è®¡ç®—æ¯ç±»hitæ•°ï¼Œè€Œä¸”è¦è®¡ç®—æ¯ç§ç±»åž‹çš„ç›¸é‚»åº¦ï¼Œæ¯ä¸ªç±»åž‹ç›¸ä¼¼åº¦å¯¹ï¼Œæœ‰ä¸€ä¸ªç±»åž‹ç›¸é‚»åº¦æƒtype-prox-weightã€‚Countè½¬æ¢æˆcount-weightï¼Œè®¡ç®—count-weight type-proc-weightçš„æ ‡é‡ç§¯ä½œä¸ºIRå€¼ã€‚åº”ç”¨æŸç§debug modeæ‰€æœ‰è¿™äº›æ•°å’ŒçŸ©é˜µä¸ŽæŸ¥è¯¢ç»“æžœä¸€èµ·æ˜¾ç¤ºå‡ºæ¥ã€‚è¿™äº›æ˜¾ç¤ºæœ‰åŠ©äºŽæ”¹è¿›rankç³»ç»Ÿã€‚

4.5.2åé¦ˆ rankå‡½æ•°æœ‰å¾ˆå¤šå‚æ•°è±¡type-weightå’Œtype-prox-weightã€‚æŒ‡æ˜Žè¿™äº›å‚æ•°çš„æ£ç¡®å€¼æœ‰ç‚¹é»‘è‰²è‰ºæœ¯black artã€‚ä¸ºæ¤ï¼Œæˆ‘ä»¬çš„æœç´¢å¼•æ“Žæœ‰ä¸€ä¸ªç”¨æˆ·åé¦ˆæœºåˆ¶ã€‚å€¼å¾—ä¿¡ä»»çš„ç”¨æˆ·å¯ä»¥éšæ„åœ°è¯„ä»·è¿”å›žçš„ç»“æžœã€‚ä¿å˜åé¦ˆã€‚ç„¶åŽï¼Œå½“ä¿®æ”¹rankå‡½æ•°æ—¶ï¼Œå¯¹æ¯”ä»¥å‰æœç´¢çš„rankï¼Œæˆ‘ä»¬å¯ä»¥çœ‹åˆ°ä¿®æ”¹å¸¦æ¥çš„çš„å½±å“ã€‚è™½ç„¶ä¸æ˜¯åå…¨åç¾Žï¼Œä½†æ˜¯å®ƒç»™å‡ºäº†ä¸€äº›æ€è·¯ï¼Œå½“rankå‡½æ•°æ”¹å˜æ—¶å¯¹æœç´¢ç»“æžœçš„å½±å“ã€‚

5.æ‰§è¡Œå’Œç»“æžœ
    æœç´¢ç»“æžœçš„è´¨é‡æ˜¯æœç´¢å¼•æ“Žæœ€é‡è¦çš„åº¦é‡æ ‡å‡†ã€‚å®Œå…¨ç”¨æˆ·è¯„ä»·ä½“ç³»è¶…å‡ºäº†æœ¬æ–‡çš„è®ºè¿°èŒƒå›´ï¼Œå¯¹äºŽå¤§å¤šæ•°æœç´¢ï¼Œæˆ‘ä»¬çš„ç»éªŒè¯´æ˜ŽGoogleçš„æœç´¢ç»“æžœæ¯”é‚£äº›ä¸»è¦çš„å•†ä¸šæœç´¢å¼•æ“Žå¥½ã€‚ä½œä¸ºä¸€ä¸ªåº”ç”¨PageRankï¼Œé“¾æŽ¥æè¿°æ–‡å—ï¼Œç›¸é‚»åº¦çš„ä¾‹åï¼Œå›¾4ç»™å‡ºäº†Googleæœç´¢bill Clintonçš„ç»“æžœã€‚å®ƒè¯´æ˜Žäº†Googleçš„ä¸€äº›ç‰¹ç‚¹ã€‚æœåŠ¡å™¨å¯¹ç»“æžœè¿›è¡Œèšç±»ã€‚è¿™å¯¹è¿‡æ»¤ç»“æžœé›†åˆç›¸å½“æœ‰å¸®åŠ©ã€‚è¿™ä¸ªæŸ¥è¯¢ï¼Œç›¸å½“ä¸€éƒ¨åˆ†ç»“æžœæ¥è‡ªwhitehouse.govåŸŸï¼Œè¿™æ£æ˜¯æˆ‘ä»¬æ‰€éœ€è¦çš„ã€‚çŽ°åœ¨å¤§å¤šæ•°å•†ä¸šæœç´¢å¼•æ“Žä¸ä¼šè¿”å›žä»»ä½•æ¥è‡ªwhitehouse.govçš„ç»“æžœï¼Œè¿™æ˜¯ç›¸å½“ä¸å¯¹çš„ã€‚æ³¨æ„ç¬¬ä¸€ä¸ªæœç´¢ç»“æžœæ²¡æœ‰æ ‡é¢˜ã€‚å› ä¸ºå®ƒä¸æ˜¯è¢«æŠ“åˆ°çš„ã€‚Googleæ˜¯æ ¹æ®é“¾æŽ¥æè¿°æ–‡å—å†³å®šå®ƒæ˜¯ä¸€ä¸ªå¥½çš„æŸ¥è¯¢ç»“æžœã€‚åŒæ ·åœ°ï¼Œç¬¬äº”ä¸ªç»“æžœæ˜¯ä¸€ä¸ªEmailåœ°å€ï¼Œå½“ç„¶æ˜¯ä¸å¯èƒ½æŠ“åˆ°çš„ã€‚ä¹Ÿæ˜¯é“¾æŽ¥æè¿°æ–‡å—çš„ç»“æžœã€‚æ‰€æœ‰è¿™äº›ç»“æžœè´¨é‡éƒ½å¾ˆé«˜ï¼Œæœ€åŽæ£€æŸ¥æ²¡æœ‰æ»é“¾æŽ¥ã€‚å› ä¸ºå®ƒä»¬ä¸çš„å¤§éƒ¨åˆ†PageRankå€¼è¾ƒé«˜ã€‚PageRankç™¾åˆ†æ¯”ç”¨çº¢è‰²çº¿æ¡è¡¨ç¤ºã€‚æ²¡æœ‰ç»“æžœåªå«Billæ²¡æœ‰Clintonæˆ–åªå«Clintonæ²¡æœ‰Billã€‚å› ä¸ºè¯å‡ºçŽ°çš„ç›¸è¿‘æ€§éžå¸¸é‡è¦ã€‚å½“ç„¶æœç´¢å¼•æ“Žè´¨é‡çš„çœŸå®žæµ‹è¯•åŒ…å«å¹¿æ³›çš„ç”¨æˆ·å¦ä¹ æˆ–ç»“æžœåˆ†æžï¼Œæ¤å¤„ç¯‡å¹…æœ‰é™ï¼Œè¯·è¯»è€…è‡ªå·±åŽ»ä½“éªŒGoogleï¼Œhttp://google.stanford.edu/ã€‚

5.1å˜å‚¨éœ€æ±‚
é™¤äº†æœç´¢è´¨é‡ï¼ŒGoogleçš„è®¾è®¡å¯ä»¥éšç€Webè§„æ¨¡çš„å¢žå¤§è€Œæœ‰æ•ˆåœ°å¢žå¤§æˆæœ¬ã€‚ä¸€æ–¹é¢æœ‰æ•ˆåœ°åˆ©ç”¨å˜å‚¨ç©ºé—´ã€‚è¡¨1åˆ—å‡ºäº†ä¸€äº›ç»Ÿè®¡æ•°å—çš„æ˜Žç»†è¡¨å’ŒGoogleå˜å‚¨çš„éœ€æ±‚ã€‚ç”±äºŽåŽ‹ç¼©æŠ€æœ¯çš„åº”ç”¨çŸ¥è¯†åº“åªéœ€53GBçš„å˜å‚¨ç©ºé—´ã€‚æ˜¯æ‰€æœ‰è¦å˜å‚¨æ•°æ®çš„ä¸‰åˆ†ä¹‹ä¸€ã€‚æŒ‰å½“ä»Šç£ç›˜ä»·æ ¼ï¼ŒçŸ¥è¯†åº“ç›¸å¯¹äºŽæœ‰ç”¨çš„æ•°æ®æ¥è¯´æ¯”è¾ƒä¾¿å®œã€‚æœç´¢å¼•æ“Žéœ€è¦çš„æ‰€æœ‰æ•°æ®çš„å˜å‚¨ç©ºé—´å¤§çº¦55GBã€‚å¤§å¤šæ•°æŸ¥è¯¢è¯·æ±‚åªéœ€è¦çŸåå‘ç´¢å¼•ã€‚æ–‡ä»¶ç´¢å¼•åº”ç”¨å…ˆè¿›çš„ç¼–ç å’ŒåŽ‹ç¼©æŠ€æœ¯ï¼Œä¸€ä¸ªé«˜è´¨é‡çš„æœç´¢å¼•æ“Žå¯ä»¥è¿è¡Œåœ¨7GBçš„æ–°PCã€‚

5.2ç³»ç»Ÿæ‰§è¡Œ
æœç´¢å¼•æ“ŽæŠ“ç½‘é¡µå’Œå»ºç«‹ç´¢å¼•çš„æ•ˆçŽ‡éžå¸¸é‡è¦ã€‚Googleçš„ä¸»è¦æ“ä½œæ˜¯æŠ“ç½‘é¡µï¼Œç´¢å¼•ï¼ŒæŽ’åºã€‚å¾ˆéš¾æµ‹è¯•æŠ“å…¨éƒ¨ç½‘é¡µéœ€è¦å¤šå°‘æ—¶é—´ï¼Œå› ä¸ºç£ç›˜æ»¡äº†ï¼ŒåŸŸåæœåŠ¡å™¨å´©æºƒï¼Œæˆ–è€…å…¶å®ƒé—®é¢˜å¯¼è‡´ç³»ç»Ÿåœæ¢ã€‚æ€»çš„æ¥è¯´ï¼Œå¤§çº¦éœ€è¦9å¤©æ—¶é—´ä¸‹è½½26000000ç½‘é¡µï¼ˆåŒ…æ‹¬é”™è¯¯ï¼‰ã€‚ç„¶è€Œï¼Œä¸€æ—¦ç³»ç»Ÿè¿è¡Œé¡ºåˆ©ï¼Œé€Ÿåº¦éžå¸¸å¿«ï¼Œä¸‹è½½æœ€åŽ11000000ç½‘é¡µåªéœ€è¦63å°æ—¶ï¼Œå¹³å‡æ¯å¤©4000000ç½‘é¡µï¼Œæ¯ç§’48.5ä¸ªç½‘é¡µã€‚ç´¢å¼•å™¨å’Œç½‘ç»œçˆ¬è¡Œæœºå™¨äººåŒæ¥è¿è¡Œã€‚ç´¢å¼•å™¨æ¯”ç½‘ç»œçˆ¬è¡Œæœºå™¨äººå¿«ã€‚å› ä¸ºæˆ‘ä»¬èŠ±è´¹äº†å¤§é‡æ—¶é—´ä¼˜åŒ–ç´¢å¼•å™¨ï¼Œä½¿å®ƒä¸æ˜¯ç“¶é¢ˆã€‚è¿™äº›ä¼˜åŒ–åŒ…æ‹¬æ‰¹é‡æ›´æ–°æ–‡æ¡£ç´¢å¼•ï¼Œæœ¬åœ°ç£ç›˜æ•°æ®ç»“æž„çš„å®‰æŽ’ã€‚ç´¢å¼•å™¨æ¯ç§’å¤„ç†54ä¸ªç½‘é¡µã€‚æŽ’åºå™¨å®Œå…¨å¹¶è¡Œï¼Œç”¨4å°æœºå™¨ï¼ŒæŽ’åºçš„æ•´ä¸ªè¿‡ç¨‹å¤§æ¦‚éœ€è¦24å°æ—¶ã€‚

5.3æœç´¢æ‰§è¡Œæ”¹è¿›
æœç´¢æ‰§è¡Œä¸æ˜¯æˆ‘ä»¬ç ”ç©¶çš„é‡ç‚¹ã€‚å½“å‰ç‰ˆæœ¬çš„Googleå¯ä»¥åœ¨1åˆ°10ç§’é—´å›žç”æŸ¥è¯¢è¯·æ±‚ã€‚æ—¶é—´å¤§éƒ¨åˆ†èŠ±è´¹åœ¨NFSç£ç›˜IOä¸Šï¼ˆç”±äºŽç£ç›˜æ™®éæ¯”æœºå™¨æ…¢ï¼‰ã€‚è¿›ä¸€æ¥è¯´ï¼ŒGoogleæ²¡æœ‰åšä»»ä½•ä¼˜åŒ–ï¼Œä¾‹å¦‚æŸ¥è¯¢ç¼“å†²åŒºï¼Œå¸¸ç”¨è¯æ±‡åç´¢å¼•ï¼Œå’Œå…¶å®ƒå¸¸ç”¨çš„ä¼˜åŒ–æŠ€æœ¯ã€‚æˆ‘ä»¬å€¾å‘äºŽé€šè¿‡åˆ†å¸ƒå¼ï¼Œç¡¬ä»¶ï¼Œè½¯ä»¶ï¼Œå’Œç®—æ³•çš„æ”¹è¿›æ¥æé«˜Googleçš„é€Ÿåº¦ã€‚æˆ‘ä»¬çš„ç›®æ ‡æ˜¯æ¯ç§’èƒ½å¤„ç†å‡ ç™¾ä¸ªè¯·æ±‚ã€‚è¡¨2æœ‰å‡ ä¸ªçŽ°åœ¨ç‰ˆæœ¬Googleå“åº”æŸ¥è¯¢æ—¶é—´çš„ä¾‹åã€‚å®ƒä»¬è¯´æ˜ŽIOç¼“å†²åŒºå¯¹å†æ¬¡æœç´¢é€Ÿåº¦çš„å½±å“ã€‚

6.ç»“è®º
Googleè®¾è®¡æˆå¯ä¼¸ç¼©çš„æœç´¢å¼•æ“Žã€‚ä¸»è¦ç›®æ ‡æ˜¯åœ¨å¿«é€Ÿå‘å±•çš„World Wide Webä¸Šæä¾›é«˜è´¨é‡çš„æœç´¢ç»“æžœã€‚Googleåº”ç”¨äº†ä¸€äº›æŠ€æœ¯æ”¹è¿›æœç´¢è´¨é‡åŒ…æ‹¬PageRankï¼Œé“¾æŽ¥æè¿°æ–‡å—ï¼Œç›¸é‚»ä¿¡æ¯ã€‚è¿›ä¸€æ¥è¯´ï¼ŒGoogleæ˜¯ä¸€ä¸ªæ”¶é›†ç½‘é¡µï¼Œå»ºç«‹ç´¢å¼•ï¼Œæ‰§è¡Œæœç´¢è¯·æ±‚çš„å®Œæ•´çš„ä½“ç³»ç»“æž„ã€‚

6.1æœªæ¥çš„å·¥ä½œ
    å¤§åž‹Webæœç´¢å¼•æ“Žæ˜¯ä¸ªå¤æ‚çš„ç³»ç»Ÿï¼Œè¿˜æœ‰å¾ˆå¤šäº‹æƒ…è¦åšã€‚æˆ‘ä»¬ç›´æŽ¥çš„ç›®æ ‡æ˜¯æé«˜æœç´¢æ•ˆçŽ‡ï¼Œè¦†ç›–å¤§çº¦100000000ä¸ªç½‘é¡µã€‚ä¸€äº›ç®€å•çš„æ”¹è¿›æé«˜äº†æ•ˆçŽ‡åŒ…æ‹¬è¯·æ±‚ç¼“å†²åŒºï¼Œå·§å¦™åœ°åˆ†é…ç£ç›˜ç©ºé—´ï¼Œåç´¢å¼•ã€‚å¦ä¸€ä¸ªéœ€è¦ç ”ç©¶çš„é¢†åŸŸæ˜¯æ›´æ–°ã€‚æˆ‘ä»¬å¿…é¡»æœ‰ä¸€ä¸ªå·§å¦™çš„ç®—æ³•æ¥å†³å®šå“ªäº›æ—§ç½‘é¡µéœ€è¦é‡æ–°æŠ“å–ï¼Œå“ªäº›æ–°ç½‘é¡µéœ€è¦è¢«æŠ“å–ã€‚è¿™ä¸ªç›®æ ‡å·²ç»ç”±å®žçŽ°äº†ã€‚å—éœ€æ±‚é©±åŠ¨ï¼Œç”¨ä»£ç†cacheåˆ›å»ºæœç´¢æ•°æ®åº“æ˜¯ä¸€ä¸ªæœ‰å‰é€”çš„ç ”ç©¶é¢†åŸŸã€‚æˆ‘ä»¬è®¡åˆ’åŠ ä¸€äº›ç®€å•çš„å·²ç»è¢«å•†ä¸šæœç´¢å¼•æ“Žæ”¯æŒçš„ç‰¹å¾ï¼Œä¾‹å¦‚å¸ƒå°”ç®—æœ¯ç¬¦å·ï¼Œå¦å®šï¼Œå¡«å……ã€‚ç„¶è€Œå¦å¤–ä¸€äº›åº”ç”¨åˆšåˆšå¼€å§‹æŽ¢ç´¢ï¼Œä¾‹å¦‚ç›¸å…³åé¦ˆï¼Œèšç±»ï¼ˆGoogleçŽ°åœ¨æ”¯æŒç®€å•çš„åŸºäºŽä¸»æœºåçš„èšç±»ï¼‰ã€‚æˆ‘ä»¬è¿˜è®¡åˆ’æ”¯æŒç”¨æˆ·ä¸Šä¸‹æ–‡ï¼ˆè±¡ç”¨æˆ·åœ°å€ï¼‰ï¼Œç»“æžœæ‘˜è¦ã€‚æˆ‘ä»¬æ£åœ¨æ‰©å¤§é“¾æŽ¥ç»“æž„å’Œé“¾æŽ¥æ–‡æœ¬çš„åº”ç”¨ã€‚ç®€å•çš„å®žéªŒè¯æ˜Žï¼Œé€šè¿‡å¢žåŠ ç”¨æˆ·ä¸»é¡µçš„æƒé‡æˆ–ä¹¦ç¾ï¼ŒPageRankå¯ä»¥ä¸ªæ€§åŒ–ã€‚å¯¹äºŽé“¾æŽ¥æ–‡æœ¬ï¼Œæˆ‘ä»¬æ£åœ¨è¯•éªŒç”¨é“¾æŽ¥å‘¨å›´çš„æ–‡æœ¬åŠ å…¥åˆ°é“¾æŽ¥æ–‡æœ¬ã€‚Webæœç´¢å¼•æ“Žæä¾›äº†ä¸°å¯Œçš„ç ”ç©¶è¯¾é¢˜ã€‚å¦‚æ¤ä¹‹å¤šä»¥è‡³äºŽæˆ‘ä»¬ä¸èƒ½åœ¨æ¤ä¸€ä¸€åˆ—ä¸¾ï¼Œå› æ¤åœ¨ä¸ä¹…çš„å°†æ¥ï¼Œæˆ‘ä»¬å¸Œæœ›æ‰€åšçš„å·¥ä½œä¸æ¢æœ¬èŠ‚æåˆ°çš„ã€‚

6.2é«˜è´¨é‡æœç´¢
    å½“ä»ŠWebæœç´¢å¼•æ“Žç”¨æˆ·æ‰€é¢ä¸´çš„æœ€å¤§é—®é¢˜æ˜¯æœç´¢ç»“æžœçš„è´¨é‡ã€‚ç»“æžœå¸¸å¸¸æ˜¯å¥½ç¬‘çš„ï¼Œå¹¶ä¸”è¶…å‡ºç”¨æˆ·çš„çœ¼ç•Œï¼Œä»–ä»¬å¸¸å¸¸ç°å¿ƒä¸§æ°”æµªè´¹äº†å®è´µçš„æ—¶é—´ã€‚ä¾‹å¦‚ï¼Œä¸€ä¸ªæœ€æµè¡Œçš„å•†ä¸šæœç´¢å¼•æ“Žæœç´¢â€œBill Clilltonâ€çš„ç»“æžœæ˜¯the Bill Clinton Joke of the Day: April 14, 1997ã€‚Googleçš„ è®¾è®¡ç›®æ ‡æ˜¯éšç€Webçš„å¿«é€Ÿå‘å±•æä¾›é«˜è´¨é‡çš„æœç´¢ç»“æžœï¼Œå®¹æ˜“æ‰¾åˆ°ä¿¡æ¯ã€‚ä¸ºæ¤ï¼ŒGoogleå¤§é‡åº”ç”¨è¶…æ–‡æœ¬ä¿¡æ¯åŒ…æ‹¬é“¾æŽ¥ç»“æž„å’Œé“¾æŽ¥æ–‡æœ¬ã€‚Googleè¿˜ç”¨åˆ°äº†ç›¸é‚»æ€§å’Œå—å·ä¿¡æ¯ã€‚è¯„ä»·æœç´¢å¼•æ“Žæ˜¯å›°éš¾çš„ï¼Œæˆ‘ä»¬ä¸»è§‚åœ°å‘çŽ°Googleçš„æœç´¢è´¨é‡æ¯”å½“ä»Šå•†ä¸šæœç´¢å¼•æ“Žé«˜ã€‚é€šè¿‡PageRankåˆ†æžé“¾æŽ¥ç»“æž„ä½¿Googleèƒ½å¤Ÿè¯„ä»·ç½‘é¡µçš„è´¨é‡ã€‚ç”¨é“¾æŽ¥æ–‡æœ¬æè¿°é“¾æŽ¥æ‰€æŒ‡å‘çš„ç½‘é¡µæœ‰åŠ©äºŽæœç´¢å¼•æ“Žè¿”å›žç›¸å…³çš„ç»“æžœï¼ˆæŸç§ç¨‹åº¦ä¸Šæé«˜äº†è´¨é‡ï¼‰ã€‚æœ€åŽï¼Œåˆ©ç”¨ç›¸é‚»æ€§ä¿¡æ¯å¤§å¤§æé«˜äº†å¾ˆå¤šæœç´¢çš„ç›¸å…³æ€§ã€‚

6.3å¯å‡çº§çš„ä½“ç³»ç»“æž„
    é™¤äº†æœç´¢è´¨é‡ï¼ŒGoogleè®¾è®¡æˆå¯å‡çº§çš„ã€‚ç©ºé—´å’Œæ—¶é—´å¿…é¡»é«˜æ•ˆï¼Œå¤„ç†æ•´ä¸ªWebæ—¶å›ºå®šçš„å‡ ä¸ªå› ç´ éžå¸¸é‡è¦ã€‚å®žçŽ°Googleç³»ç»Ÿï¼ŒCPUã€è®¿å˜ã€å†…å˜å®¹é‡ã€ç£ç›˜å¯»é“æ—¶é—´ã€ç£ç›˜åžåé‡ã€ç£ç›˜å®¹é‡ã€ç½‘ç»œIOéƒ½æ˜¯ç“¶é¢ˆã€‚åœ¨ä¸€äº›æ“ä½œä¸ï¼Œå·²ç»æ”¹è¿›çš„Googleå…‹æœäº†ä¸€äº›ç“¶é¢ˆã€‚Googleçš„ä¸»è¦æ•°æ®ç»“æž„èƒ½å¤Ÿæœ‰æ•ˆåˆ©ç”¨å˜å‚¨ç©ºé—´ã€‚è¿›ä¸€æ¥ï¼Œç½‘é¡µçˆ¬è¡Œï¼Œç´¢å¼•ï¼ŒæŽ’åºå·²ç»è¶³å¤Ÿå»ºç«‹å¤§éƒ¨åˆ†webç´¢å¼•ï¼Œå…±24000000ä¸ªç½‘é¡µï¼Œç”¨æ—¶ä¸åˆ°ä¸€æ˜ŸæœŸã€‚æˆ‘ä»¬å¸Œæœ›èƒ½åœ¨ä¸€ä¸ªæœˆå†…å»ºç«‹100000000ç½‘é¡µçš„ç´¢å¼•ã€‚

6.4ç ”ç©¶å·¥å…·
    Googleä¸ä»…æ˜¯é«˜è´¨é‡çš„æœç´¢å¼•æ“Žï¼Œå®ƒè¿˜æ˜¯ç ”ç©¶å·¥å…·ã€‚Googleæœé›†çš„æ•°æ®å·²ç»ç”¨åœ¨è®¸å¤šå…¶å®ƒè®ºæ–‡ä¸ï¼Œæäº¤ç»™å¦æœ¯ä¼šè®®å’Œè®¸å¤šå…¶å®ƒæ–¹å¼ã€‚æœ€è¿‘çš„ç ”ç©¶ï¼Œä¾‹å¦‚ï¼Œæå‡ºäº†WebæŸ¥è¯¢çš„å±€é™æ€§ï¼Œä¸éœ€è¦ç½‘ç»œå°±å¯ä»¥å›žç”ã€‚è¿™è¯´æ˜ŽGoogleä¸ä»…æ˜¯é‡è¦çš„ç ”ç©¶å·¥å…·ï¼Œè€Œä¸”å¿…ä¸å¯å°‘ï¼Œåº”ç”¨å¹¿æ³›ã€‚æˆ‘ä»¬å¸Œæœ›Googleæ˜¯å…¨ä¸–ç•Œç ”ç©¶è€…çš„èµ„æºï¼Œå¸¦åŠ¨æœç´¢å¼•æ“ŽæŠ€æœ¯çš„æ›´æ–°æ¢ä»£ã€‚ 7è‡´è°¢ Scott Hassan and Alan Sterembergè¯„ä»·äº†Googleçš„æ”¹è¿›ã€‚ä»–ä»¬çš„æ‰æ™ºæ— å¯æ›¿ä»£ï¼Œä½œè€…ç”±è¡·åœ°æ„Ÿè°¢ä»–ä»¬ã€‚æ„Ÿè°¢Hector Garcia-Molina, Rajeev Motwani, Jeff Ullman, and Terry Winogradå’Œå…¨éƒ¨WebBaseå¼€å‘ç»„çš„æ”¯æŒå’Œå¯Œæœ‰æ·±åˆ»è§è§£çš„è®¨è®ºã€‚æœ€åŽæ„Ÿè°¢IBMï¼ŒIntelï¼ŒSunå’ŒæŠ•èµ„è€…çš„æ…·æ…¨æ”¯æŒï¼Œä¸ºæˆ‘ä»¬æä¾›è®¾å¤‡ã€‚è¿™é‡Œæ‰€æè¿°çš„ç ”ç©¶æ˜¯Stanfordç»¼åˆæ•°å—å›¾ä¹¦é¦†è®¡åˆ’çš„ä¸€éƒ¨åˆ†ï¼Œç”±å›½å®¶ç§‘å¦è‡ªç„¶åŸºé‡‘æ”¯æŒï¼Œåˆä½œåè®®å·IRI-9411306ã€‚DARPA ï¼ŒNASAï¼ŒIntervaç ”ç©¶ï¼ŒStanfordæ•°å—å›¾ä¹¦é¦†è®¡åˆ’çš„å·¥ä¸šåˆä½œä¼™ä¼´ä¹Ÿä¸ºè¿™é¡¹åˆä½œåè®®æä¾›äº†èµ„é‡‘ï¼Œå‚è€ƒæ–‡çŒ®ã€‚
    Googleçš„è®¾è®¡ç›®æ ‡æ˜¯å¯å‡çº§åˆ°10äº¿ç½‘é¡µã€‚æˆ‘ä»¬çš„ç£ç›˜å’Œæœºå™¨å¤§æ¦‚èƒ½å¤„ç†è¿™ä¹ˆå¤šç½‘é¡µã€‚ç³»ç»Ÿå„ä¸ªéƒ¨åˆ†è€—è´¹çš„æ€»æ—¶é—´æ˜¯å¹¶è¡Œçš„å’Œçº¿æ€§çš„ã€‚åŒ…æ‹¬ç½‘é¡µçˆ¬è¡Œæœºå™¨äººï¼Œç´¢å¼•å™¨å’ŒæŽ’åºå™¨ã€‚æ‰©å±•åŽæˆ‘ä»¬è®¤ä¸ºå¤§å¤šæ•°æ•°æ®ç»“æž„è¿è¡Œè‰¯å¥½ã€‚ç„¶è€Œ10äº¿ç½‘é¡µæŽ¥è¿‘æ‰€æœ‰å¸¸ç”¨æ“ä½œç³»ç»Ÿçš„æžé™ï¼ˆæˆ‘ä»¬ç›®å‰è¿è¡Œåœ¨Solariså’ŒLinuxä¸Šï¼‰ã€‚åŒ…æ‹¬ä¸»å˜åœ°å€ï¼Œå¼€æ”¾æ–‡ä»¶æè¿°ç¬¦çš„æ•°é‡ï¼Œç½‘ç»œsocketå’Œå¸¦å®½ï¼Œä»¥åŠå…¶å®ƒå› ç´ ã€‚æˆ‘ä»¬è®¤ä¸ºå½“ç½‘é¡µæ•°é‡å¤§å¤§è¶…è¿‡10äº¿ç½‘é¡µæ—¶ï¼Œä¼šå¤§å¤§å¢žåŠ ç³»ç»Ÿå¤æ‚æ€§ã€‚ 9.2é›†ä¸å¼ç´¢å¼•ä½“ç³»çš„å¯å‡çº§æ€§éšç€è®¡ç®—æœºæ€§èƒ½çš„æé«˜ï¼Œæµ·é‡æ–‡æœ¬ç´¢å¼•çš„æˆæœ¬æ¯”è¾ƒå…¬å¹³ã€‚å½“ç„¶å¸¦å®½éœ€æ±‚é«˜çš„å…¶å®ƒåº”ç”¨å¦‚è§†é¢‘ï¼Œè¶Šæ¥è¶Šæ™®éã€‚ä½†æ˜¯ï¼Œä¸Žå¤šåª’ä½“ä¾‹å¦‚è§†é¢‘ç›¸æ¯”ï¼Œæ–‡æœ¬äº§å“çš„æˆæœ¬ä½Žï¼Œå› æ¤æ–‡æœ¬ä»ç„¶æ™®éã€‚

å›¾2  Googleç³»ç»Ÿçš„å·¥ä½œæµç¨‹å›¾
(æ³¨ï¼šåŽŸå›¾æ¥è‡ªSergey Brin and Lawrence Page, The Anatomy of a Large-Scale Hypertextual. Web Search Engine, 1998.http://www-db.stanford.edu/%7Ebackrub/Google.html)

â‘ Googleä½¿ç”¨é«˜é€Ÿçš„åˆ†å¸ƒå¼çˆ¬è¡Œå™¨(Crawler)ç³»ç»Ÿä¸çš„æ¼«æ¸¸éåŽ†å™¨(Googlebot)å®šæ—¶åœ°éåŽ†ç½‘é¡µï¼Œå°†éåŽ†åˆ°çš„ç½‘é¡µé€åˆ°å˜å‚¨æœåŠ¡å™¨(Store Server)ä¸ã€‚
â‘¡å˜å‚¨æœåŠ¡å™¨ä½¿ç”¨zlibæ ¼å¼åŽ‹ç¼©è½¯ä»¶å°†è¿™äº›ç½‘é¡µè¿›è¡Œæ— æŸåŽ‹ç¼©å¤„ç†åŽå˜å…¥æ•°æ®åº“Repositoryä¸ã€‚RepositoryèŽ·å¾—äº†æ¯ä¸ªç½‘é¡µçš„å®Œå…¨Htmlä»£ç åŽï¼Œå¯¹å…¶åŽ‹ç¼©åŽçš„ç½‘é¡µåŠURLè¿›è¡Œåˆ†æžï¼Œè®°å½•ä¸‹ç½‘é¡µé•¿åº¦ã€URLã€URLé•¿åº¦å’Œç½‘é¡µå†…å®¹ï¼Œå¹¶èµ‹äºˆæ¯ä¸ªç½‘é¡µä¸€ä¸ªæ–‡æ¡£å·(docID)ï¼Œä»¥ä¾¿å½“ç³»ç»Ÿå‡ºçŽ°æ•…éšœçš„æ—¶å€™ï¼Œå¯ä»¥åŠæ—¶å®Œæ•´åœ°è¿›è¡Œç½‘é¡µçš„æ•°æ®æ¢å¤ã€‚
â‘¢ç´¢å¼•å™¨(Indexer)ä»ŽRepositoryä¸è¯»å–æ•°æ®ï¼Œä»¥åŽåšä»¥ä¸‹å››æ¥å·¥ä½œï¼š
â‘£(a)å°†è¯»å–çš„æ•°æ®è§£åŽ‹ç¼©åŽè¿›è¡Œåˆ†æžï¼Œå®ƒå°†ç½‘é¡µä¸æ¯ä¸ªæœ‰æ„ä¹‰çš„è¯è¿›è¡Œç»Ÿè®¡åŽï¼Œè½¬åŒ–ä¸ºå…³é”®è¯(wordID)çš„è‹¥å¹²ç´¢å¼•é¡¹(Hits)ï¼Œç”Ÿæˆç´¢å¼•é¡¹åˆ—è¡¨ï¼Œè¯¥åˆ—è¡¨åŒ…æ‹¬å…³é”®è¯ã€å…³é”®è¯çš„ä½ç½®ã€å…³é”®è¯çš„å¤§å°å’Œå¤§å°å†™çŠ¶æ€ç‰ã€‚ç´¢å¼•é¡¹åˆ—è¡¨è¢«å˜å…¥åˆ°æ•°æ®æ¡¶(Barrels)ä¸ï¼Œå¹¶ç”Ÿæˆä»¥æ–‡æ¡£å·(docID)éƒ¨åˆ†æŽ’åºçš„é¡ºæŽ’æ¡£ç´¢å¼•ã€‚
ç´¢å¼•é¡¹æ ¹æ®å…¶é‡è¦ç¨‹åº¦åˆ†ä¸ºä¸¤ç§ï¼šå½“ç´¢å¼•é¡¹ä¸çš„å…³é”®è¯å‡ºçŽ°åœ¨URLã€æ ‡é¢˜ã€é”šæ–‡æœ¬(Anchor Text)å’Œæ ‡ç¾ä¸æ—¶ï¼Œè¡¨ç¤ºè¯¥ç´¢å¼•é¡¹æ¯”è¾ƒé‡è¦ï¼Œç§°ä¸ºç‰¹æ®Šç´¢å¼•é¡¹(Fancy Hits)ï¼›å…¶ä½™æƒ…å†µåˆ™ç§°ä¸ºæ™®é€šç´¢å¼•é¡¹(Plain Hits)ã€‚åœ¨ç³»ç»Ÿä¸æ¯ä¸ªHitç”¨ä¸¤ä¸ªå—èŠ‚(byte)å˜å‚¨ç»“æž„è¡¨ç¤ºï¼šç‰¹æ®Šç´¢å¼•é¡¹ç”¨1ä½(bit)è¡¨ç¤ºå¤§å°å†™ï¼Œç”¨äºŒè¿›åˆ¶ä»£ç 111(å 3ä½)è¡¨ç¤ºæ˜¯ç‰¹æ®Šç´¢å¼•é¡¹ï¼Œå…¶ä½™12ä½æœ‰4ä½è¡¨ç¤ºç‰¹æ®Šç´¢å¼•é¡¹çš„ç±»åž‹(å³hitæ˜¯å‡ºçŽ°åœ¨URLã€æ ‡é¢˜ã€é“¾æŽ¥ç»“ç‚¹è¿˜æ˜¯æ ‡ç¾ä¸)ï¼Œå‰©ä¸‹8ä½è¡¨ç¤ºhitåœ¨ç½‘é¡µä¸çš„å…·ä½“ä½ç½®ï¼›æ™®é€šç´¢å¼•é¡¹æ˜¯ç”¨1ä½è¡¨ç¤ºå¤§å°å†™ï¼Œ3ä½è¡¨ç¤ºå—ä½“å¤§å°ï¼Œå…¶ä½™12ä½è¡¨ç¤ºåœ¨ç½‘é¡µä¸çš„å…·ä½“ä½ç½®ã€‚
é¡ºæŽ’æ¡£ç´¢å¼•å’ŒHitçš„å˜å‚¨ç»“æž„å¦‚å›¾3æ‰€ç¤ºã€‚

å›¾3 é¡ºæŽ’æ¡£ç´¢å¼•å’ŒHitçš„å˜å‚¨ç»“æž„

å€¼å¾—æ³¨æ„çš„æ˜¯ï¼Œå½“ç‰¹æ®Šç´¢å¼•é¡¹æ¥è‡ªAnchor Textæ—¶ï¼Œç‰¹æ®Šç´¢å¼•é¡¹ç”¨æ¥è¡¨ç¤ºä½ç½®çš„ä¿¡æ¯ï¼ˆ8ä½ï¼‰å°†åˆ†ä¸ºä¸¤éƒ¨åˆ†ï¼š4ä½è¡¨ç¤ºAnchor Textå‡ºçŽ°çš„å…·ä½“ä½ç½®ï¼Œå¦4ä½åˆ™ç”¨æ¥ä¸Žè¡¨ç¤ºAnchor Textæ‰€é“¾æŽ¥ç½‘é¡µçš„docIDç›¸è¿žæŽ¥ï¼Œè¿™ä¸ªdocIDæ˜¯ç”±URL Resolverç»è¿‡è½¬åŒ–å˜å…¥é¡ºæŽ’æ¡£ç´¢å¼•çš„ã€‚
(b)ç´¢å¼•å™¨é™¤äº†å¯¹ç½‘é¡µä¸æœ‰æ„ä¹‰çš„è¯è¿›è¡Œåˆ†æžå¤–ï¼Œè¿˜åˆ†æžç½‘é¡µçš„æ‰€æœ‰è¶…æ–‡æœ¬é“¾æŽ¥ï¼Œå°†å…¶Anchor Textã€URLæŒ‡å‘ç‰å…³é”®ä¿¡æ¯å˜å…¥åˆ°Anchoræ–‡æ¡£åº“ä¸ã€‚
(c)ç´¢å¼•å™¨ç”Ÿæˆä¸€ä¸ªç´¢å¼•è¯è¡¨(Lexicon)ï¼Œå®ƒåŒ…æ‹¬ä¸¤ä¸ªéƒ¨åˆ†ï¼šå…³é”®è¯çš„åˆ—è¡¨å’ŒæŒ‡é’ˆåˆ—è¡¨ï¼Œç”¨äºŽå€’æŽ’æ¡£æ–‡æ¡£ç›¸è¿žæŽ¥(å¦‚å›¾3æ‰€ç¤º)ã€‚
(d)ç´¢å¼•å™¨è¿˜å°†åˆ†æžè¿‡çš„ç½‘é¡µç¼–æŽ’æˆä¸€ä¸ªä¸ŽRepositoryç›¸è¿žæŽ¥çš„æ–‡æ¡£ç´¢å¼•(Document Index)ï¼Œå¹¶è®°å½•ä¸‹ç½‘é¡µçš„URLå’Œæ ‡é¢˜ï¼Œä»¥ä¾¿å¯ä»¥å‡†ç¡®æŸ¥æ‰¾å‡ºåœ¨Repositoryä¸å˜å‚¨çš„åŽŸç½‘é¡µå†…å®¹ã€‚è€Œä¸”æŠŠæ²¡æœ‰åˆ†æžçš„ç½‘é¡µä¼ ç»™URL Serverï¼Œä»¥ä¾¿åœ¨ä¸‹ä¸€æ¬¡å·¥ä½œæµç¨‹ä¸è¿›è¡Œç´¢å¼•åˆ†æžã€‚
â‘¤URLåˆ†æžå™¨ï¼ˆURL Resolverï¼‰è¯»å–Anchoræ–‡æ¡£ä¸çš„ä¿¡æ¯ï¼Œç„¶åŽåšâ‘¥ä¸çš„å·¥ä½œã€‚
â‘¥(a)å°†å…¶é”šæ–‡æœ¬(Anchor Text)æ‰€æŒ‡å‘çš„URLè½¬æ¢æˆç½‘é¡µçš„docIDï¼›(b)å°†è¯¥docIDä¸ŽåŽŸç½‘é¡µçš„docIDå½¢æˆâ€œé“¾æŽ¥å¯¹â€ï¼Œå˜å…¥Linkæ•°æ®åº“ä¸ï¼›(c)å°†Anchor TextæŒ‡å‘çš„ç½‘é¡µçš„docIDä¸Žé¡ºæŽ’æ¡£ç‰¹æ®Šç´¢å¼•é¡¹Anchor Hitsç›¸è¿žæŽ¥ã€‚
â‘¦æ•°æ®åº“Linkè®°å½•äº†ç½‘é¡µçš„é“¾æŽ¥å…³ç³»ï¼Œç”¨æ¥è®¡ç®—ç½‘é¡µçš„PageRankå€¼ã€‚
â‘§æ–‡æ¡£ç´¢å¼•(Document Index)æŠŠæ²¡æœ‰è¿›è¡Œç´¢å¼•åˆ†æžçš„ç½‘é¡µä¼ é€’ç»™URL Serverï¼ŒURL Serveråˆ™å‘Crawleræä¾›å¾…éåŽ†çš„URLï¼Œè¿™æ ·ï¼Œè¿™äº›æœªè¢«ç´¢å¼•çš„ç½‘é¡µåœ¨ä¸‹ä¸€æ¬¡å·¥ä½œæµç¨‹ä¸å°†è¢«ç´¢å¼•åˆ†æžã€‚
â‘¨æŽ’åºå™¨ï¼ˆSorterï¼‰å¯¹æ•°æ®æ¡¶(Barrels)çš„é¡ºæŽ’æ¡£ç´¢å¼•é‡æ–°è¿›è¡ŒæŽ’åºï¼Œç”Ÿæˆä»¥å…³é”®è¯(wordID)ä¸ºç´¢å¼•çš„å€’æŽ’æ¡£ç´¢å¼•ã€‚å€’æŽ’æ¡£ç´¢å¼•ç»“æž„å¦‚å›¾4æ‰€ç¤ºï¼š

å›¾4  å€’æŽ’æ¡£ç´¢å¼•ç»“æž„
â‘©å°†ç”Ÿæˆçš„å€’æŽ’æ¡£ç´¢å¼•ä¸Žå…ˆå‰ç”±ç´¢å¼•å™¨äº§ç”Ÿçš„ç´¢å¼•è¯è¡¨(Lexicon)ç›¸è¿žæŽ¥äº§ç”Ÿä¸€ä¸ªæ–°çš„ç´¢å¼•è¯è¡¨ä¾›æœç´¢å™¨(Searcher)ä½¿ç”¨ã€‚æœç´¢å™¨çš„åŠŸèƒ½æ˜¯ç”±ç½‘é¡µæœåŠ¡å™¨å®žçŽ°çš„ï¼Œæ ¹æ®æ–°äº§ç”Ÿçš„ç´¢å¼•è¯è¡¨ç»“åˆä¸Šè¿°çš„æ–‡æ¡£ç´¢å¼•(Document Index)å’ŒLinkæ•°æ®åº“è®¡ç®—çš„ç½‘é¡µPageRankå€¼æ¥åŒ¹é…æ£€ç´¢ã€‚
åœ¨æ‰§è¡Œæ£€ç´¢æ—¶ï¼ŒGoogleé€šå¸¸éµå¾ªä»¥ä¸‹æ¥éª¤ï¼ˆä»¥ä¸‹æ‰€æŒ‡çš„æ˜¯å•ä¸ªæ£€ç´¢è¯çš„æƒ…å†µï¼‰ï¼š
(1)å°†æ£€ç´¢è¯è½¬åŒ–æˆç›¸åº”çš„wordIDï¼›
(2)åˆ©ç”¨Lexiconï¼Œæ£€ç´¢å‡ºåŒ…å«è¯¥wordIDçš„ç½‘é¡µçš„docIDï¼›
(3)æ ¹æ®ä¸ŽLexiconç›¸è¿žçš„å€’æŽ’æ¡£ç´¢å¼•ï¼Œåˆ†æžå„ç½‘é¡µä¸çš„ç›¸å…³ç´¢å¼•é¡¹çš„æƒ…å†µï¼Œè®¡ç®—å„ç½‘é¡µå’Œæ£€ç´¢è¯çš„åŒ¹é…ç¨‹åº¦ï¼Œå¿…è¦æ—¶è°ƒç”¨é¡ºæŽ’æ¡£ç´¢å¼•ï¼›
(4)æ ¹æ®å„ç½‘é¡µçš„åŒ¹é…ç¨‹åº¦ï¼Œç»“åˆæ ¹æ®Linkäº§ç”Ÿçš„ç›¸åº”ç½‘é¡µçš„PageRankæƒ…å†µï¼Œå¯¹æ£€ç´¢ç»“æžœè¿›è¡ŒæŽ’åºï¼›
(5)è°ƒç”¨Document Indexä¸çš„docIDåŠå…¶ç›¸åº”çš„URLï¼Œå°†æŽ’åºç»“æžœç”Ÿæˆæ£€ç´¢ç»“æžœçš„æœ€ç»ˆåˆ—è¡¨ï¼Œæä¾›ç»™æ£€ç´¢ç”¨æˆ·ã€‚
ç”¨æˆ·æ£€ç´¢åŒ…å«å¤šä¸ªæ£€ç´¢è¯çš„æƒ…å†µä¸Žä»¥ä¸Šå•ä¸ªæ£€ç´¢è¯çš„æƒ…å†µç±»ä¼¼ï¼šå…ˆåšå•ä¸ªæ£€ç´¢è¯çš„æ£€ç´¢ï¼Œç„¶åŽæ ¹æ®æ£€ç´¢å¼ä¸æ£€ç´¢ç¬¦å·çš„è¦æ±‚è¿›è¡Œå¿…è¦çš„å¸ƒå°”æ“ä½œæˆ–å…¶ä»–æ“ä½œã€‚

最后编辑：郝聪编辑于2008/02/19 16:29

Tags: google , pr , æœç´¢åŽŸç†

Googleæœç´¢åŽŸç†çš„è®º

GOOGLEæœç´¢å¼•æ“Žå‰–æž

< 2025 > < 7 >
日	一	二	三	四	五	六
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

郝聪SEO博客：SEO顾问咨询服务公司

Googleæœç´¢åŽŸç†çš„è®ºæ–‡(äºŒ)

分类

最新日志

最新评论

最新留言

综合点击排行

评论排行

随机日志

作者

日历

站内搜索

归档

统计

其他

郝聪SEO博客：SEO顾问咨询服务公司

Googleæœç´¢åŽŸç†çš„è®ºæ–‡(äºŒ)

分类

最新日志

最新评论

最新留言

综合点击排行

评论排行

随机日志

作者

日历

站内搜索

归档

统计

其他

Googleæœç´¢åŽŸç†çš„è®ºæ–‡(äºŒ)