GOOGLEæœç´¢å¼•æ“Žå‰–æž

郝聪 , 2006/09/24 14:35 , 搜索引擎研究 , 评论(0) , 阅读(16300) , Via 本站原创

GOOGLEæœç´¢å¼•æ“Žå‰–æž

æ’°æ–‡/Sergey Brin.   Lawrence Page     ç¿»è¯‘/ä¸‡æ€

æ–‡ç« æ¥è‡ªã€Šç¨‹åºå‘˜ã€‹
è‹±æ–‡åŽŸæ–‡å¯ä»¥åœ¨è¿™é‡Œæ‰¾åˆ°http://dev.csdn.net/develop/article/12/12657.shtm

ä½œä¸ºä¸€ç§åŠŸèƒ½å¼ºå¤§çš„æœç´¢å¼•æ“Žï¼ŒGoogicçš„èƒŒåŽä¼¼ä¹Žéšè—ç€å·¨å¤§çš„å¥¥ç§˜ï¼Œæœ¬æ–‡æ˜¯Googicçš„ä¸¤ä½åˆ›å§‹äººåœ¨1998å¹´å›½é™…äº’è”ç½‘å¤§ä¼šä¸Šå‘è¡¨çš„è®ºæ–‡ï¼Œé€šè¿‡å¯¹Googleè¿›è¡Œå®Œæ•´åœ°å‰–æžï¼Œå¸®åŠ©è¯»è€…ç†è§£Googleçš„å®žçŽ°è¿‡ç¨‹

1ã€‚ä¸ºä»€ä¹ˆè¦ç”¨Google
    Webç»“æž„çš„ç‰¹æ®Šæ€§ä¸ºä¿¡æ¯æ”¶é›†å·¥ä½œå¸¦æ¥äº†æ–°çš„æŒ‘æˆ˜ã€‚Webä¸Šçš„ä¿¡æ¯æ•°é‡è¿…é€Ÿå¢žé•¿çš„åŒæ—¶ï¼Œå¯¹äºŽWebæ¯«æ— ä½¿ç”¨ç»éªŒçš„æ–°ç”¨æˆ·ä¹Ÿåœ¨ä¸Žæ—¥ä¿±å¢žã€‚ä½¿ç”¨é«˜è´¨é‡çš„æœç´¢å¼•æ“Žï¼Œæ— ç–‘å¯ä»¥ç¼©çŸWebåŒæ–°ç”¨æˆ·ä¹‹é—´çš„è·ç¦»ã€‚å¤§å®¶å…³å¿ƒçš„é—®é¢˜æ˜¯ï¼Œæœç´¢è´¨é‡å’Œæ•ˆçŽ‡ã€‚

    Yahooæ›¾ä¸€åº¦æ˜¯ç”¨æˆ·çš„æœ€ä½³é€‰æ‹©ã€‚Yahooçš„äººå·¥ç»´æŠ¤æ–¹å¼å¯ä»¥æœ‰æ•ˆæ¶µç›–æœ€æµè¡Œçš„ä¸»é¢˜ã€‚ç„¶è€Œï¼Œç»´æŠ¤äººå‘˜çš„ä¸»è§‚æ€§ã€é«˜æ˜‚çš„ç»´æŠ¤ä»£ä»·ã€è¾ƒæ…¢çš„æ›´æ–°é€Ÿåº¦éƒ½æ˜¯Yahooçš„ç¼ºé™·ã€‚æ›´é‡è¦çš„äº‹ï¼Œè¿™ç§æ–¹å¼å¹¶ä¸èƒ½è¦†ç›–æ‰€æœ‰ç”¨æˆ·æ‰€å…³å¿ƒçš„è¯é¢˜ã€‚æ‰€æœ‰è¿™äº›åˆ¶çº¦äº†Yahooçš„è¿›ä¸€æ¥å‘å±•ã€‚åŸºäºŽå…³é”®å—çš„æœç´¢å¼•æ“Žéšä¹‹å‡ºçŽ°ï¼Œä½†æ–°çš„é—®é¢˜æŽ¥è¸µè€Œæ¥ï¼šæœç´¢å¼•æ“Žåˆ¶é€ å‡ºçš„å¤§é‡â€œåžƒåœ¾â€ç»“æžœé®ä½äº†ç”¨æˆ·çš„è§†çº¿ï¼Œä¹Ÿè€ƒéªŒäº†æ›´å¤šäººçš„è€å¿ƒã€‚ä¸€äº›å¹¿å‘Šå•†ä¸ºäº†å¸å¼•ç”¨æˆ·çš„ç›®å…‰ï¼Œé‡‡ç”¨ä¸€äº›æ‰‹æ®µæ¬ºéª—æœç´¢å¼•æ“Žï¼Œè¿™ä½¿äº‹æƒ…å˜å¾—æ›´ç³Ÿã€‚

    Googleä¸ºä¸Šè¿°é—®é¢˜æä¾›äº†æ–°çš„è§£å†³æ–¹æ¡ˆã€‚é¦–å…ˆï¼ŒGoogleæ˜¯åŸºäºŽå…³é”®å—çš„ï¼Œè¿™æ ·çªç ´äº†æŸ¥è¯¢ä¸»é¢˜çš„é™åˆ¶ï¼›å…¶æ¬¡ï¼ŒGoogleåˆ©ç”¨ç½‘é¡µè¶…çº§è¿žæŽ¥çš„æ·±åº¦å’Œç‹¬åˆ›çš„PageRankç®—æ³•ï¼Œä¸ºç½‘é¡µèµ‹äºˆäº†â€œçº§åˆ«ï¼ˆRankï¼‰â€å«ä¹‰ï¼šç”¨æˆ·çš„æ£€ç´¢ç»“æžœï¼Œæ˜¯æŒ‰ç…§ç½‘é¡µçš„çº§åˆ«ï¼ˆRankï¼‰è¿›è¡ŒæŽ’åºçš„ï¼Žçº§åˆ«é«˜çš„ç½‘é¡µé“¾æŽ¥æŽ’åœ¨å‰é¢ï¼Ž

ã€€ã€€Googleè¿™ä¸ªåå—çš„æ¥åŽ†ä¹Ÿå¾ˆæœ‰æ„æ€ï¼šGoogleçš„åˆ›å»ºè€…å‚è€ƒäº†å•è¯googolï¼ˆï¼‘ï¼ï¼‘ï¼ï¼ï¼‰çš„æ‹¼å†™ï¼Œä¹Ÿè®¸è¿™å’Œä½œè€…è¦å»ºç«‹å¤§è§„æ¨¡çš„æœç´¢å¼•æ“Žçš„ç›®æ ‡ä¸è°‹è€Œåˆï¼Ž

2ï¼Žè®¾è®¡ç›®æ ‡
ã€€ã€€æ£å¦‚ä½ æƒ³åˆ°çš„ï¼ŒGOOGLEçš„ä¸»è¦ç›®æ ‡æ˜¯æé«˜æœç´¢å¼•æ“Žçš„æœç´¢è´¨é‡å’Œæ˜“ç”¨æ€§ï¼Žï¼‘ï¼™ï¼™ï¼—å¹´ï¼‘ï¼‘æœˆçš„ä¸€é¡¹è°ƒæŸ¥ä¸ï¼ŒæŽ’åå‰å››ä½çš„å•†ä¸šåŒ–æœç´¢å¼•æ“Žï¼Œåœ¨æ‰§è¡Œä»¥å®ƒè‡ªèº«çš„åå—ä½œä¸ºå…³é”®å—çš„æŸ¥è¯¢æ—¶ï¼Œä»…æœ‰ä¸€ä¸ªæœç´¢å¼•æ“Žåœ¨å…¶æœç´¢ç»“æžœçš„å‰ï¼‘ï¼æ¡æŸ¥è¯¢ç»“æžœä¸æ‰¾åˆ°è‡ªå·±ï¼Žé—®é¢˜å·²ç»å˜å¾—å¾ˆæ˜Žæ˜¾ï¼šç”¨æˆ·å…³å¿ƒçš„ä¸æ˜¯æœç´¢å¼•æ“Žæ‰€èƒ½æä¾›çš„æŸ¥è¯¢ç»“æžœï¼Œè€Œæ˜¯åœ¨æœç´¢å¼•æ“Žä¸æ‰€èƒ½æä¾›çš„å‰æ•°åæ¡æŸ¥è¯¢ç»“æžœä¸ï¼Œèƒ½å¦æ‰¾åˆ°è‡ªå·±çš„æ»¡æ„ç”æ¡ˆï¼Žæ£å› ä¸ºå¦‚æ¤ï¼Œå½“Webæ–‡æ¡£æˆå€å¢žé•¿æ—¶ï¼Œå¦‚ä½•æä¾›ä¸€ä¸ªæ—¢æ˜“äºŽæ“ä½œï¼Œåˆèƒ½æä¾›å‡†ç¡®æŸ¥è¯¢çš„æ–°çš„æœç´¢å¼•æ“ŽæŠ€æœ¯ï¼Žè¿™æˆä¸ºäº†å…³æ³¨çš„ç„¦ç‚¹ï¼Ž

ã€€ã€€è¿‘å‡ å¹´çš„ä¸€äº›ç›¸å…³ç ”ç©¶ä¸ºGoogleæ‰“å¼€äº†æ€è·¯ï¼Žè¿™äº›ç ”ç©¶çš„ä¸»è¦æ–¹å‘æ˜¯ï¼šå¦‚ä½•ä»Žé¡µé¢çš„è¶…é“¾æŽ¥æ–‡æœ¬ä¸èŽ·å–å¯¹å¼€å‘äººå‘˜æœ‰ç”¨çš„ä¿¡æ¯ï¼Žæ£æ˜¯é€šè¿‡å¯¹HTMLæ–‡æ¡£ä¸è¶…æ–‡æœ¬é“¾æŽ¥çš„æ·±åº¦åˆ†æžï¼ŒGoogleä¸ºè‡ªå·±çš„ç²¾ç¡®åº¦ç®—æ³•æä¾›äº†ç†è®ºä¾æ®ï¼Ž

ã€€ã€€Googleå¸Œæœ›é€šè¿‡è‡ªå·±çš„åŠªåŠ›ï¼ŒæŠŠåŽŸæœ¬åªå±žäºŽå•†ä¸šé¢†åŸŸçš„æœç´¢å¼•æ“ŽæŠ€æœ¯å¸¦åˆ°ç†è®ºç ”ç©¶çš„èŒƒç•´ï¼Œå¹¶èƒ½è®©æ›´å¤šçš„äººå‚ä¸Žå’Œå®Œå–„ï¼ŽGoogleæŠŠè‡ªå·±çš„ç³»ç»Ÿæ¯”å–»ä¸ºä¸€ä¸ªå¤§çš„å®žéªŒå®¤çŽ¯å¢ƒï¼Œå¹¶æ¬¢è¿Žå…¶ä»–é¢†åŸŸçš„ç ”ç©¶äººå‘˜å‚ä¸Žå…¶ä¸ï¼Žæ£æ˜¯åœ¨åƒåƒä¸‡ä¸‡å¦‚Googleè¿™æ ·çš„ç»„ç»‡çš„å¸¦åŠ¨ä¸‹ï¼ŒWebèŽ·å–äº†å®ƒå‰æ‰€æœªæœ‰çš„å‘å±•åŠ¨åŠ›ï¼Ž

3.æŠ€æœ¯åˆ†æž
ã€€ã€€Googleä¹‹æ‰€ä»¥èƒ½èŽ·å–é«˜æ•ˆçŽ‡çš„æŸ¥è¯¢ç»“æžœï¼Œå¾—ç›ŠäºŽå…¶ä¸¤ç›¸é‡è¦çš„æŠ€æœ¯ç‰¹æ€§ï¼šç¬¬ä¸€ï¼ŒGoogleåˆ†æžæ•´ä¸ªWebçš„é“¾æŽ¥ç»“æž„ï¼Œç„¶åŽè®¡ç®—å‡ºæ¯ä¸€ä¸ªç½‘é¡µçš„çº§åˆ«ï¼Œå¹¶è¿›è¡Œç»¼åˆè¯„åˆ†ï¼Œè¿™å°±æ˜¯Googleæ‰€é‡‡ç”¨çš„PageRankæŠ€æœ¯ï¼›ç¬¬äºŒï¼ŒGoogleå……åˆ†åˆ©ç”¨é“¾æŽ¥æä¾›çš„ä¿¡æ¯ä»¥è¿›ä¸€æ¥æ”¹å–„æŸ¥è¯¢è´¨é‡ï¼Ž
ã€€3.1 PageRankï¼šé¡µé¢çš„æŽ’åºæŠ€æœ¯
ã€€ã€€Googleçš„æ ¸å¿ƒæŠ€æœ¯ç§°ä¸ºPageRankï¼Œè¿™æ˜¯Googleçš„åˆ›å§‹äººLarry Pageå’ŒSergey Brinåœ¨æ–¯å¦ç¦å¤§å¦å¼€å‘å‡ºçš„ä¸€å¥—ç”¨äºŽç½‘é¡µè¯„çº§çš„ç³»ç»Ÿï¼Žä½œä¸ºç»„ç»‡ç®¡ç†å·¥å…·ï¼ŒPageRankåˆ©ç”¨äº†äº’è”ç½‘ç‹¬ç‰¹çš„æ˜Žä¸»ç‰¹æ€§åŠå…¶å·¨å¤§çš„é“¾æŽ¥ç»“æž„ï¼Žåœ¨æµ©ç€šçš„é“¾æŽ¥èµ„æºä¸ï¼ŒGoogleæå–å‡ºä¸Šäº¿ä¸ªè¶…çº§é“¾æŽ¥è¿›è¡Œåˆ†æžï¼Œåˆ¶ä½œå‡ºä¸€ä¸ªå·¨å¤§çš„ç½‘ç»œåœ°å›¾ï¼ˆMapï¼‰ï¼Žä¾æ®æ¤åœ°å›¾ï¼ŒPageRankæŠ€æœ¯èƒ½å¤Ÿå¿«é€Ÿçš„è®¡ç®—å‡ºç½‘é¡µçš„çº§åˆ«ï¼ˆRankï¼‰ï¼Žè¿™ä¸ªçº§åˆ«çš„ä¾æ®æ˜¯ï¼šå½“ä»Žç½‘é¡µAè¿žæŽ¥åˆ°ç½‘é¡µBæ—¶ï¼ŒGoogleå°±è®¤ä¸ºï¼‚ç½‘é¡µAæŠ•äº†ç½‘é¡µBä¸€ç¥¨ï¼‚ï¼ŽGoogleæ ¹æ®ç½‘é¡µçš„å¾—ç¥¨æ•°è¯„å®šå…¶é‡è¦æ€§ï¼Žç„¶è€Œï¼Œé™¤äº†è€ƒè™‘ç½‘é¡µå¾—ç¥¨æ•°ï¼ˆå³é“¾æŽ¥ï¼‰çš„çº¯æ•°é‡ä¹‹å¤–ï¼ŒGoogleè¿˜è¦åˆ†æžæŠ•ç¥¨çš„ç½‘é¡µã€‚â€œé‡è¦â€çš„ç½‘é¡µæ‰€æŠ•å‡ºçš„ç¥¨å°±ä¼šæœ‰æ›´é«˜çš„æƒé‡ï¼Œå¹¶ä¸”æœ‰åŠ©äºŽæé«˜å…¶ä»–ç½‘é¡µçš„â€œé‡è¦æ€§â€ã€‚
    Googleä»¥å…¶å¤æ‚è€Œå…¨é¢è‡ªåŠ¨çš„æœç´¢æ–¹æ³•æŽ’é™¤äº†äººä¸ºå› ç´ å¯¹æœç´¢ç»“æžœçš„å½±å“ã€‚æ‰€ä»¥è¯´ï¼ŒPageRankç›¸å¯¹æ˜¯å…¬å¹³çš„ã€‚åœ¨è¿™ä¸ªæ„ä¹‰ä¸Šï¼Œå¯¹äºŽåŸºäºŽå…³é”®å—æœç´¢çš„å¼•æ“ŽæŠ€æœ¯æ¥è¯´ï¼ŒPageRankæ— ç–‘æ˜¯ä¸€é¡¹ä¼˜ç§€çš„æŠ€æœ¯ï¼ŒGoogleå¯ä»¥æ–¹ä¾¿ã€è¯šå®žã€å®¢è§‚åœ°å¸®æ‚¨åœ¨ç½‘é¡µä¸Šæ‰¾åˆ°ä»»ä½•æœ‰ä»·å€¼çš„èµ„æ–™ã€‚

     3.1.1 PageRankç®—æ³•æè¿°
     è¿‘äº›å¹´æ¥ï¼Œå¤§é‡çš„å¦æœ¯ç ”ç©¶æˆæžœè¢«åº”ç”¨åˆ°Webä¸ï¼Œä¸»è¦è¢«ç”¨æ¥ç»Ÿè®¡ç½‘é¡µçš„å¼•ç”¨æˆ–è¿”å›žé“¾æŽ¥ã€‚è¿™äº›æ•°æ®ä¸ºç½‘é¡µçš„é‡è¦æ€§å’Œä»·å€¼åˆ†æžæä¾›äº†ç²—ç•¥çš„ä¾æ®ã€‚åŸºäºŽæ¤, PageRankè¿˜è¿›ä¸€æ¥ç»Ÿè®¡é“¾æŽ¥åœ¨æ‰€æœ‰ç½‘é¡µä¸å‡ºçŽ°çš„æ¬¡æ•°ã€‚PageRankå®šä¹‰å¦‚ä¸‹æ‰€è¿°ï¼š

     å‡å®šé¡µé¢Aæœ‰å¾ˆå¤šæŒ‡å‘ä»–çš„é“¾æŽ¥ï¼Œåˆ†åˆ«å®šä¹‰ä¸ºé¡µé¢T1...Tnã€‚æˆ‘ä»¬å†å®šä¹‰é˜»å°¼ç³»æ•°dï¼ˆ0ã€ˆ=dã€ˆ=1ï¼‰ã€‚é€šå¸¸æŒ‡å®šd=0.85ï¼ˆè¯‘è€…æ³¨ï¼šä¸‹ä¸€èŠ‚ç»™å‡ºå®žä¾‹åˆ†æžï¼‰ã€‚å‡½æ•°Cï¼ˆAï¼‰è¡¨ç¤ºé¡µé¢Aä¸æŒ‡å‘å…¶ä»–é¡µé¢çš„é“¾æŽ¥çš„ä¸ªæ•°ã€‚é‚£ä¹ˆï¼Œé¡µé¢Açš„PageRankï¼ˆPRï¼ˆAï¼‰ï¼‰å¯ä»¥é€šè¿‡ä¸‹é¢çš„å…¬å¼è®¡ç®—å‡ºï¼š

     PRï¼ˆAï¼‰=ï¼ˆ1-dï¼‰+dï¼ˆPRï¼ˆT1ï¼‰/Cï¼ˆT1ï¼‰+...PRï¼ˆTnï¼‰/cï¼ˆTnï¼‰ï¼‰

     æ³¨æ„åˆ°PageRankçš„å€¼æ˜¯é€šè¿‡æ•´ä¸ªWebè®¡ç®—å‡ºæ¥çš„ï¼Œæ‰€ä»¥ï¼Œæ‰€æœ‰é¡µé¢çš„PageRankå€¼çš„å’Œå¿…ç„¶ä¸º1ã€‚

     é€šè¿‡ç®€å•çš„é€’å½’è®¡ç®—ï¼Œå¹¶å‚ç…§Webä¸è§„èŒƒåž‹é“¾æŽ¥çŸ©é˜µçš„ä¸»ç‰¹å¾å‘é‡ï¼Œæˆ‘ä»¬å°±å¯ä»¥è®¡ç®—å‡ºä¸€ä¸ªé¡µé¢çš„PageRankï¼ˆPRï¼ˆAï¼‰ï¼‰ã€‚å‡è®¾è®¡ç®—å¤§çº¦26ï¼Œ000ï¼Œ000ä¸ªé¡µé¢çš„PageRankï¼Œä½¿ç”¨ä¸€å°ä¸ç‰è§„æ¨¡çš„å·¥ä½œç«™ï¼Œå¤§çº¦éœ€è¦æ•°ä¸ªå°æ—¶çš„æ—¶é—´ã€‚å…·ä½“å®žçŽ°çš„ç»†èŠ‚å·²ç»è¶…å‡ºæ–‡æœ¬çš„è®¨è®ºèŒƒå›´ï¼Œè¯»è€…å¯ä»¥å‚è€ƒç›¸å…³æ–‡æ¡£ã€‚

    3.1.2 PageRankæ¨¡åž‹
    ä¸ºäº†æ›´å¥½åœ°ç†è§£ PageRankï¼Œæˆ‘ä»¬å»ºç«‹ä»¥ä¸‹ä¸€ä¸ªå‡æƒ³çš„æ¨¡åž‹ã€‚æˆ‘ä»¬å‡å®šæœ‰ä¸€ä¸ªWebç”¨æˆ·æ£åœ¨éšæœºæµè§ˆæŸä¸ªç½‘é¡µï¼Œéšç€å…´è¶£çš„å˜åŒ–ï¼Œä»–ä¹Ÿå¯èƒ½éšæœºç‚¹å‡»é¡µé¢ä¸çš„å¦ä¸€ä¸ªé“¾æŽ¥ï¼Œè·³è½¬åˆ°å…¶ä»–é¡µé¢ï¼ˆæš‚ä¸”å‡å®šè¯¥ç”¨æˆ·æ²¡æœ‰ä½¿ç”¨è¿”å›žæŒ‰é’®ï¼‰ã€‚åœ¨è¿™ä¸ªæ¨¡åž‹ä¸ï¼Œå¸å¼•ç”¨æˆ·ç‚¹å‡»æŒ‡å‘æŸä¸ªé¡µé¢çš„é“¾æŽ¥çš„æ¦‚çŽ‡å°±æ˜¯é¡µé¢çš„PageRankã€‚è€Œç”±äºŽæŸäº›å› ç´ å¯¼è‡´ç”¨æˆ·é€‰æ‹©äº†å…¶ä»–é“¾æŽ¥çš„æ¦‚çŽ‡å°±æ˜¯è¯¥é¡µé¢çš„é˜»å°¼ç³»æ•°dã€‚æœ‰ä¸€äº›æžç«¯çš„æƒ…å†µï¼Œå¦‚æœ‰äº›é¡µé¢å¯èƒ½å¾ˆå°‘è¢«äººè®¿é—®ï¼Œè¿™äº›é¡µé¢å°±ä¼šç§¯ç´¯èµ·å¾ˆé«˜çš„é˜»å°¼ç³»æ•°ã€‚æ‰€ä»¥è¯´ï¼ŒPageRankçš„æŠ€æœ¯å¯ä»¥å…¬å¹³æœ‰æ•ˆåˆ°é¿å…æœ‰äº›ç³»ç»Ÿä¸ºäº†èŽ·å–è¾ƒé«˜çº§åˆ«è€Œé‡‡å–ä¸€äº›æ¬ºéª—æœç´¢å¼•æ“Žçš„è¡Œä¸ºã€‚

    ä¸€èˆ¬æ¥è¯´ã€‚ç½‘é¡µçš„é“¾æŽ¥æŒ‡å‘è¶Šå¤šï¼ŒPageRankçš„å€¼å°±ä¼šè¶Šé«˜ã€‚åŒæ ·ï¼Œè¢«ä¸€äº›â€œé‡é‡çº§â€çš„ç½‘ç«™ï¼ˆä¾‹å¦‚yahoo)å¼•ç”¨çš„æ¬¡æ•°è¶Šå¤šï¼ŒPageRankçš„å€¼åŒæ ·ä¹Ÿä¼šå¾ˆé«˜ã€‚ç›¸åï¼Œé‚£äº›è®¾è®¡ä¸ä½³ï¼Œæˆ–è€…è¢«é“¾æŽ¥ç ´åæŒ‡å‘çš„ç½‘é¡µï¼Œå°†é€æ¸è¢«ç”¨æˆ·æ‰€é—å¿˜ã€‚æ‰€æœ‰çš„è¿™äº›å› ç´ éƒ½åœ¨PageRankæŠ€æœ¯çš„ç»¼åˆè€ƒè™‘ä¹‹ä¸ã€‚

  3.2é”šæ–‡æœ¬ï¼ˆanchor textï¼‰
    åœ¨Googleä¸ï¼Œé“¾æŽ¥æ–‡æœ¬ï¼ˆtext of link ï¼‰è¢«ä½¿ç”¨ä¸€ç§ç‰¹æ®Šçš„æ–¹å¼è¿›è¡Œå¤„ç†ã€‚å¤§å¤šæ•°çš„æœç´¢å¼•æ“Žéƒ½æ˜¯æŠŠé“¾æŽ¥æ–‡æœ¬å’Œå®ƒæ‰€åœ¨çš„é¡µé¢ç›¸å…³è”ï¼Œè€ŒGoogleåˆ™æŠŠé“¾æŽ¥æ–‡æœ¬å’Œå®ƒæŒ‡å‘çš„æ–‡æ¡£è”ç³»åˆ°ä¸€èµ·ï¼ˆæƒ³æƒ³çš„ç¡®åº”è¯¥å¦‚æ¤ï¼‰ã€‚è¿™æ ·åšçš„ä¼˜ç‚¹å¾ˆå¤šï¼šé¦–å…ˆï¼Œé”šï¼ˆanchor ï¼‰ä¸€èˆ¬éƒ½ä¼šæä¾›å®ƒæ‰€æŒ‡å‘çš„æ–‡æ¡£çš„å‡†ç¡®çš„æè¿°ï¼Œè€Œè¿™æ ·ä¿¡æ¯ï¼Œé¡µé¢æœ¬èº«å¾€å¾€ä¸èƒ½æä¾›ï¼›ç¬¬äºŒï¼Œå¯¹äºŽé‚£äº›ä¸èƒ½è¢«åŸºäºŽæ–‡æœ¬çš„æœç´¢å¼•æ“Žå»ºç«‹ç´¢å¼•çš„æ–‡æ¡£ï¼Œä¾‹å¦‚å›¾è±¡ï¼Œç¨‹åºä»¥åŠæ•°æ®åº“ç‰ï¼ŒæŒ‡å‘å®ƒä»¬çš„é“¾æŽ¥å´å¯èƒ½å˜åœ¨ï¼Œè¿™æ ·å°±ä½¿å¾—é‚£äº›ä¸èƒ½è¢«å¼•æ“Žå–å›žåˆ†æžçš„æ–‡æ¡£ä¹Ÿèƒ½ä½œä¸ºæŸ¥è¯¢ç»“æžœè¿”å›žã€‚ä½†æ˜¯ï¼Œè¿™æ ·åšä¹Ÿå¯èƒ½ä¼šå¼•èµ·ä¸€äº›é—®é¢˜ï¼Œå› ä¸ºè¿™äº›æ–‡æ¡£åœ¨è¿”å›žç»™ç”¨æˆ·ä¹‹å‰å¹¶æœªç»è¿‡æœç´¢å¼•æ“Žçš„æœ‰æ•ˆæ€§æ£€æŸ¥ã€‚åœ¨è¿™ç§æƒ…å†µä¸‹ï¼Œæœç´¢å¼•æ“Žå°±å¯ä»¥ç®€å•åœ°è¿”å›žæŸ¥è¯¢ç»“æžœï¼Œç”šè‡³ä¸ç”¨è€ƒè™‘é¡µé¢æ˜¯å¦å˜åœ¨ï¼Œè€Œåªç®¡æ˜¯å¦æœ‰æŒ‡å‘å®ƒä»¬çš„è¶…çº§é“¾æŽ¥å˜åœ¨ã€‚ä¹Ÿè®¸ä½ ä¼šé—®ï¼Œè¿™åˆé€‚å—ï¼Ÿä¸ç”¨æ‹…å¿ƒï¼Œç”±äºŽæŸ¥è¯¢ç»“æžœæ˜¯ç»è¿‡çº§åˆ«æŽ’åºè¾“å‡ºçš„ï¼Œè¿™ç§ç‰¹æ®Šçš„æƒ…å†µä¹Ÿè®¸æ ¹æœ¬çœ‹ä¸åˆ°ã€‚

    å…¶å®žï¼Œè¿™ç§ä½¿ç”¨é”šæ–‡æœ¬æŠ€æœ¯çš„æ€æƒ³æ›´æ—©å¯ä»¥è¿½æº¯åˆ°World Wide Web Wormæœç´¢å¼•æ“Žã€‚å®ƒä½¿å¾—WWWWå¯ä»¥æ£€ç´¢åˆ°éžæ–‡æœ¬ä¿¡æ¯ï¼Œç”šè‡³æ‰©å±•åˆ°ä¸€äº›å¯ä»¥ä¸‹è½½çš„æ–‡æ¡£ï¼ŒGoogleç»§æ‰¿äº†è¿™ç§æ€è·¯ï¼Œå› ä¸ºå®ƒå¯ä»¥å¸®åŠ©æä¾›æ›´å¥½çš„æœç´¢ç»“æžœã€‚ç„¶è€Œï¼Œä½¿ç”¨è¿™ç§æŠ€æœ¯éœ€è¦å…‹æœå¾ˆå¤šçš„æŠ€æœ¯éš¾é¢˜ï¼Œé¦–å½“å…¶å†²çš„å°±æ˜¯å¦‚ä½•å¤„ç†å¦‚æ¤åºžå¤§çš„æ•°æ®é‡ã€‚æˆ‘ä»¬æ¥çœ‹çœ‹ä¸€ç»„æ•°æ®ï¼Œåœ¨Googleçˆ¬è™«å–å›žçš„24ï¼Œ000ï¼Œ000ä¸ªç½‘é¡µæ•°æ®ä¸ï¼Œéœ€è¦å¤„ç†çš„é“¾æŽ¥æ•°é«˜è¾¾259ï¼Œ000ï¼Œ000ä¹‹å¤šã€‚

  3.3å…¶å®ƒåŠŸèƒ½
    é™¤äº†PageRankå’Œé”šæ–‡æœ¬æŠ€æœ¯ä¹‹å¤–ï¼ŒGoogleè¿˜æœ‰ä¸€äº›å…¶å®ƒçš„æŠ€æœ¯ã€‚é¦–å…ˆï¼Œå¯¹äºŽæ‰€æœ‰å‘½ä¸ï¼ˆhits),Googleéƒ½è®°å½•äº†å•è¯åœ¨æ–‡æ¡£ä¸çš„ä½ç½®ä¿¡æ¯ï¼Œè¿™äº›ä¿¡æ¯åœ¨æœ€ç»ˆçš„æŸ¥è¯¢ä¸å¯ä»¥è¢«ç”¨æ¥è¿›è¡Œå•è¯çš„ç›¸ä¼¼åº¦åˆ†æžã€‚ç¬¬äºŒï¼ŒGoogleè¿˜è®°å½•äº†é¡µé¢ä¸çš„å—ä½“å¤§å°ã€å¤§å°å†™ç‰è§†è§‰ä¿¡æ¯ã€‚æœ‰çš„æ—¶å€™ï¼Œå¤§å·å—ä½“å’Œç²—ä½“çš„è®¾ç½®å¯ä»¥ç”¨æ¥è¡¨ç¤ºä¸€äº›é‡è¦çš„ä¿¡æ¯ã€‚ç¬¬ä¸‰ï¼Œåœ¨repositoryæ•°æ®åº“ä¸ä¿å˜æ‰€æœ‰é¡µé¢çš„HTMLä»£ç ã€‚
    (è¯‘æ³¨ï¼šå‘½ä¸(hit)æ˜¯Googleå®šä¹‰çš„ä¸€ä¸ªæ•°æ®ç»“æž„ï¼Œæœ‰å…³å‘½ä¸å’Œç›¸ä¼¼åº¦çš„æè¿°ï¼Œè¯¦è§ä¸‹æ–‡ã€‚)

4.ç³»ç»Ÿå‰–æž
    ä»Žä¸Šæ–‡ä¸ï¼Œæˆ‘ä»¬å·²ç»äº†è§£Googleçš„ä¸€äº›å·¥ä½œåŽŸç†ã€‚åœ¨è¿™ä¸€ç« èŠ‚ä¸ï¼Œæˆ‘ä»¬å°†ä¸€èµ·æ·±å…¥æŽ¢è®¨Googleçš„ä½“ç³»æ¡†æž¶ï¼Œç„¶åŽå…·ä½“ä»‹ç»Googleç”¨åˆ°çš„ä¸€äº›æ•°æ®ç»“æž„ã€‚æœ€åŽï¼Œæˆ‘ä»¬å†ä¸€èµ·åˆ†æžGoogleç”¨åˆ°çš„ä¸‰ä¸ªå…³é”®æŠ€æœ¯ï¼šç½‘é¡µæŠ“å–(crawling)ã€ç´¢å¼•(indexing)ä»¥åŠåŸºäºŽå…³é”®å—çš„æœç´¢(searching)ã€‚

  4.1 Googleä½“ç³»æ¡†æž¶
    æœ¬èŠ‚ä¸ï¼Œæˆ‘ä»¬å…±åŒæŽ¢è®¨Googleä½“ç³»æ¡†æž¶çš„è¿è¡Œæµç¨‹ï¼Œå¦‚å›¾1æ‰€ç¤ºã€‚ä¸‹é¢çš„å‡ ä¸ªç« èŠ‚å°†è¯¦ç»†çš„ä»‹ç»æ‰€ç”¨åˆ°çš„æŠ€æœ¯å’Œæ•°æ®ç»“æž„ã€‚è€ƒè™‘åˆ°æ‰§è¡Œæ•ˆçŽ‡ï¼ŒGoogle ä¸çš„å¤§éƒ¨åˆ†ä»£ç éƒ½æ˜¯ç”¨C/C++è¯è¨€å®žçŽ°çš„ï¼Œå¹¶ä¸”å¯ä»¥åŒæ—¶è¿è¡Œåœ¨Solariså’ŒLinuxç³»ç»Ÿä¸ã€‚

å›¾1

    åœ¨Googleçš„ä½“ç³»æ¡†æž¶ä¸ï¼Œç½‘é¡µçˆ¬è¡ŒæŠ€æœ¯(Crawlingï¼ŒæŒ‡ç½‘é¡µçš„ä¸‹è½½è¿‡ç¨‹)æ˜¯ç”±è‹¥å¹²ä¸ªåˆ†å¸ƒå¼çš„ç½‘ç»œçˆ¬è™«(Crawler)è½¯ä»¶å®žçŽ°çš„ã€‚å…¶ä¸ï¼Œä¸€ä¸ªå«åšURL Serverçš„æœåŠ¡å™¨è´Ÿè´£æŠŠéœ€è¦åˆ†æžçš„URLåœ°å€åˆ—è¡¨åˆ†æ´¾ç»™è¿™äº›ç½‘ç»œçˆ¬è™«è¿›è¡Œå¤„ç†ã€‚ç½‘é¡µæ•°æ®å¦‚æžœè¢«å–å›žï¼Œå°†ç«‹å³è¢«é€åˆ°Store Serverä¸ã€‚Store Serverå¯¹ç½‘é¡µæ•°æ®è¿›è¡ŒåŽ‹ç¼©ï¼Œç„¶åŽä¿å˜åˆ°Repositoryæ•°æ®åº“ä¸ã€‚æ¯ä¸€ä¸ªæ–‡æ¡£éƒ½æ‹¥æœ‰ä¸€ä¸ªä¸Žä¹‹ç›¸å…³çš„å”¯ä¸€çš„IDç¼–å·ï¼ŒGoogleç§°å®ƒä¸ºdocIDã€‚æ¯å½“æœ‰ä¸€ä¸ªæ–°çš„é“¾æŽ¥ä»Žé¡µé¢ä¸è¢«è§£æž(parse)å‡ºæ¥ï¼Œå®ƒæ‰€æŒ‡å‘çš„æ–‡æ¡£å°±å°†è‡ªåŠ¨èŽ·å¾—ä¸€ä¸ªdocIDã€‚å»ºç«‹ç´¢å¼•çš„ä»»åŠ¡åˆ™äº¤ç»™ç´¢å¼•å™¨(Indexer)å’ŒæŽ’åºå™¨(Sorter)æ¥å®Œæˆã€‚Indexerä¾æ¬¡ä»ŽRepositoryä¸å–å‡ºæ–‡æ¡£ï¼Œå¯¹æ–‡æ¡£è§£åŽ‹ç¼©ï¼Œç„¶åŽå¯¹æ–‡

æ¡£è¿›è¡Œè§£æžã€‚éšåŽæ–‡æ¡£è¢«è§£æžä¸ºä¸€ç»„å‘½ä¸ã€‚åœ¨Googleä¸ï¼Œå‘½ä¸(hit)æ˜¯ä¸€ç§æ•°æ®ç»“æž„ï¼Œç”¨æ¥è®°å½•å•è¯åœ¨æ–‡ä¸æ¯ä¸€æ¬¡å‡ºçŽ°çš„ä¿¡æ¯ã€‚åœ¨å‘½ä¸ç»“æž„ä¸ï¼Œè®°å½•äº†æ¯ä¸ªè¯(word)ã€è¯åœ¨é¡µé¢ä¸çš„ä½ç½®ã€å¤§å°å†™ã€å—ä½“ç›¸å¯¹å¤§å°ç‰ä¿¡æ¯ã€‚è¿™æ ·ï¼Œæ¯ä¸ªè¯éƒ½æœ‰å¾ˆå¤šä¸åŒçš„å‘½ä¸ï¼Œè¿™äº›å‘½ä¸çš„ç»„åˆåˆç§°ä¸ºè¯¥è¯çš„å‘½ä¸åˆ—è¡¨(hit list)ã€‚ç´¢å¼•å™¨æŠŠè¿™äº›å‘½ä¸å†å†™å…¥åˆ°ä¸€ç»„æ¡¶(barrel) ä¸ï¼Œå¹¶å»ºç«‹ä¸€ä¸ªéƒ¨åˆ†æŽ’åºçš„å‰å™ç´¢å¼•(foward index)ã€‚ç´¢å¼•å™¨è¿˜åŒæ—¶æŠŠç½‘é¡µä¸æ‰€æœ‰çš„é“¾æŽ¥çš„é‡è¦ä¿¡æ¯è§£æžå‡ºæ¥ï¼Œå¹¶è®°å½•åˆ°ä¸€ä¸ªå«åšAnchorsçš„æ–‡ä»¶ä¸ã€‚è¯¥æ–‡ä»¶åŒ…å«äº†è¶³å¤Ÿå¤šçš„ä¿¡æ¯ï¼Œä»Žä¸å¯ä»¥æŸ¥è¯¢å‡ºæ¯ä¸€ä¸ªé“¾æŽ¥çš„æ¥æºã€æŒ‡å‘ä»¥åŠè¯¥é“¾æŽ¥çš„æ–‡æœ¬ã€‚

    ï¼ˆè¯‘æ³¨ï¼šç´¢å¼•å™¨è¿˜æŠŠè§£æžå‡ºçš„è¯å†™å…¥åˆ°ä¸€ä¸ªè¯å…¸(Lexiconä¸ï¼Œè¿™å°†åœ¨ä¸‹æ–‡ä¸æåˆ°ã€‚ï¼‰

     URL ResolveræœåŠ¡å™¨è´Ÿè´£ä»Ž Anchorsæ–‡ä»¶ä¸è¯»å–è¿™äº›é“¾æŽ¥ï¼ŒæŠŠç›¸å¯¹è·¯å¾„æ”¹ä¸ºç»å¯¹è·¯å¾„ï¼Œå†è½¬æ¢ä¸ºç›¸åº”çš„ docIDã€‚é€šè¿‡docIDçš„å…³è”ï¼Œé”šæ–‡æœ¬çš„ä¿¡æ¯ä¹Ÿè¢«åŠ å…¥åˆ°å‰åºç´¢å¼•çš„anchor hitç»“æž„ä¸ã€‚URL ResolveråŒæ—¶åˆ›å»ºäº†ä¸€ä¸ªLinksæ•°æ®åº“ï¼Œç”¨æ¥å˜æ”¾ä¸¤ä¸¤å¯¹åº”çš„docIDã€‚Linksæ•°æ®åº“è¢«ç”¨æ¥è®¡ç®—æ‰€æœ‰æ–‡æ¡£çš„PagePank ã€‚

     æŽ¥ç€æŽ’åºå™¨æŽ¥ç®¡è¿‡è¿™äº›æ¡¶ã€‚å¦‚å‰æ‰€è¿°ï¼Œè¿™äº›æ¡¶å·²ç»æŒ‰ç…§ docIDè¿›è¡Œäº†æŽ’åºã€‚æŽ’åºå™¨çš„ä¸»è¦ä»»åŠ¡æ˜¯æŒ‰ç…§WordIDé‡æ–°è¿›è¡ŒæŽ’åºï¼Œä»Žè€Œä¸ºè¿™äº›æ¡¶ç”Ÿæˆä¸€ä¸ªå€’æŽ’ç´¢å¼•(inverted index)ã€‚è¿™ä¸ªæ“ä½œæ˜¯åœ¨æ¯ä¸ªæ¡¶ä¸æ‰§è¡Œçš„ï¼Œæ‰€ä»¥åªéœ€è¦ç”¨åˆ°å¾ˆå°‘çš„ä¸´æ—¶ç©ºé—´ã€‚æŽ’åºå™¨è¿˜å»ºç«‹äº†ä¸€ä¸ªWordIDåˆ—è¡¨ï¼Œåˆ—è¡¨ä¸åŒæ—¶è®°å½•äº†è¯¥WordIDåœ¨å€’æŽ’ç´¢å¼•ä¸çš„åç§»é‡å¤§å°ã€‚æœ‰ä¸€ä¸ªå«åšDumpLexiconçš„å·¥å…·ï¼Œç”¨æ¥æŠŠwordIDå’Œä¸Šæ–‡ä¸æåˆ°çš„ç”±ç´¢å¼•å™¨äº§ç”Ÿçš„è¯å…¸ï¼ˆLexiconï¼‰ç›¸ç»“åˆï¼Œå¹¶äº§ç”Ÿä¸€ä¸ªæ–°çš„è¯å…¸ã€‚è¿™ä¸ªæ–°çš„è¯å…¸è¢«ç”¨åœ¨æœ€ç»ˆçš„æœç´¢ç¨‹åºä¸ï¼Œè¿žåŒPageRankå’Œå€’æŽ’åºç´¢å¼•ä¸€èµ·ï¼Œä¸ºç”¨æˆ·æä¾›æŸ¥è¯¢æœåŠ¡ã€‚

  4.2 æ•°æ®ç»“æž„
    Googleå¯¹æ•°æ®ç»“æž„è¿›è¡Œäº†å¾ˆå¤šä¼˜åŒ–ï¼Œå…¶ç›®çš„ä¸»è¦æ˜¯ä¸ºäº†æœ‰æ•ˆçš„å‡å°‘åœ¨å¤„ç†å¤§æ–‡æ¡£çš„æŠ“å–ã€ç´¢å¼•ä»¥åŠæŸ¥è¯¢æ—¶æ‰€éœ€è¦è€—è´¹çš„æˆæœ¬ã€‚è™½ç„¶è¿™äº›å¹´æ¥è®¡ç®—æœºçš„æ€§èƒ½å¾—åˆ°äº†å¾ˆå¤§çš„æ”¹å–„ï¼Œä½†å¯¹äºŽç£ç›˜çš„æ£€ç´¢ä»ç„¶éœ€è¦å¤§çº¦10msçš„æ—¶é—´æ¥å®Œæˆã€‚åŸºäºŽæ€§èƒ½çš„è€ƒè™‘ï¼ŒGoogleå°½å¯èƒ½åœ°é¿å…ä½¿ç”¨ç£ç›˜æ“ä½œï¼Œè€Œè¿™ä¸ªæƒ³æ³•ä¹Ÿå¾ˆå¤§çš„å½±å“äº†æ•°æ®ç»“æž„çš„è®¾è®¡æ€è·¯ã€‚

    4.2.1 å·¨åž‹æ–‡ä»¶ï¼ˆBigFileï¼‰
    å·¨åž‹æ–‡ä»¶ï¼ˆBigFileï¼‰è¢«è®¾è®¡æˆä¸ºè·¨è¶Šå¤šæ–‡ä»¶ç³»ç»Ÿåœ°ã€64ä½åœ°å€ç©ºé—´çš„è™šæ‹Ÿæ–‡ä»¶ï¼Œå¹¶èƒ½å¤Ÿåœ¨å¤šæ–‡ä»¶ç³»ç»Ÿä¸è‡ªåŠ¨è¿›è¡Œæ–‡ä»¶åˆ†é…ã€‚å› ä¸ºæ“ä½œç³»ç»Ÿä¸èƒ½ä¸ºæˆ‘ä»¬æä¾›æœ‰ç”¨çš„æ”¯æŒï¼Œå·¨åž‹æ–‡ä»¶åŒ…ï¼ˆBigFile packageï¼‰è¢«è®¾è®¡ç”¨æ¥è´Ÿè´£æ“ä½œæ–‡ä»¶æè¿°ç¬¦çš„åˆ›å»ºå’Œé”€æ¯ã€‚å¦å¤–ï¼Œå·¨åž‹æ–‡ä»¶ä¹Ÿæ”¯æŒä¸€äº›åˆæ¥çš„åŽ‹ç¼©å–§å“ã€‚

    4.2.2 æ•°æ®ä»“åº“ï¼ˆRepositoryï¼‰
    æ•°æ®ä»“åº“ï¼ˆRepositoryï¼‰ä¸ä¿å˜äº†æ¯ä¸€ä¸ªç½‘é¡µå®Œæ•´çš„HTMLä»£ç ã€‚ä¸ºäº†èŠ‚çœç©ºé—´ï¼Œé¡µé¢åœ¨å˜å‚¨å‰ä½¿ç”¨zlibæŠ€æœ¯è¿›è¡Œäº†åŽ‹ç¼©ã€‚åŽ‹ç¼©æŠ€æœ¯çš„é€‰æ‹©ç»¼åˆè€ƒè™‘äº†é€Ÿåº¦å’ŒåŽ‹ç¼©æ¯”çš„å› ç´ ã€‚å°½ç®¡bzipæŠ€æœ¯åœ¨åŽ‹ç¼©æ¯”æ–¹é¢æŠ€é«˜ä¸€ç¹ï¼ˆåŽ‹ç¼©æ¯”è¾¾åˆ°äº†4ï¼š1ï¼‰ï¼ŒGoogleè¿˜æ˜¯åŸºäºŽé€Ÿåº¦çš„è€ƒè™‘æœ€ç»ˆé€‰æ‹©äº†zlibï¼ˆåŽ‹ç¼©æ¯”åªæœ‰3ï¼š1ï¼‰ã€‚æ–‡æ¡£è®°å½•åœ¨æ•°æ®ä»“åº“ä¸é¡ºåºæŽ’åˆ—ï¼Œå¹¶ä»¥docIDã€lengthã€URLç‰ä½œä¸ºæ–‡æ¡£è®°å½•çš„å‰ç¼€ï¼Œå¦‚å›¾2æ‰€ç¤ºã€‚æ•°æ®ä»“åº“çš„è®¿é—®ä¸éœ€è¦ä½¿ç”¨ä»»ä½•å…¶ä»–çš„æ•°æ®ç»“æž„ï¼Œè¿™æ ·æœ‰åŠ©äºŽä¿æŒæ•°æ®çš„å®Œæ•´æ€§ï¼Œå¹¶ä¸”ä½¿å¾—å¼€å‘å˜å¾—æ›´ä¸ºå®¹æ˜“ã€‚

å›¾2

    4.2.3  æ–‡æ¡£ç´¢å¼•ï¼ˆDocument Indexï¼‰
    æ–‡æ¡£ç´¢å¼•ï¼ˆDocument Indexï¼‰ç”¨æ¥è·Ÿè¸ªæ¯ä¸€ä¸ªæ–‡æ¡£çš„ä¿¡æ¯ã€‚å®ƒæ˜¯ä¸€ç§å®šå®½çš„ISAMï¼ˆIndex sequential access modeï¼‰ç±»åž‹çš„ç´¢å¼•ï¼Œå¹¶æŒ‰ç…§æ–‡æ¡£çš„docIDè¿›è¡Œäº†æŽ’åºã€‚ç´¢å¼•ä¸çš„æ¯ä¸€é¡¹å˜å‚¨äº†å½“å‰æ–‡æ¡£çš„çŠ¶æ€ã€æŒ‡å‘æ•°æ®ä»“åº“çš„æŒ‡é’ˆã€æ–‡æ¡£æ ¡éªŒå’Œï¼Œä»¥åŠä¸€äº›ç»Ÿè®¡ä¿¡æ¯ã€‚å¦‚æžœæ–‡æ¡£è¢«çˆ¬è™«å–å›žï¼Œåˆ™è¯¥ç´¢å¼•é¡¹è¿˜å°†åŒ…å«ä¸€ä¸ªæŒ‡å‘docinfoæ–‡ä»¶çš„æŒ‡é’ˆã€‚docinfoæ–‡ä»¶åŒ…å«è¯¥æ–‡æ¡£çš„URLå’Œæ ‡é¢˜ï¼›å¦åˆ™ï¼Œè¿™ä¸ªæŒ‡é’ˆå°±è¢«æŒ‡å‘ä¸€ä¸ªä»…åŒ…å«ä¸€ç§æ¯”è¾ƒç´§å‡‘çš„æ•°æ®ç»“æž„ï¼Œä»¥åŠåœ¨ä¸€æ¬¡æœç´¢æ“ä½œä¸æŸ¥æ‰¾ä¸€æ¡ç£ç›˜è®°å½•çš„æ‰§è¡Œæ•ˆçŽ‡ã€‚

   å¦å¤–ï¼Œåœ¨è½¬æ¢URLsåˆ°docIDsæ—¶éœ€è¦ç”¨åˆ°ä¸€ä¸ªæ–‡ä»¶ã€‚è¿™ä¸ªæ–‡ä»¶å…¶å®žæ˜¯ä¸€ä¸ªåŒ…å«URLæ ¡éªŒå’Œï¼ˆchecksumï¼‰å’Œä¸Žå®ƒå¯¹åº”çš„docIDçš„åˆ—è¡¨ï¼Œå¹¶ä¸”æŒ‰ç…§checksumè¿›è¡ŒæŽ’åºã€‚é€šå¸¸ï¼Œæˆ‘ä»¬éœ€è¦æ ¹æ®URLæ¥æŸ¥æ‰¾æ–‡æ¡£çš„docIDã€‚è¿™æ—¶ï¼Œé¦–å…ˆè®¡ç®—å‡ºè¯¥URLçš„æ ¡éªŒå’Œï¼ˆchecksumï¼‰è¿›è¡ŒäºŒè¿›åˆ¶çš„æ£€ç´¢ï¼Œç„¶åŽæ ¹æ®æ£€ç´¢ç»“æžœæ‰¾åˆ°å…¶æ‰€å¯¹åº”çš„docIDã€‚å…¶å®žï¼ŒURL Resolveræ£æ˜¯ä½¿ç”¨è¿™ä¸ªåŠžæ³•æŠŠURLè½¬æ¢ä¸ºdocIDçš„ã€‚åœ¨è¿™é‡Œä½¿ç”¨æ‰¹å¤„ç†æ¨¡å¼å¾ˆæœ‰å¿…è¦ï¼Œå¦åˆ™å¯¹äºŽåŒ…å«322,000,000å„é“¾æŽ¥çš„æ•°æ®é›†æ¥è¯´ï¼Œè¦æ£€ç´¢æ‰€æœ‰çš„é“¾æŽ¥è‡³å°‘å¾—è€—è´¹æ•°æœˆä¹‹ä¹…ã€‚

    4.2.4 è¯å…¸ ï¼ˆLexiconï¼‰
ã€€ã€€è¯å…¸æœ‰å¥½å‡ ç§ä¸åŒçš„æ ¼å¼ï¼Žéšç€å†…å˜æˆæœ¬çš„ä¸‹é™ï¼ŒçŽ°åœ¨å¯ä»¥å®žçŽ°æŠŠè¯å…¸åµŒå…¥åˆ°å†…å˜ä¸è¿è¡Œï¼Œè¿™å°†å¯ä»¥å¤§å¤§æé«˜è¿è¡Œçš„æ•ˆçŽ‡ï¼Žåœ¨ä¸€ä¸ª256Mç”µè„‘çš„å†…å˜ä¸ï¼Œå¯ä»¥è¿è¡Œä¸€ä¸ªåŒ…å«14ï¼Œ000ï¼Œ000ä¸ªè¯æ±‡çš„è¯å…¸ã€‚è¯å…¸ç”±ä¸¤éƒ¨åˆ†æ¥å®žçŽ°ï¼šä¸€ä¸ªè¯åˆ—è¡¨ï¼ˆå½¼æ¤ä¹‹é—´ä»¥Nullåˆ†éš”)å’Œä¸€ä¸ªåŒ…å«æŒ‡é’ˆçš„å“ˆå¸Œè¡¨.

    4.2.5 å‘½ä¸åˆ—è¡¨ï¼ˆHit Listsï¼‰
    å‘½ä¸åˆ—è¡¨ï¼ˆhit listï¼‰å¯¹åº”äºŽæŸä¸ªç‰¹å®šçš„è¯åœ¨æŸä¸ªç‰¹å®šçš„æ–‡æ¡£ä¸ä¸€æ¬¡æˆ–å¤šæ¬¡çš„å‡ºçŽ°ï¼Œå®ƒä¸»è¦ç”¨æ¥è®°å½•è¯åœ¨æ–‡ä¸å‡ºçŽ°çš„ä½ç½®ã€å—ä½“ã€å¤§å°å†™ç‰ä¿¡æ¯ã€‚å‘½ä¸åˆ—è¡¨åœ¨å‰åºç´¢å¼•å’Œå€’æŽ’ç´¢å¼•ä¸éƒ½å æ®äº†ç»å¤§éƒ¨åˆ†çš„ç©ºé—´ã€‚å› æ¤ï¼Œå‘½ä¸åˆ—è¡¨éœ€è¦å°½å¯èƒ½åœ°ä»¥ä¸€ç§é«˜æ•ˆçŽ‡çš„æ–¹å¼æ¥å®žçŽ°ã€‚æœ‰å‡ ä¸ªå¯ä»¥ç”¨æ¥å‚è€ƒçš„ç¼–ç æ–¹æ¡ˆï¼šä¸€ä¸ªæ˜¯ç®€å•ç¼–ç æ–¹å¼ï¼ˆä¸‰ä½æ•´æ•°æ³•ï¼‰ï¼Œç¬¬äºŒæ˜¯åŽ‹ç¼©ç¼–ç æ–¹å¼ï¼ˆå¯¹ä½çš„åˆ†é…è¿›è¡Œæ‰‹å·¥ä¼˜åŒ–ï¼‰ï¼Œæœ€åŽä¸€ç§æ˜¯æœ‰åçš„éœå¤«æ›¼ç¼–ç æ–¹å¼ã€‚Googleåœ¨æƒè¡¡äº†ç©ºé—´çš„å ç”¨é‡ä»¥åŠå¯¹äºŽä½æ“ä½œçš„å¤æ‚æ€§ä¹‹åŽï¼Œé€‰æ‹©äº†ç¬¬äºŒç§åŽ‹ç¼©ç¼–ç æ–¹æ¡ˆã€‚å‘½ä¸çš„å®žçŽ°ç»†èŠ‚ï¼Œå‚è§å›¾3

å›¾3ã€‚

    åœ¨è¿™ç§åŽ‹ç¼©ç¼–ç ä¸ï¼Œæ¯ä¸ªå‘½ä¸å ç”¨2ä¸ªå—èŠ‚çš„ç©ºé—´ã€‚å‘½ä¸åˆå¯ç»†åˆ†ä¸ºä¸¤ç§ç±»åž‹ï¼šç‰¹æ®Šå‘½ä¸ï¼ˆfancy hitï¼‰å’Œæ™®é€šå‘½ä¸ï¼ˆplain hitï¼‰ã€‚ç‰¹æ®Šå‘½ä¸ï¼ˆfancy hitï¼‰æ˜¯æŒ‡å‡ºçŽ°åœ¨URLã€é¡µé¢æ ‡é¢˜ã€é”šæ–‡æœ¬æˆ–è€…metaæ ‡ç¾ä¸çš„å‘½ä¸ï¼Œé™¤æ¤ä¹‹å¤–çš„å…¨éƒ¨å‘½ä¸éƒ½æ˜¯æ™®é€šå‘½ä¸ï¼ˆplain hitï¼‰ã€‚æ™®é€šå‘½ä¸ï¼ˆplain hitï¼‰åŒ…å«æ ‡è¯†å¤§å°å†™çš„ä½ï¼ˆ1ä½ï¼‰ã€å—ä½“å¤§å°ä½ã€ä»¥åŠ12ä½çš„ä¸ºä¹‹å¿ƒç³»ï¼ˆå¦‚æžœåœ¨æ–‡æ¡£ä¸çš„ä½ç½®å¤§äºŽ4095ï¼Œåˆ™ä¸€å¾‹ä»¥4096è¡¨ç¤ºï¼‰ã€‚å—ä½“å¤§å°æ˜¯å—ä½“åœ¨æ–‡æ¡£ä¸çš„ç›¸å¯¹å¤§å°ï¼Œç”¨3ä½æ¥è¡¨ç¤ºã€‚å—ä½“å¤§å°åªä½¿ç”¨ä»Ž000åˆ°110è¿™ä¸ƒä¸ªæ•°ï¼Œ111è¢«ç”¨æ¥å•ç‹¬è¡¨ç¤ºä¸€ä¸ªç‰¹æ®Šå‘½ä¸ï¼ˆfancy hitï¼‰ã€‚ç‰¹æ®Šå‘½ä¸ï¼ˆfancy hitï¼‰ä¹ŸåŒ…å«ä¸€ä¸ªå¤§å°å†™çš„ä½ï¼ˆ1ä½ï¼‰ã€å—ä½“å¤§å°ï¼ˆè®¾ä¸º7=111ï¼‰ã€4ä½çš„ç±»åž‹ç¼–ç ã€ä»¥åŠ8ä½çš„ä½ç½®ä¿¡æ¯ã€‚å¯¹äºŽå‡ºçŽ°åœ¨é”šæ–‡æœ¬çš„å‘½ä¸ï¼ˆanchor hitï¼‰æ¥è¯´ï¼Œ8ä½çš„ä½ç½®ä¿¡æ¯åˆç»†åˆ†ä¸ºé”šä¸çš„ä½ç½®ä¿¡æ¯ï¼ˆ4ä½ï¼‰ä»¥åŠé”šæ‰€åœ¨çš„æ–‡æ¡£docIDçš„hashå€¼ï¼ˆ4ä½ï¼‰ã€‚è¿™æ ·ï¼Œåœ¨é’ˆå¯¹æŸäº›ç‰¹å®šçš„è¯è¿›è¡ŒæŸ¥è¯¢æ—¶ï¼Œå¦‚æžœæ‰¾ä¸åˆ°è¶³å¤Ÿçš„é“¾æŽ¥åŒ¹é…ï¼Œå°±å¯ä»¥ä»Žè¿™äº›anchor hitä¸æ‰¾ä¸€äº›æ¥è¡¥å……ã€‚ä»¥åŽï¼Œè€ƒè™‘åˆ°å¯¹äºŽä½ç½®ä¿¡æ¯å’ŒdocIDçš„å“ˆå¸Œå€¼å“ˆè¿˜ä¼šæœ‰æ›´å¤šçš„è§£å†³æ–¹æ¡ˆï¼Œanchor hitçš„å˜å‚¨æ–¹å¼å°†ä¼šæœ‰æ‰€æ”¹å˜ã€‚å¦å¤–ï¼ŒGoogleä¹‹æ‰€ä»¥ä½¿ç”¨å—ä½“çš„ç›¸å¯¹å¤§å°ï¼Œä¸»è¦æ˜¯è€ƒè™‘åˆ°åœ¨å¯¹æ–‡æ¡£è®¡ç®—çº§åˆ«æ—¶ï¼Œæˆ‘ä»¬ä¸èƒ½ä»…ä»…å› ä¸ºAæ–‡æ¡£ä½¿ç”¨äº†è¾ƒå¤§çš„å—ä½“å°±è¯´Aæ–‡æ¡£æ¯”Bæ–‡æ¡£çº§åˆ«é«˜ã€‚

    å‘½ä¸åˆ—è¡¨çš„é•¿åº¦ä¿å˜åœ¨å‘½ä¸åˆ—è¡¨çš„å‰é¢ã€‚ä¸ºäº†èŠ‚çœç©ºé—´ï¼Œé‡‡ç”¨äº†ä¸€äº›ç‰¹æ®Šçš„æŠ€å·§ï¼Œä»Žå‰åºç´¢å¼•çš„worldIDè‡ªæ®µå’ŒåŽæŽ’ç´¢å¼•çš„docIDå—æ®µä¸åˆ†åˆ«åŽ‹ç¼©å‡º8ä½å’Œ5ä½ç©ºé—´ï¼Œç”¨æ¥å˜å‚¨è¯¥é•¿åº¦å€¼ã€‚å¦‚æžœé•¿åº¦å€¼å‡ºçŽ°æº¢å‡ºï¼Œè¿™äº›ä½å°†ä½¿ç”¨ä¸€ä¸ªæº¢å‡ºç¬¦è¡¨ç¤ºï¼Œå¹¶åœ¨ç´§æŽ¥ç€çš„ä¸‹ä¸¤ä¸ªå—èŠ‚ä¸åŒ…å«å®žé™…çš„é•¿åº¦å€¼ã€‚

    4.2.6 å‰åºç´¢å¼• ï¼ˆForward indexï¼‰
    å‰åºç´¢å¼•å®žé™…å·²ç»ç»è¿‡éƒ¨åˆ†æŽ’åºã€‚å®ƒç”±è®¸å¤šä¸ªæ¡¶ç»„æˆï¼Œæ¯ä¸ªæ¡¶ä¸ä¿å˜ä¸€å®šèŒƒå›´çš„wordIDã€‚å¦‚æžœæŸç¯‡æ–‡æ¡£ä¸è¯å¯¹åº”åˆ°æŸä¸ªæ¡¶ä¸çš„wordIDï¼Œè¯¥æ–‡æ¡£çš„wordIDä¹Ÿä¼šè¢«è®°å½•åˆ°è¯¥æ¡¶ä¸ã€‚æ¯ä¸ªdocIDåŽé¢ç´§è·Ÿç€ä¸€ä¸ªå±žäºŽå®ƒçš„wordIDåˆ—è¡¨ï¼Œè€Œè¿™äº›åˆ—è¡¨ä¸æ¯ä¸ªwordIDçš„åŽé¢åˆç´§è·Ÿç€è¯¥wordçš„å‘½ä¸åˆ—è¡¨ã€‚

    å› ä¸ºå¤§é‡é‡å¤docIDçš„å˜åœ¨ï¼Œè¿™ç§å˜å‚¨æ–¹æ¡ˆä¹Ÿè®¸ä¼šå¸¦æ¥æ›´å¤§çš„ç©ºé—´éœ€æ±‚ã€‚ä½†æ˜¯ç”±äºŽç´¢å¼•è¢«åˆ†æ•£åœ¨è®¸å¤šä¸ªæ¡¶ä¸ï¼Œè€Œä¸”è¿™ç§è®¾è®¡åœ¨æœ€åŽç”±æŽ’åºå™¨æ‰§è¡Œçš„çŸè¯ç´¢å¼•æ“ä½œä¸å¯ä»¥åˆç†åœ°èŠ‚çœæ—¶é—´ä¸Šçš„å¼€é”€ï¼Œå¹¶é™ä½Žäº†ç¼–ç¨‹çš„å¤æ‚åº¦ï¼Œæ‰€ä»¥ï¼Œç©ºé—´ä¸Šçš„è¿™ç‚¹æµªè´¹æ˜¯å®Œå…¨å¯ä»¥å®¹å¿çš„ã€‚è€Œä¸”ï¼ŒwordIDä¸å˜å‚¨çš„å®žé™…ä¸Šæ˜¯WordIDä¸Žå…¶æ‰€åœ¨çš„æ¡¶ä¸çš„WordIDæœ€å°å€¼ä¹‹é—´è®¡ç®—å‡ºæ¥çš„ç›¸å¯¹å·®ã€‚è¿™æ ·ï¼ŒWordIDå°±åªéœ€è¦24ä½æ¥å˜å‚¨ï¼Œä½™ä¸‹çš„8ä½æ°å¥½å¯ä»¥è¢«ç”¨æ¥å˜å‚¨å‘½ä¸åˆ—è¡¨ä¸çš„é•¿åº¦ï¼ˆå‚è§ä¸Šæ–‡ï¼‰ã€‚

   4.2.7å€’æŽ’ç´¢å¼•ï¼ˆInverted Index)
   å’Œå‰åºç´¢å¼•ä¸€æ ·ï¼Œåˆ°æŽ’ç´¢å¼•ä¹Ÿæ˜¯ç”±åŒä¸€ç»„æ¡¶æ‰€ç»„æˆï¼Œåªæ˜¯è¿™äº›æ¡¶ç»è¿‡äº†æŽ’åºå™¨çš„è¿›ä¸€æ¥å¤„ç†ã€‚å¯¹äºŽæ¯ä¸€ä¸ªæœ‰æ•ˆçš„WordIDï¼Œè¯å…¸ä¸éƒ½ä¼šæœ‰ä¸€ä¸ªæŒ‡å‘åŒ…å«è¯¥WordIDçš„æ¡¶çš„æŒ‡é’ˆã€‚è¿™ä¸ªæŒ‡é’ˆæŒ‡å‘ä¸€ä¸ªdocIDçš„åˆ—è¡¨ï¼ˆdoclist),åˆ—è¡¨ä¸çš„æ¯ä¸€é¡¹éƒ½ç”±docIDå’Œè¯¥WordIDçš„å‘½ä¸åˆ—è¡¨ç»„æˆã€‚è¯¥WordIDæ‰€åœ¨çš„æ‰€æœ‰çš„æ–‡æ¡£çš„docIDéƒ½åŒ…å«åœ¨è¯¥doclistä¸.

   ä¸€ä¸ªé‡è¦çš„é—®é¢˜æ˜¯ï¼Œdoclitåˆ—è¡¨ä¸çš„docIDåº”è¯¥å¦‚ä½•æŽ’åºï¼Ÿä¸€ä¸ªæ¯”è¾ƒç®€å•çš„è§£å†³æ–¹æ¡ˆæ˜¯ç›´æŽ¥æ ¹æ®docIDæŽ’åºã€‚è¿™ç§æ–¹æ¡ˆåœ¨å¯¹å¤šå—è¯çš„å¤åˆæŸ¥è¯¢æ—¶ï¼Œå¯ä»¥å®žçŽ°å¤šä¸ªdoclistä¹‹é—´çš„å¿«é€Ÿå½’å¹¶ï¼ˆmerge)æ“ä½œã€‚å¦å¤–ä¸€ä¸ªå¤æ‚ä¸€ç‚¹çš„æ–¹æ¡ˆï¼Œæ˜¯æŒ‰ç…§wordåœ¨æ¯ç¯‡æ–‡æŒ¡ä¸å‡ºçŽ°çš„çº§åˆ«è¿›è¡ŒæŽ’åºã€‚

è¿™ç§æ”¾æ¡ˆå¯¹äºŽå•å—è¯çš„æŸ¥è¯¢ä½œç”¨ä¸å¤§ï¼Œä½†å¯¹äºŽå¤šå—è¯çš„æŸ¥è¯¢ï¼Œå¯ä»¥å®žçŽ°æŠŠæœ€è¿‘çš„æŸ¥è¯¢ç»“æžœæŽ’åˆ°å‰é¢ã€‚ä¸¤ç§æ–¹æ¡ˆå„æœ‰è‡ªå·±çš„ä¸è¶³ã€‚é¦–å…ˆï¼Œå½’å¹¶æ“ä½œå…·æœ‰ä¸€å®šçš„éš¾åº¦ï¼›è€Œçº§åˆ«è®¡ç®—å‡½æ•°çš„æ¯ä¸€æ¬¡æ”¹å˜éƒ½å¯èƒ½éœ€è¦å¯¹ç´¢å¼•è¿›è¡Œé‡å»ºï¼Œç€æ— ç–‘ä¼šç»™å¼€å‘å·¥ä½œå¢žåŠ æ–°çš„éš¾åº¦ã€‚æ‰€ä»¥ï¼Œæœ‰å¿…è¦é‡‡å–ä¸€ç§æŠ˜ä¸çš„æ–¹æ¡ˆã€‚åœ¨è¿™ä¸ªæ–¹æ¡ˆä¸ï¼Œä¿æŒä¸¤ç»„æŽ’åºçš„æ¡¶ï¼Œå…¶ä¸ä¸€ç»„ç”¨æ¥åŒ…å«åœ¨æ ‡é¢˜æˆ–é”šæ–‡æœ¬ä¸å‡ºçŽ°çš„å‘½ä¸åˆ—è¡¨ï¼Œå¦ä¸€ç»„åˆ™åŒ…å«æ‰€æœ‰çš„å‘½ä¸åˆ—è¡¨ã€‚é¦–å…ˆï¼ŒæŸ¥è¯¢ç¬¬ä¸€ç»„æ¡¶ï¼ˆshort barrel)ä¸è¿›è¡Œï¼›å¦‚æžœæ‰¾ä¸åˆ°è¶³å¤Ÿçš„åŒ¹é…ï¼Œåˆ™è½¬åˆ°å¦ä¸€ç»„æ¡¶ï¼ˆfull barrel)ä¸ç»§ç»æŸ¥æ‰¾ã€‚

  4.3 Webçˆ¬è¡ŒæŠ€æœ¯ï¼ˆCrawling the Web)
ã€€ã€€äº‹å®žä¸Šï¼Œåœ¨Webä¸Šè¿è¡Œä¸€ä¸ªç½‘ç»œçˆ¬è™«ï¼ˆcrawler)çš„å·¥ä½œé¢‡å…·æŒ‘æˆ˜æ€§ã€‚è¿™ä¸ä»…å…¼é¡¾æ£˜æ‰‹çš„æ€§èƒ½å’Œå¯é æ€§å› ç´ ä¹‹å¤–ï¼Œæ›´é‡è¦çš„ï¼Œè¿˜éœ€è¦è€ƒè™‘ä¸€äº›ç¤¾ä¼šå› ç´ ã€‚ç”±äºŽéœ€è¦å®žæ—¶çš„å’Œæˆåƒä¸Šä¸‡å°çŠ¶æ€ä¸å¯æŽ§çš„WebæœåŠ¡å™¨è¿›è¡Œäº¤äº’ï¼ŒWebçˆ¬è¡ŒæŠ€æœ¯ä¹Ÿæžå®¹æ˜“å´©æºƒã€‚

    ä¸ºäº†æ›´å¥½çš„é€‚åº”Webä¸Šæ•°ä»¥åƒäº¿çš„ç½‘é¡µæ•°é‡ï¼ŒGoogleé‡‡ç”¨äº†ä¸€ç§åˆ†å¸ƒå¼çš„Webçˆ¬è¡Œç³»ç»Ÿï¼Œç”±äºŽURL serverè´Ÿè´£æŠŠURLéœ€æ±‚æäº¤ç»™è‹¥å¹²ä¸ªçˆ¬è™«è½¯ä»¶è¿›è¡Œå¤„ç†ã€‚éœ€è¦è¯´æ˜Žçš„æ˜¯ï¼ŒURLServerä»¥åŠçˆ¬è™«éƒ½æ˜¯ç”¨Pythonè¯è¨€å®žçŽ°çš„ã€‚æ¯ä¸ªçˆ¬è™«ä¸€æ¬¡å¯ä»¥åŒæ—¶æ‰“å¼€å¤§çº¦300ä¸ªè¿žæŽ¥çº¿ç¨‹ï¼Œè¿™æ ·ï¼Œç½‘é¡µçˆ¬è¡Œè¶³ä»¥ä¿æŒä¸€ä¸ªè¶³å¤Ÿå¿«çš„è¿›åº¦ã€‚å‡å¦‚ä½¿ç”¨4ä¸ªcrawlerï¼Œç³»ç»Ÿå°±å¯ä»¥å®žçŽ°æœ€å¿«æ¯ç§’æŠ“å–è¶…è¿‡100ä¸ªé¡µé¢ï¼Œä¹Ÿå°±æ˜¯å¤§çº¦600k/ç§’çš„æ•°æ®æµã€‚æ€§èƒ½ä¸Šçš„å½±å“ä¸»è¦æ¥è‡ªå¯¹äºŽDNSï¼ˆåŸŸåæœåŠ¡ï¼‰çš„æŸ¥è¯¢ï¼Œå› æ¤ï¼Œæ¯ä¸ªçˆ¬è™«éƒ½é…æœ‰ä¸€ä¸ªå•ç‹¬çš„DNSé«˜é€Ÿcacheï¼Œè¿™æ ·å¯ä»¥æœ‰æ•ˆçš„é¿å…å½±å“æ•ˆçŽ‡çš„DNSæŸ¥è¯¢ã€‚çˆ¬è™«æ‹¥æœ‰çš„çº¿ç¨‹åˆ†ä¸ºä¸‹åˆ—å‡ ç§çŠ¶æ€ï¼šDNSæŸ¥è¯¢é˜¶æ®µï¼Œæ£åœ¨è¿žæŽ¥ä¸»æœºï¼Œå‘é€è¯·æ±‚é˜¶æ®µï¼Œä»¥åŠå¤„ç†æœåŠ¡å™¨å“åº”è¿‡ç¨‹ã€‚ä¾æ®çŠ¶æ€çš„ä¸åŒï¼Œçº¿ç¨‹è¢«åˆ†åˆ«æ”¾åœ¨ä¸åŒçš„é˜Ÿåˆ—ä¸ã€‚å½“çº¿ç¨‹çš„çŠ¶æ€å‘ç”Ÿæ”¹å˜æ—¶ï¼Œå¼‚æ¥IOçš„æ–¹å¼è¢«ç”¨æ¥å‘å‡ºäº‹ä»¶é€šçŸ¥ï¼ŒåŒæ—¶çº¿ç¨‹è¢«è½¬ç§»åˆ°å¦ä¸€ä¸ªç›¸å…³é˜Ÿåˆ—ä¸ã€‚

   äº‹å®žä¸Šï¼Œç”±äºŽé¢å¯¹å¦‚æ¤å·¨å¤§çš„æ•°æ®å¤„ç†ï¼Œæ€»ä¼šæœ‰ä¸€äº›éš¾ä»¥é¢„æ–™çš„äº‹æƒ…å‘ç”Ÿã€‚ä¸¾ä¸ªä¾‹åæ¥è¯´ï¼Œå¦‚æžœçˆ¬è™«è¯•å›¾å¤„ç†çš„é“¾æŽ¥æ˜¯ä¸€ä¸ªåœ¨çº¿æ¸¸æˆï¼Œé‚£ä¼šå‡ºçŽ°ä»€ä¹ˆæƒ…å†µï¼Ÿæƒ…å†µçš„ç¡®å¾ˆç³Ÿï¼Œè‡ªä½œèªæ˜Žçš„çˆ¬è™«å°†å–å›žå¤§é‡çš„åžƒåœ¾é¡µé¢ï¼Œè€Œå½“ä½ å‘çŽ°é—®é¢˜å¹¶è¯•å›¾å¤„ç†æ—¶ï¼Œä½ å°†é¢å¯¹çš„æ˜¯æ•°ä»¥åƒä¸‡è®¡çš„å·²ç»è¢«ä¸‹è½½çš„ç½‘é¡µã€‚çœ‹æ¥ï¼Œæœ‰äº›å¯¼è‡´é”™è¯¯çš„å› ç´ ä¹Ÿè®¸æ ¹æœ¬æ˜¯æ— æ³•é¢„æµ‹çš„ã€‚ç³»ç»Ÿå¿…é¡»ç»è¿‡è®¤çœŸçš„æµ‹è¯•ã€‚ç„¶è€Œï¼ŒInternetå¦‚æ¤ä¹‹å¤§ï¼Œæµ‹è¯•å·¥ä½œä»Žä½•å¼€å§‹ï¼Ÿè¿™ä¸ªæ—¶å€™ï¼Œåˆç†å¤„ç†ç”¨æˆ·çš„åé¦ˆä¿¡æ¯æ˜¾å¾—å°¤ä¸ºé‡è¦ã€‚

  4.4 Webç´¢å¼•æŠ€æœ¯ï¼ˆIndexing the Web)
       è§£æžæŠ€æœ¯ï¼ˆParsing)--ä»»ä½•ä¸€ç§ä¸ºWebè®¾è®¡çš„è§£æžæŠ€æœ¯å¿…é¡»èƒ½å¤Ÿæœ‰æ•ˆå¤„ç†å„ç§å„æ ·å¯èƒ½å‡ºçŽ°çš„é”™è¯¯ï¼ŒåŒ…æ‹¬HTMLæ ‡ç¾çš„æ‹¼å†™é”™è¯¯ï¼Œæ ‡ç¾å®šä¹‰ä¸ç¼ºå°‘çš„ç©ºæ ¼ï¼ŒéžASCIIå—ç¬¦ï¼Œé”™è¯¯åµŒå¥—çš„HTMLæ ‡ç¾ä»¥åŠå½¢å½¢è‰²è‰²çš„å…¶å®ƒé”™è¯¯ç±»åž‹ã€‚è¿™äº›é”™è¯¯éƒ½åœ¨æŒ‘æˆ˜ç€è®¾è®¡è€…çš„æƒ³è±¡åŠ›ï¼Œä¿ƒä½¿ä»–ä»¬æ‹¿å‡ºåˆ›é€ æ€§çš„è®¾è®¡æ–¹æ¡ˆã€‚è€ƒè™‘åˆ°é€Ÿåº¦çš„æœ€å¤§åŒ–ï¼ŒGoogleæ²¡æœ‰é‡‡ç”¨ç”±YACCæ¥äº§ç”ŸCFGè§£æžå™¨çš„åšæ³•ï¼Œè€Œä½¿ç”¨Flexï¼ˆä¸€ç§å¿«é€Ÿçš„è¯å…¸åˆ†æžå™¨åˆ¶ä½œå·¥å…·ï¼‰è®¾è®¡äº†ä¸€ä¸ªå…·æœ‰è‡ªå·±å †æ ˆçš„è¯å…¸åˆ†æžå™¨ã€‚å½“ç„¶ï¼Œåˆ†æžå™¨å¿…é¡»åŒæ—¶å®žçŽ°ç¨³å®šæ€§å’Œé«˜é€Ÿåº¦çš„è¦æ±‚ã€‚

      æ–‡æ¡£çš„å“ˆå¸Œç´¢å¼•ï¼ˆIndexing Documents into Barrels)--æ–‡æ¡£è¢«è§£æžä¹‹åŽï¼Œå°±ä¼šè¢«ç¼–ç å¹¶æ”¾å…¥æœ‰è®¸å¤šæ¡¶ç»„æˆçš„å“ˆå¸Œè¡¨ä¸ã€‚æ–‡æ¡£ä¸çš„æ¯ä¸€ä¸ªè¯ï¼Œé€šè¿‡æ£€ç´¢åœ¨å†…å˜ä¸è¿è¡Œçš„è¯å…¸å“ˆå¸Œè¡¨ï¼Œè¢«æ˜ å°„æˆå…¶æ‰€å¯¹åº”çš„WordIDã€‚è¯å…¸ä¸æ²¡æœ‰çš„è¯è¢«çºªå½•åˆ°ä¸€ä¸ªæ—¥å¿—æ–‡ä»¶ä¸ã€‚å½“ä¸€ä¸ªwordè¢«æ˜ å°„æˆWordIDæ—¶ï¼Œå®ƒåœ¨å½“å‰æ–‡æ¡£ä¸çš„å‡ºçŽ°ä¿¡æ¯å°†è¢«åŒæ—¶æž„é€ æˆç›¸åº”çš„å‘½ä¸åˆ—è¡¨ï¼Œç„¶åŽå‘½ä¸åˆ—è¡¨è¢«çºªå½•åˆ°å‰åºç´¢å¼•ç›¸å¯¹åº”çš„æ¡¶ä¸ã€‚åœ¨è¿™ä¸ªè¿‡ç¨‹ä¸ï¼Œè¯å…¸å¿…é¡»è¢«å…±äº«ï¼Œæ‰€ä»¥å¦‚ä½•è§£å†³ç´¢å¼•é˜¶æ®µçš„å¹¶å‘æ“ä½œé—®é¢˜æˆä¸ºä¸€ä¸ªéš¾é¢˜ã€‚æœ‰ä¸€ä¸ªæ–¹æ¡ˆï¼Œå¯ä»¥é¿å…è¯å…¸çš„å…±äº«ã€‚åœ¨è¿™ä¸ªæ–¹æ¡ˆä¸ï¼Œä½¿ç”¨ä¸€ä¸ªåŸºè¯å…¸ï¼Œå…¶ä¸å›ºå®šä½¿ç”¨å¤§çº¦14ï¼Œ000ï¼Œ000ä¸ªè¯ã€‚æ‰©å¢žçš„è¯éƒ½å†™å…¥åˆ°æ—¥å¿—ä¸ã€‚è¿™æ ·ï¼Œå¤šæ„Ÿç´¢å¼•å™¨å°±å¯ä»¥å¹¶å‘çš„æ‰§è¡Œï¼Œè€ŒæŠŠè¿™ä¸ªåŒ…å«æ‰©å¢žè¯æ±‡çš„æ—¥å¿—æ–‡ä»¶äº¤ç»™æœ€åŽå‰©ä¸‹çš„ä¸€ä¸ªç´¢å¼•å™¨å¤„ç†å°±å¤Ÿäº†ã€‚

      æŽ’åºæŠ€æœ¯ï¼ˆSorting)--ä¸ºäº†å»ºç«‹å€’æŽ’ç´¢å¼•ï¼ŒæŽ’åºæŽ’åºå™¨æŽ¥ç®¡è¿‡å‰å™ç´¢å¼•ä¸çš„æ¡¶ï¼Œå¹¶æŒ‰ç…§WordIDè¿›è¡Œé‡æ–°æŽ’åºï¼Œä»Žè€Œäº§ç”Ÿäº†ä¸¤ç»„å€’æŽ’åºçš„æ¡¶ï¼šä¸€ç»„æ˜¯å¯¹äºŽæ ‡é¢˜å’Œé”šå‘½ä¸çš„å€’æŽ’åºç´¢å¼•ï¼ˆshort barrle),ä¸€ç»„æ˜¯å¯¹äºŽæ‰€æœ‰å‘½ä¸åˆ—è¡¨çš„å€’æŽ’åºç´¢å¼•ï¼ˆfull barrle)ã€‚ç”±äºŽæŽ’åºçš„è¿‡ç¨‹æ¯æ¬¡ä»…å†ä¸€ä¸ªæ¡¶ä¸è¿›è¡Œï¼Œæ‰€ä»¥åªéœ€è¦å¾ˆå°‘çš„ä¸´æ—¶ç©ºé—´ã€‚å¦å¤–ï¼ŒæŽ’åºçš„é˜¶æ®µè¢«å°½å¯èƒ½å¤šçš„åˆ†æ´¾åˆ°å¤šå°è®¡ç®—æœºä¸Šè¿è¡Œï¼Œè¿™æ ·ï¼Œå¤šä¸ªæŽ’åºå™¨å°±å¯ä»¥å¹¶è¡Œå¤„ç†å¤šä¸ªä¸åŒçš„bucketã€‚å› ä¸ºæ…ä¸é€‚åˆè¢«æ”¾å…¥å†…å˜ä¸è¿è¡Œï¼ŒæŽ’åºå™¨ä¾¿æŠŠå®ƒç»†åˆ†ä¸ºä¸€ç³»åˆ—é€‚åˆæ”¾è¿›å†…å˜ä¸çš„bucketï¼Œè¿™äº›bucketæ˜¯åŸºäºŽWordIDå’ŒdocIDçš„ã€‚ç„¶åŽï¼ŒæŽ’åºå™¨æŠŠæ¯ä¸€ä¸ªbucketåŠ è½½åˆ°å†…å˜ä¸ï¼Œå¹¶æ‰§è¡ŒæŽ’åºï¼Œæœ€åŽæŠŠå®ƒçš„å†…å®¹åˆ†åˆ«å†™å…¥åˆ°short barrleå’Œfull barrleè¿™ä¸¤ç»„å€’æŽ’çš„æ¡¶ä¸ã€‚

  4.5 æœç´¢æŠ€æœ¯ï¼ˆSearching)
    èƒ½å¤Ÿé«˜æ•ˆåœ°æä¾›é«˜è´¨é‡çš„æœç´¢ç»“æžœï¼Œæ˜¯æ¯ä¸€ä¸ªæœç´¢æŠ€æœ¯çš„æœ€ç»ˆç›®æ ‡ã€‚å¾ˆå¤šå¤§åž‹çš„å•†ä¸šåŒ–æœç´¢å¼•æ“Žå·²ç»åœ¨æ‰§è¡Œæ•ˆçŽ‡æ–¹é¢å–å¾—äº†å¾ˆå¤§çš„è¿›æ¥ã€‚æ‰€ä»¥Googleå°±æŠŠæ›´å¤šçš„ç²¾åŠ›æŠ•æ”¾åˆ°æœç´¢ç»“æžœçš„è´¨é‡ç ”ç©¶ä¸Šæ¥ã€‚å½“ç„¶ï¼ŒGoogleçš„æ‰§è¡Œæ•ˆçŽ‡åŒå•†ä¸šåŒ–çš„æœç´¢å¼•æ“Žç›¸æ¯”åŒæ ·æ¯«ä¸é€Šè‰²ã€‚

Googleçš„æœç´¢è¿‡ç¨‹å¦‚ä¸‹ã€‚

    1.è§£æžæŸ¥è¯¢å—ç¬¦ä¸²ï¼›
    2.æŠŠwordæ˜ å°„æˆwordIDï¼›
    3.å¯¹æ¯ä¸€ä¸ªwordï¼Œé¦–å…ˆä»Žshort barrelä¸doclistçš„å¼€å¤´è¿›è¡Œæ£€ç´¢ï¼›
    4.éåŽ†æ•´ä¸ªdoclistç›´åˆ°å‘çŽ°æœ‰ä¸€ä¸ªæ–‡æ¡£èƒ½å¤ŸåŒ¹é…æ‰€æœ‰çš„æœç´¢é¡¹ç›®ï¼›
    5.ä¸ºæ¤æŸ¥è¯¢è®¡ç®—æ–‡æ¡£çš„çº§åˆ«ï¼›
    6.å¦‚æžœåˆ°äº†short barrelä¸doclistçš„ç»“å°¾ï¼Œåˆ™ä»Žfull barrelä¸doclistçš„å¼€å¤´ç»§ç»è¿›è¡Œæ£€ç´¢ï¼Œå¹¶è·³è½¬åˆ°æ¥éª¤4ï¼›
    7.å¦‚æžœæ²¡æœ‰åˆ°è¾¾doclistçš„ç»“å°¾ï¼Œè·³è½¬åˆ°æ¥éª¤4ï¼›
    8.å¯¹æ‰€æœ‰é€šè¿‡rankåŒ¹é…çš„æ–‡æ¡£è¿›è¡ŒæŽ’åºï¼Œå¹¶è¿”å›žå‰Kä¸ªæŸ¥è¯¢ç»“æžœã€‚

    ä¸ºäº†æŽ§åˆ¶å“åº”æ—¶é—´ï¼Œä¸€æ—¦åŒ¹é…çš„æ–‡æ¡£æ•°ç›®è¾¾åˆ°æŸä¸ªæŒ‡å®šçš„å€¼ï¼ˆä¾‹å¦‚40ï¼Œ000ï¼‰ï¼Œå¦‚å›¾4æ‰€ç¤ºï¼Œæœç´¢å™¨å°±ç›´æŽ¥è·³è½¬åˆ°ç¬¬8æ¥ã€‚è¿™å°±æ„å‘³ç€å¯èƒ½æœ‰ä¸€äº›æ²¡æœ‰å®Œå…¨ä¼˜åŒ–çš„æŸ¥è¯¢ç»“æžœè¢«è¿”å›žã€‚å°½ç®¡å¦‚æ¤ï¼ŒPageRankæŠ€æœ¯çš„å˜åœ¨æœ‰æ•ˆåœ°æ”¹å–„äº†è¿™ç§çŠ¶å†µã€‚

    4.5.1çº§åˆ«å®¡å®šç³»ç»Ÿ(The Panking System)
    ä¸Žå…¶å®ƒçš„æœç´¢å¼•æ“Žç›¸æ¯”ï¼ŒGoogleåˆ©ç”¨äº†æ›´å¤šçš„Webæ–‡æ¡£æ‰€æä¾›çš„ä¿¡æ¯ã€‚æ¯ä¸€ä¸ªå‘½ä¸åˆ—è¡¨çºªå½•äº†è¯çš„ä½ç½®ã€å—ä½“ã€å¤§å°å†™ç‰ä¿¡æ¯ã€‚å¦å¤–,åŒ…å«åœ¨é”šæ–‡æœ¬ä¸çš„å‘½ä¸å’Œæ–‡å…šçš„PageRankä¸€æ ·è¢«Googleæ‰€å…³æ³¨ã€‚è¦æŠŠæ‰€æœ‰è¿™äº›ä¿¡æ¯éƒ½ç»¼åˆèµ·æ¥ç»™å‡ºä¸€ä¸ªé¡µé¢çš„çº§åˆ«æœ‰ç‚¹éš¾åº¦ï¼Œçº§åˆ«åˆ¤å®šåŠŸèƒ½å¿…å®šè¢«è®¾è®¡æˆä¸ä¼šå—åˆ°ä»»ä½•ä¸ªåˆ«å› ç´ çš„å½±å“ã€‚

    é¦–å…ˆè€ƒè™‘ä¸€ç§æœ€ç®€å•çš„æƒ…å†µ--å•è¯æŸ¥è¯¢ã€‚ä¸ºäº†åœ¨å•è¯æ±‡æŸ¥è¯¢ä¸è®¡ç®—å‡ºä¸€ä¸ªæ–‡æ¡£çš„çº§åˆ«ï¼ŒGoogleé¦–å…ˆåˆ†æžè¯¥è¯æ±‡åœ¨è¿™ä¸ªæ–‡æ¡£ä¸çš„å‘½ä¸åˆ—è¡¨ã€‚Googleä¸ºæ¯ä¸€ä¸ªå‘½ä¸å®šä¹‰äº†ä»¥ä¸‹å‡ ç§ä¸åŒçš„ç±»åž‹ï¼šæ ‡é¢˜ã€é”šã€URLã€æ™®é€šçš„å¤§å—ä½“æ–‡æœ¬ã€æ™®é€šçš„å°å—ä½“æ–‡æœ¬ ï¼Œæ¯ä¸€ç§ç±»åž‹éƒ½æœ‰è‡ªå·±çš„ç±»åž‹æƒé‡ï¼ˆtype-weight).GoogleæŠŠå‘½ä¸çš„ç±»åž‹æƒé‡ç»„åˆåˆ°ä¸€èµ·å½¢æˆä¸€ä¸ªä»¥ç±»åž‹ä¸ºç´¢å¼•çš„å‘é‡ï¼ŒæŽ¥ç€ç»Ÿè®¡å‡ºå‘½ä¸åˆ—è¡¨ä¸æ¯ä¸€ç§ç±»åž‹çš„å‘½ä¸æ‰€å çš„æ•°é‡ã€‚æ¯ä¸€ä¸ªè®¡æ•°å€¼åˆè¢«è½¬æ¢ä¸ºä¸€ä¸ªè®¡æ•°æƒé‡ï¼ˆcount-weight)ï¼Œè®¡æ•°æƒé‡éšè®¡æ•°å€¼å‘ˆçº¿æ€§å¢žé•¿ï¼Œåˆ°è¾¾æŸä¸ªè®¡æ•°å€¼ä¹‹åŽå°±ä¼šè¶‹äºŽåœæ¢ã€‚æœ€åŽï¼ŒæŠŠç±»åž‹æƒé‡ç»„æˆå‘é‡å’Œè®¡æ•°æƒé‡ç»„æˆçš„å‘é‡è¿›è¡Œç‚¹ä¹˜å¾—åˆ°çš„çŸ¢é‡ç§¯ä½œä¸ºè¯¥æ–‡æ¡£çš„IRåˆ†å€¼ã€‚IRåˆ†å€¼å’ŒPageRankå†è¿›è¡Œç»„åˆä»Žè€Œå¾—å‡ºæ–‡æ¡£æœ€ç»ˆçš„çº§åˆ«ã€‚

   å¯¹äºŽå¤šè¯æ±‡çš„æŸ¥è¯¢ï¼Œæƒ…å†µå˜å¾—æ›´åŠ å¤æ‚ã€‚å¤šä¸ªå‘½ä¸åˆ—è¡¨éœ€è¦è¢«åŒæ¥åˆ†æžï¼Œåœ¨æ–‡æ¡£ä¸å‡ºçŽ°ä½ç½®æ¯”è¾ƒé è¿‘çš„å‘½ä¸å°±ä¼šæ¯”ä½ç½®ç¦»çš„æ•™è¿œçš„å‘½ä¸å…·æœ‰è¾ƒé«˜çš„æƒé‡ã€‚å¤šä¸ªå‘½ä¸åˆ—è¡¨ä¸çš„å‘½ä¸è¢«ç»¼åˆåˆ°ä¸€èµ·ä¸€ä½¿å¾—é‚»è¿‘çš„å‘½ä¸æœ€ç»ˆè¢«åˆ†é…åˆ°ä¸€èµ·ã€‚å¯¹äºŽæ¯ä¸€ç»„ç»è¿‡åŒ¹é…çš„å‘½ä¸ï¼Œä»–ä»¬ä¹‹é—´çš„ç›¸ä¼¼åº¦ï¼ˆproximity)æŽ¥ç€è¢«è®¡ç®—å‡ºæ¥ã€‚ç›¸ä¼¼åº¦åŸºäºŽå‘½ä¸çš„æ–‡æ¡£ï¼ˆæˆ–é”šï¼‰ä¸è·ç¦»çš„è¿œè¿‘ï¼Œå¹¶ä¸”è¢«åˆ’åˆ†ä¸º10ä¸ªä¸åŒçš„å€¼â€œbinsâ€ï¼Œè¿™äº›binsçš„èŒƒå›´è¢«å®šä¹‰ä¸ºä»ŽçŸè¯åŒ¹é…ï¼ˆphrase match)åˆ°æ ¹æœ¬ä¸åŒ¹é…ï¼ˆnot even close).é™¤äº†å¯¹æ¯ä¸€ç§ç±»åž‹çš„å‘½ä¸è¿›è¡Œè®¡æ•°ä¹‹å¤–ï¼ŒåŒæ—¶ä¹Ÿå¯¹æ¯ä¸€ç§ç±»åž‹å’Œç›¸ä¼¼åº¦è¿›è¡Œè®¡æ•°ã€‚æ¯ä¸€å¯¹ç±»åž‹å’Œç›¸ä¼¼åº¦çš„ç»„åˆç§°ä½œä¸€ä¸ªç±»åž‹ç›¸ä¼¼åº¦æƒé‡ï¼ˆtype-prox-weight),å‘½ä¸çš„è®¡æ•°åˆ™è¢«è½¬æ¢ä¸ºè®¡æ•°æƒé‡ã€‚æœ€åŽï¼ŒæŠŠè®¡æ•°æƒé‡ç»„æˆçš„å‘é‡å’Œç±»åž‹ç›¸ä¼¼åº¦æƒé‡ç»„æˆçš„å‘é‡è¿›è¡Œç‚¹ä¹˜ä¹Ÿå¾—åˆ°ä¸€ä¸ªIRåˆ†å€¼ã€‚åœ¨Googleçš„ä¸€ç§ç‰¹æ®Šçš„è°ƒè¯•æ¨¡å¼ä¸ï¼Œè¿™äº›æ•°å—å’ŒçŸ©é˜µå¯ä»¥éšæŸ¥è¯¢ç»“æžœä¸€åŒæ˜¾ç¤ºï¼Œè¿™å°†ä¸ºçº§åˆ«å®¡å®šç³»ç»Ÿçš„å¼€å‘å·¥ä½œå¸¦æ¥å¾ˆå¤§çš„å¸®åŠ©ã€‚

     è¯‘è€…åŽè®°
    å‰ä¸ä¹…è¯»åˆ°ä¸€ç¯‡æ–‡ç« ï¼Œã€ŠGoogleæœç´¢å¼•æ“Žç®—æ³•çš„ç§˜å¯†ã€‹ï¼ˆã€Šç¨‹åºå‘˜ã€‹åˆè®¢æœ¬2002ä¸‹ï¼‰ã€‚è¯»å®ŒåŽå¯¹Googleçš„æ•°æ®å¤„ç†æœ‰äº†åˆæ¥çš„äº†è§£ï¼Œä½†å¯¹äºŽæœç´¢å¼•æ“Žçš„è®¾è®¡ï¼Œä»ç„¶ä¸€å¤´é›¾æ°´ã€‚

    å¶ç„¶æ‰¾åˆ°è¿™ç¯‡ç”±Googleçš„è®¾è®¡è€…Sergey Brin å’ŒLawrence Pageåœ¨1998å¹´ç¬¬7å±Šå›½é™…äº’è”ç½‘å¤§ä¼šä¸Šå‘è¡¨çš„è®ºæ–‡ã€ŠThe Anatomy of Large-Scale Hyperttextual Web Search Engineã€‹ï¼Œè¯»å®Œä»‹ç»ä¸ºä¹‹ä¸€æŒ¯ã€‚ç„¶è€Œï¼Œå…¨ç¯‡å„ç§ä¸“ä¸šæ€§çš„è¯æ±‡å’Œå¤§é‡æ™¦æ¶©éš¾æ‡‚çš„è¯å¥ä¸æ–æ‰¼æ€ç€æˆ‘ç»§ç»è¯»ä¸‹åŽ»çš„å‹‡æ°”ã€‚æˆ‘æ‹…å¿ƒè‡ªå·±å°±è¿™ä¹ˆæ”¾å¼ƒï¼ŒäºŽæ˜¯æˆ‘å†³å®šæŠŠå®ƒç¿»è¯‘å‡ºæ¥ã€‚

    ä¸€è¿žä¸¤ä¸ªæ˜ŸæœŸï¼Œæˆ‘ç¿»é˜…äº†å¤§é‡çš„èµ„æ–™æ¥æ¶ˆåŒ–æ–‡ä¸æåŠçš„å„ç§ä¸“ä¸šæœ¯è¯ï¼Œä»Žè€Œåœ¨ç¿»è¯‘æ—¶å°½é‡ä¿æŒä½œè€…çš„æœ¬æ„ã€‚å°½ç®¡å¦‚æ¤ï¼Œä»ç„¶ä¼šæœ‰ä¸€äº›è¯¯è¯‘çš„åœ°æ–¹ï¼Œå¸Œæœ›è¯»è€…èƒ½å¤Ÿè°…è§£ã€‚æ–‡ç« æ¯”è¾ƒé•¿ï¼Œæˆ‘æ–©å¤´åŽ»å°¾ï¼Œç•™å…¶ç²¾åŽã€‚

    è¯»å®Œå…¨æ–‡ï¼Œç›¸ä¿¡è¯»è€…å’Œæˆ‘ä¸€æ ·ï¼Œå·²ç»å¯¹æœç´¢å¼•æ“Žï¼ˆå°¤å…¶æ˜¯Googleï¼‰çš„å®žçŽ°æœ‰äº†ä¸€ä¸ªåˆæ¥çš„è®¤è¯†ã€‚è¿™æ˜¯ä¸€ä¸ªå…¨æ–°çš„é¢†åŸŸï¼Œå¸Œæœ›æˆ‘çš„åŠªåŠ›èƒ½ä¸ºæ›´å¤šçš„æœ‹å‹å¸¦åŽ»ä¸€ç‚¹å¾®è–„çš„å¸®åŠ©ã€‚

最后编辑：郝聪编辑于2008/02/19 16:28

Tags: google , pr , ç½‘ç»œçˆ¬è™« , æœç´¢ç®—æ³•

Googleæœç´¢åŽŸç†çš„è®º

å‘çŽ°æœç´¢çš„ä»·å€¼ï¼š

< 2025 > < 7 >
日	一	二	三	四	五	六
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

郝聪SEO博客：SEO顾问咨询服务公司

GOOGLEæœç´¢å¼•æ“Žå‰–æž

分类

最新日志

最新评论

最新留言

综合点击排行

评论排行

随机日志

作者

日历

站内搜索

归档

统计

其他

郝聪SEO博客：SEO顾问咨询服务公司

GOOGLEæœç´¢å¼•æ“Žå‰–æž

分类

最新日志

最新评论

最新留言

综合点击排行

评论排行

随机日志

作者

日历

站内搜索

归档

统计

其他

GOOGLEæœç´¢å¼•æ“Žå‰–æž