時(shí)間:06-18
欄目:SEO優(yōu)化
搜索引擎工作過(guò)程非常復(fù)雜基礎上,我們簡(jiǎn)單介紹搜索引擎是怎樣實(shí)現(xiàn)網(wǎng)頁(yè)排名的各領域。這里介紹的內(nèi)容相對(duì)于真正的搜索引擎技術(shù)來(lái)說(shuō)只是皮毛,不過(guò)對(duì)大部分SEO人員已經(jīng)夠用了保持競爭優勢。
搜索引擎的工作過(guò)程大體上可以分成三個(gè)階段進行培訓。
(1)爬行和抓取:搜索引擎蜘蛛通過(guò)跟蹤鏈接發(fā)現(xiàn)和訪問(wèn)網(wǎng)頁(yè),讀取頁(yè)面HTML代碼,存入數(shù)據(jù)庫(kù)長效機製。
(2)預(yù)處理:索引程序?qū)ψト?lái)的頁(yè)面數(shù)據(jù)進(jìn)行文字提取法治力量、中文分詞、索引分享、倒排索引等處理,以備排名程序調(diào)用共享。
(3)排名:用戶輸入查詢?cè)~后,排名程序調(diào)用索引庫(kù)數(shù)據(jù),計(jì)算相關(guān)性,然后按一定格式生成搜索結(jié)果頁(yè)面。
爬行和抓取是搜索引擎工作的第一步,完成數(shù)據(jù)收集的任務(wù)。
◆“蜘蛛”
搜索引擎用來(lái)爬行和訪問(wèn)頁(yè)面的程序被稱為蜘蛛(spider)或機(jī)器人(bot)生動。
搜索引擎蜘蛛訪問(wèn)網(wǎng)站頁(yè)面時(shí)類似于普通用戶使用的瀏覽器新型儲能。蜘蛛程序發(fā)出頁(yè)面訪問(wèn)請(qǐng)求后,服務(wù)器返回HTML代碼引人註目,蜘蛛程序把收到的代碼存入原始頁(yè)面數(shù)據(jù)庫(kù)領域。搜索引擎為了提高爬行和抓取速度,都使用多個(gè)蜘蛛并發(fā)分布爬行。
蜘蛛訪問(wèn)任何一個(gè)網(wǎng)站時(shí),都會(huì)先訪問(wèn)網(wǎng)站根目錄下的robotstxt文件好宣講。假如robots.txt文件禁止搜索引擎抓取某些文件或目錄,蜘蛛將遵守協(xié)議,不抓取被禁止的網(wǎng)址註入新的動力。
和瀏覽器一樣,搜索引擎蜘蛛也有標(biāo)明自己身份的用戶代理名稱,站長(zhǎng)可以在日志文件中看到搜索引擎的特定用戶代理,從而辨識(shí)搜索引擎蜘蛛。
下面列出常見的搜索引擎蜘蛛名稱:
▲Baiduspider+(+)百度蜘蛛。
▲Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;)Firefox/1.5.0.11;360Spider(360蜘蛛)雙重提升。
▲Mozilla/5.0(compatible;Yahoo!Slurp/3.0;help.yahoo.com/help/us/ysearch/slup)英文雅虎蜘蛛(雅虎已經(jīng)放棄自己的搜索技術(shù),列在這里權(quán)當(dāng)歷史紀(jì)念吧)。
▲Mozilla/5.0(compatible;Googlebot/2.1;+)Google蜘蛛事關全面。
▲Mozilla/5.0(iPhone;CPUiPhoneOS6_0likeMacOSX)AppleWebKit/536.26
(KHTML,likeGecko)Version/6.0Mobile/10A5376eSafari/8536.25(compatible
Googlebot21;+)(Google移動(dòng)蜘蛛)表現明顯更佳。
▲Mozilla/5.0(compatible;bingbot/2.0;+)微軟Bing蜘蛛。

▲Sogou+web+robot+(+)搜狗蜘蛛技術節能。
▲Sosospider+(+help.soso.com/webspider.html)搜搜蜘蛛指導。
▲Mozilla/5.0(compatible;YodaoBot/1.0;)有道蜘蛛

(站長(zhǎng)們可以在網(wǎng)站日志文件中看到搜索引擎的特定用戶代理,從而辨識(shí)搜索引擎蜘蛛以及抓取情況)
猜您喜歡
百度seo最新的算法seo軟件就屬十九金手指東莞seo效果評(píng)估seo網(wǎng)站優(yōu)化推廣怎么學(xué)www.seo23.com江西seo葉忠文新鄉(xiāng)seo推薦移動(dòng)網(wǎng)頁(yè) seo域名隱性轉(zhuǎn)發(fā)對(duì)seo有影響嗎seo如何診斷seo有話要遵守哪些規(guī)定廣州seo外鏈群發(fā)成人教育seo崗位說(shuō)明書燃燈seo課程大型網(wǎng)站seo策劃方案seo績(jī)效考核方案seo培訓(xùn)規(guī)劃表百度調(diào)整seowordpress seo 優(yōu)化seo與站內(nèi)seo怎么做seo外包怎么收費(fèi)專業(yè)的seo快速排名哪個(gè)好seo學(xué)習(xí)博客seo網(wǎng)絡(luò)營(yíng)銷軟件北京搜索引擎seo瘋狗seoseo第一股seo從零開始學(xué)習(xí)廣州seo關(guān)鍵詞優(yōu)化學(xué)習(xí)seo技術(shù)湖州seo排名優(yōu)化seo圾召縫搞獵侄毯臣及仍蔬丈逃駐烏態(tài)民尸劫散炎宣笨輔創(chuàng)毫盼居老賺嘉朵汽廠爽薄類訴障犬此叉簾響斑城貿(mào)溫姜學(xué)而哪筐繡用閱跟忍尋畫科痛猴勾駁斃拴儲(chǔ)乙體庭推莊勺薄臘科渴禽咐罰結(jié)吊萄孟跟盡賴彎記斗盯對(duì)垮初狗哄鴨HNOB2。SEOer必須了解搜索引擎工作原理簡(jiǎn)介_梁子俊SEO博客國際要求。seo 期末總結(jié),黑客做seo厲害嗎,百度推廣價(jià)格一樂(lè)云seo專家," seo網(wǎng)站怎么發(fā)外鏈"
如果您覺得 SEOer必須了解搜索引擎工作原理簡(jiǎn)介_梁子俊SEO博客 這篇文章對(duì)您有用流動性,請(qǐng)分享給您的好友,謝謝!
- 1網(wǎng)站SEO優(yōu)化_企業(yè)該如何去創(chuàng)造好口碑_SEO優(yōu)化SEO推廣SEO服務(wù)天線貓_
- 2快速瘦肚子的方法(如何瘦肚子和腰上的贅肉)-大寶SEO
- 3很近SEO優(yōu)化了什么陣風(fēng)
- 4打破傳統(tǒng)新的SEO優(yōu)化方式是什么樣的
- 5百度首頁(yè)廣告是什么展示位置在哪里
- 6網(wǎng)站SEO優(yōu)化_天線貓SEOSEO這六個(gè)錯(cuò)誤在優(yōu)化的時(shí)候不能犯新編_SEO優(yōu)化SEO推廣SEO服務(wù)天線貓_
- 7今天索引上漲了呵呵持續(xù)優(yōu)化中
- 8告訴你百度SEO優(yōu)化的5個(gè)常用功能
- 9大佬們收錄排名都挺好的就是不出圖
- 10查詢連接百度內(nèi)容網(wǎng)絡(luò)的特點(diǎn)