從搜索引擎抓取的角度淺析網(wǎng)站的收錄規(guī)律
談SEO一定要談收錄,不收錄不SEO。網(wǎng)站收錄是SEO實(shí)踐過程中比較重要的環(huán)節(jié)之一。這個(gè)領(lǐng)域的技術(shù)文章在網(wǎng)絡(luò)上幾乎是飽和的。通常,大多數(shù)人認(rèn)為網(wǎng)頁沒有收錄是因?yàn)橘|(zhì)量差,缺乏創(chuàng)意,或者缺乏外部鏈接,這不能說是錯(cuò)的。這些只是站長(zhǎng)們單方面思考的表面現(xiàn)象。下面從搜索引擎抓起分析網(wǎng)站收錄的規(guī)律。
互聯(lián)網(wǎng)上每天都有成千上萬的新網(wǎng)頁。大型網(wǎng)站產(chǎn)生的新頁面比小型網(wǎng)站多。搜索引擎傾向于從大型網(wǎng)站上獲取更多的頁面,因?yàn)榇笮途W(wǎng)站往往包含更多高質(zhì)量的頁面。搜索引擎更喜歡先抓取和收集大型網(wǎng)站的頁面。正是這樣一種方式提醒站長(zhǎng)做SEO,讓更多的內(nèi)容出現(xiàn)在網(wǎng)站上,而豐富的網(wǎng)頁會(huì)引導(dǎo)搜索引擎頻繁地捕獲和收集,這是SEO的一個(gè)長(zhǎng)期規(guī)劃思路。
搜索引擎在鏈中捕獲和收錄多個(gè)高質(zhì)量網(wǎng)頁的優(yōu)先級(jí)
搜索引擎通過網(wǎng)頁之間的鏈接關(guān)系在互聯(lián)網(wǎng)上查找和抓取網(wǎng)頁。眾所周知,鏈接具有投票功能。得票越多,網(wǎng)絡(luò)搜索引擎就會(huì)更加關(guān)注它,搶占先機(jī)。Google提出的PageRank算法可以根據(jù)鏈接關(guān)系對(duì)網(wǎng)頁進(jìn)行分級(jí),并確定URL下載的順序。因此,在SEO實(shí)踐中,如果網(wǎng)頁被收錄,我們可以適當(dāng)增加高質(zhì)量的鏈條,這里我們要特別注意“高質(zhì)量”三個(gè)字。
近,SEO外包優(yōu)化發(fā)現(xiàn),在優(yōu)化網(wǎng)站時(shí),網(wǎng)站的排名偶爾會(huì)在主頁內(nèi)容更新后下降。當(dāng)快照以某種方式返回時(shí),排名被恢復(fù)。仔細(xì)分析百度站長(zhǎng)平臺(tái)的關(guān)鍵詞和流量后發(fā)現(xiàn),在網(wǎng)站主頁內(nèi)容不變的情況下,某個(gè)關(guān)鍵詞有一定的點(diǎn)擊量。內(nèi)容更新后,點(diǎn)擊次數(shù)變少。當(dāng)快照返回時(shí),排名再次上升。因此,推測(cè)百度在抓取和收集內(nèi)容時(shí)會(huì)考慮用戶體驗(yàn),網(wǎng)站點(diǎn)擊量從側(cè)面反映用戶體驗(yàn)。
換句話說,搜索引擎將捕獲和存儲(chǔ)許多網(wǎng)頁快照。如果舊的網(wǎng)頁快照更受用戶歡迎,那么新的網(wǎng)頁快照將不一定包括在內(nèi),因?yàn)樗阉饕婵偸且紤]用戶體驗(yàn)。
搜索引擎的資源不是無限的,他們也在盡較大努力節(jié)約資源。對(duì)于同一個(gè)網(wǎng)站,蜘蛛會(huì)根據(jù)網(wǎng)站的大小和更新頻率來決定抓取的次數(shù),并盡量用更少的資源來完成網(wǎng)站更新策略。搜索引擎會(huì)假設(shè)過去頻繁更新的頁面在將來會(huì)頻繁更新。
想了解更多SEO技術(shù)的內(nèi)容,請(qǐng)?jiān)L問:SEO技術(shù)