谷歌搜索優(yōu)化:谷歌搜索引擎抓取網(wǎng)頁原理跟注意事項
一、抓取:Google搜索引擎可以找到您的網(wǎng)站嗎?
首先您可以使用 "site: yourdomain.com"(一種Google搜索運算符)來查看Google為您的網(wǎng)站編制了多少頁面和哪些頁面。
前往Google并在搜索欄中輸入"site:yourdomain.com"。這將返回Google在其指定網(wǎng)站的索引中的結(jié)果:
Google顯示的結(jié)果數(shù)量并不準(zhǔn)確,但它確實可以讓您充分了解在您的網(wǎng)站上編制索引的網(wǎng)頁以及它們當(dāng)前在搜索結(jié)果中的顯示方式。
要獲得更準(zhǔn)確的結(jié)果,請在Google Search Console中監(jiān)控并使用"索引覆蓋率"報告。 如果您目前沒有Google帳戶,可以注冊免費的Google Search Console帳戶。 使用此工具,您可以為您的網(wǎng)站提交站點地圖,并監(jiān)控實際添加到Google索引的已提交頁面的數(shù)量等。
二、如果您沒有在Google搜索結(jié)果中的任何位置顯示,則可能有以下幾種原因:
您的網(wǎng)站是全新的,尚未抓取。
您的網(wǎng)站未鏈接到任何外部網(wǎng)站。
您的網(wǎng)站導(dǎo)航使谷歌機器人難以有效地抓取它。
您的站點包含一些稱為爬蟲指令的基本代碼,阻止搜索引擎。
您的網(wǎng)站因垃圾郵件策略而受到Google的處罰。
如果您的網(wǎng)站沒有鏈接到其中的任何其他網(wǎng)站,您仍然可以通過在Google Search Console中提交XML站點地圖或手動向Google提交單個網(wǎng)址來將其編入索引。 不能保證他們會在Google索引中包含提交的URL,但值得一試!
三、Google搜索引擎可以看到您的整個網(wǎng)站嗎?
有時,Google搜索引擎可以通過抓取來查找您網(wǎng)站的某些部分,但其他頁面或部分可能會因某種原因而模糊不清。 確保Google搜索引擎能夠發(fā)現(xiàn)您想要編入索引的所有內(nèi)容,而不僅僅是您的主頁,這一點非常重要。
您的內(nèi)容隱藏在登錄表單后面嗎?
如果您要求用戶在訪問某些內(nèi)容之前登錄,填寫表單或回答調(diào)查,搜索引擎將無法看到這些受保護的頁面。 爬蟲絕對不會登錄。
您是否依賴搜索表單?
機器人無法使用搜索表單。 有些人認為,如果他們在自己的網(wǎng)站上放置搜索框,搜索引擎就能找到訪問者搜索的所有內(nèi)容。
文本是否隱藏在非文本內(nèi)容中?
非文本媒體表單(圖像,視頻,GIF等)不應(yīng)用于顯示您希望編入索引的文本。 雖然搜索引擎在識別圖像方面越來越好,但仍無法保證他們能夠閱讀和理解圖像。 最好在網(wǎng)頁的<Html>標(biāo)記中添加文本。
四、Google搜索引擎可以關(guān)注您的網(wǎng)站導(dǎo)航嗎?
正如Google爬蟲需要通過其他網(wǎng)站的鏈接發(fā)現(xiàn)您的網(wǎng)站一樣,它需要您自己網(wǎng)站上的鏈接路徑,以便在頁面之間引導(dǎo)它。 如果你有一個頁面,你希望搜索引擎找到它,但它沒有鏈接到任何其他頁面,它就像看不見一樣好。 許多網(wǎng)站都在以搜索引擎無法訪問的方式構(gòu)建導(dǎo)航,從而阻礙了他們在搜索結(jié)果中列出的能力。
五、常見的導(dǎo)航錯誤可能會使抓取工具無法看到您的所有網(wǎng)站:
使移動導(dǎo)航顯示桌面導(dǎo)航不同
任何類型的導(dǎo)航,其中菜單項不在HTML中,例如啟用Javascript的導(dǎo)航。 谷歌在抓取和理解Javascript方面做得更好,但它仍然不是一個完美的過程。 為了確保確保Google發(fā)現(xiàn),理解和索引某些內(nèi)容的更加可靠的方法是將其放入HTML中。
個性化,或顯示特定類型的訪問者與其他訪問者的獨特導(dǎo)航,似乎隱藏在搜索引擎爬蟲中
忘記通過導(dǎo)航鏈接到您網(wǎng)站上的主頁 - 請記住,抓取工具是跟隨爬蟲進入新頁面的!
這就是為什么您的網(wǎng)站必須具有清晰的導(dǎo)航和有用的URL文件夾結(jié)構(gòu)。
想了解更多SEO技術(shù)的內(nèi)容,請訪問:SEO技術(shù)