說(shuō)明:如果您有任何疑問(wèn)或想咨詢其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732
全網(wǎng)監(jiān)測(cè)海量數(shù)據(jù)按需發(fā)布監(jiān)測(cè)預(yù)警
實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭
9月2日,百度站長(zhǎng)平臺(tái)連續(xù)出了三個(gè)聲明,細(xì)心的觀眾或許已經(jīng)發(fā)現(xiàn),他們分別是在【產(chǎn)品動(dòng)態(tài)】、【站長(zhǎng)學(xué)院】、【活動(dòng)沙龍】中,雖然從表現(xiàn)上似乎他們之間并沒(méi)有什么特別的關(guān)聯(lián),但是從本質(zhì)來(lái)說(shuō),這或許也是一種有目的的教化。幫助站長(zhǎng)走向正軌,給站長(zhǎng)們灌輸官方說(shuō)明以及束下條條框框的教化。
當(dāng)然,這無(wú)關(guān)是與非。
拐入正題,先是抓取頻次工具的升級(jí)。
1、新增抓取時(shí)間數(shù)據(jù):
展示百度spider每次抓取網(wǎng)站的耗時(shí),根據(jù)該數(shù)據(jù)站長(zhǎng)可以了解spider抓取網(wǎng)站的時(shí)長(zhǎng),抓取耗時(shí)越短代表網(wǎng)站在訪問(wèn)速度方面的用戶體驗(yàn)越好。
注意:抓取耗時(shí)數(shù)據(jù)的更新頻次與抓取頻次有關(guān),抓取頻次較高的站點(diǎn)數(shù)據(jù)更新相對(duì)較快。
Rude:好了,網(wǎng)站的相應(yīng)速度,由此也有了一個(gè)更為官方的說(shuō)法,當(dāng)然,是針對(duì)百度的,如果你的網(wǎng)站相應(yīng)時(shí)間過(guò)慢,那么你的網(wǎng)站收錄比較慢也不在話下了。
2、新增抓取狀態(tài)統(tǒng)計(jì)數(shù)據(jù):
新增四類抓取狀態(tài)碼統(tǒng)計(jì):類:重定向(301, 302等);第二類、未找到(404);第三類、服務(wù)器無(wú)響應(yīng)(501,502等);第四類:服務(wù)器連接超時(shí)。有助于站長(zhǎng)更好的了解網(wǎng)站在spider中的抓取狀態(tài),更好的管理網(wǎng)站。
注意:這里統(tǒng)計(jì)的是Baiduspider每次抓取行為的狀態(tài),與網(wǎng)站中該狀態(tài)頁(yè)面實(shí)際數(shù)量不能等同看待。
Rude:恩?這些個(gè)http狀態(tài)碼的東西,不需要太多的說(shuō)明了吧。
3、提升了抓取頻次工具的響應(yīng)速度:
加快了使用抓取頻次工具調(diào)整抓取次數(shù)之后的生效時(shí)間。
Rude:哎呀,如果你嫌棄你的網(wǎng)站抓取量不夠,趕緊來(lái)這里玩一玩。
想要了解更多的親們,趕緊去實(shí)踐吧,而且這里面,也是有圖有真相的說(shuō)。
第二個(gè),百度關(guān)于索引量的再次說(shuō)明。
百度算是很不錯(cuò)了,給了一個(gè)分析索引量的思維導(dǎo)圖。具體圖例如下:
他的分析思路,很贊。
當(dāng)然,如果你的index出現(xiàn)了問(wèn)題,進(jìn)行細(xì)分,以求出到底是哪里出了毛病。
這個(gè)毛病,不只是指索引量變小了,同時(shí)也有可能是索引量劇增了。如果你不理解劇增的潛在隱患,不妨看下面幾種情況:
1、會(huì)不會(huì)是網(wǎng)站被黑客攻擊后增加了大量垃圾網(wǎng)頁(yè)
2、會(huì)不會(huì)是Robost協(xié)議出了問(wèn)題,導(dǎo)致大批保密頁(yè)面被百度抓取
3、大幅增加的url會(huì)不會(huì)占用有限的抓取配額,導(dǎo)致重要內(nèi)容未被抓取
尤其是第三點(diǎn),特別值得引起關(guān)注,當(dāng)然,這里也是存在疑惑的,比如抓取配額具體是個(gè)什么概念,如果是個(gè)值,那么每個(gè)網(wǎng)站的配額應(yīng)當(dāng)是多少?會(huì)不會(huì)隨著網(wǎng)站的權(quán)重增加而增大?都是一些個(gè)值得探討的問(wèn)題。
推薦閱讀
關(guān)于百度的抓取診斷工具升級(jí)?@rude | 文軍營(yíng)銷展示百度spider每次抓取網(wǎng)站的耗時(shí),根據(jù)該數(shù)據(jù)站長(zhǎng)可以了解spider抓取網(wǎng)站的時(shí)長(zhǎng),抓取耗時(shí)越短代表網(wǎng)站在訪問(wèn)速度方面的用戶體驗(yàn)越好。 注意:抓取耗時(shí)數(shù)據(jù)的更新頻次與抓取頻次有關(guān),抓取頻次較高的站點(diǎn)數(shù)據(jù)更新相對(duì)較快。 Rude:好了,網(wǎng)站的相應(yīng)速度,由此也有了一個(gè)更為官方的說(shuō)法,當(dāng)然,是針對(duì)百度的,如果你的網(wǎng)站相應(yīng)時(shí)...
說(shuō)明:如果您有任何疑問(wèn)或想咨詢其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732