說(shuō)明:如果您有任何疑問(wèn)或想咨詢(xún)其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732
全網(wǎng)監(jiān)測(cè)海量數(shù)據(jù)按需發(fā)布監(jiān)測(cè)預(yù)警
實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭
提起向百度提交數(shù)據(jù),大家基本都會(huì)想到sitemap,近又推出的etag是什么東東?真的能有效果嗎?其實(shí)在etag推出之初,我們平臺(tái)的非技術(shù)人員對(duì)效果也是沒(méi)有預(yù)期的。下面來(lái)一起分享一下。
sitemap是解決網(wǎng)站收錄至關(guān)重要的途徑之一,而通常sitemap的更新都不是很及時(shí),并且體量都相對(duì)較大,,此時(shí)也消耗了相應(yīng)的網(wǎng)站流量及帶寬。而ETag可以用來(lái)標(biāo)示網(wǎng)頁(yè)是否發(fā)生了變化,如果沒(méi)有變化返回304狀態(tài)碼,不用再重新傳輸整個(gè)網(wǎng)頁(yè)了。
在我們的sitemap配置了ETag之后,對(duì)日志一段時(shí)間的監(jiān)測(cè)發(fā)現(xiàn),其sitemap響應(yīng)時(shí)間以及耗時(shí)的平均時(shí)間均大幅度下降,爬蟲(chóng)訪問(wèn)sitemap文件的次數(shù)有所增加,對(duì)于收錄而言,通過(guò)圖表也能看出相對(duì)的增長(zhǎng)曲線,我們的整體收錄率大致提升范圍在2% – 5%左右。所以在此,強(qiáng)烈建議大家設(shè)置sitemap的ETag,簡(jiǎn)簡(jiǎn)單單的一個(gè)小動(dòng)作能看到相對(duì)明顯的效果還是很不錯(cuò)的。
ETag全稱(chēng)EntityTags,HTTP協(xié)議規(guī)格說(shuō)明中定義“ETag”為“被請(qǐng)求變量的實(shí)體值”。我們也可以把ETag理解為是一個(gè)客戶端與服務(wù)器關(guān)聯(lián)的記號(hào)。這個(gè)記號(hào)告訴客戶端,當(dāng)前網(wǎng)頁(yè)在上次請(qǐng)求之后是否有發(fā)生變化,當(dāng)發(fā)生變化時(shí),ETag的值重新計(jì)算,并返回200狀態(tài)碼。如果沒(méi)有變化,返回304狀態(tài)碼。從而不會(huì)重新加載整個(gè)頁(yè)面信息。
如下,是我司站點(diǎn)的sitemap文件的頭信息:
我們看到,ETag中包含了一連串的數(shù)據(jù),這是計(jì)算出來(lái)的一個(gè)值,如果它發(fā)生變化,說(shuō)明其頁(yè)面內(nèi)容一定發(fā)生了變化。如果頁(yè)面沒(méi)有發(fā)生變化時(shí),頭信息應(yīng)該如下:
在我們與技術(shù)溝通配置ETag時(shí),需要通過(guò)此種方式進(jìn)行驗(yàn)證。次訪問(wèn)200狀態(tài)碼,有ETag的一行文本,再次訪問(wèn)該頁(yè)面時(shí),狀態(tài)碼為304,ETag的值不變。至此,我們可以確定ETag配置成功。
另外,sitemap啟用Etag后:
1、 百度可以更及時(shí)地響應(yīng)sitemap的更新;
2、 頁(yè)面沒(méi)有更新的情況下,對(duì)流量的消耗極??;
3、 百度更加及時(shí)的抓取sitemap,便于更好的收錄;
但多數(shù)情況下,ETag會(huì)與Last-Modified一起使用,這樣可利用客戶端(例如瀏覽器)的緩存。因?yàn)榉?wù)器首先產(chǎn)生Last-Modified/Etag標(biāo)記,服務(wù)器可在稍后使用它來(lái)判斷頁(yè)面是否已經(jīng)被修改。本質(zhì)上,客戶端通過(guò)將該記號(hào)傳回服務(wù)器要求服務(wù)器驗(yàn)證其(客戶端)緩存。
對(duì)于如何配置ETag站長(zhǎng)學(xué)院有很詳細(xì)的文章指南:對(duì)站點(diǎn)服務(wù)器如何配置ETag,是對(duì)全站進(jìn)行配置ETag,這樣對(duì)于站點(diǎn)而言,在帶寬消耗、爬蟲(chóng)抓取上的提升還是會(huì)有很大收益的。
推薦閱讀
說(shuō)明:如果您有任何疑問(wèn)或想咨詢(xún)其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732