說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732
全網(wǎng)監(jiān)測海量數(shù)據(jù)按需發(fā)布監(jiān)測預(yù)警
實時把握輿情動態(tài)精準(zhǔn)追溯信息源頭
身為一個seoer,關(guān)鍵詞排名及網(wǎng)站頁面收錄查詢必不可少。
數(shù)量少了還好說,手工查詢下OK。如果數(shù)量多了(以千計),有如下幾種可能了:
1、你有程序的底子或者有個程序猿的好基友,寫個程序慢慢跑;
2、你不差錢或者公司不差錢,買個諸如愛站工具包神馬的工具去查;
3、你不差時間或者手下的人不差錢,一條一條慢慢查;
4、你是一個屌絲,不懂程序無人無錢無時間。
額,好吧,第四個人是我。然后,我想說的是,屌絲,自有屌絲的解決方法,你不能哭,得想辦法,站起來,然后……
開始吧,不要廢話了。大家都捉急了。
一、查詢關(guān)鍵詞排名
這里介紹一個查詢百度前五十關(guān)鍵詞排名的方法。
1、拼接url
http://www.baidu.com/s?wd=SEO公司&rn=50
拼接的url傳輸協(xié)議為http,不要弄https(百度目前為https),否則查不到結(jié)果;
rn=50的意思是一頁顯示50個結(jié)果。
如果你的關(guān)鍵詞很多,可以用excel批量拼接url(拼接方法,自行腦補(bǔ)),然后導(dǎo)入火車頭的采集網(wǎng)址中。
2、采集內(nèi)容規(guī)則
我采用的是前后截取的方式查詢的關(guān)鍵詞排名,具體規(guī)則如下:
開始字符串:<span class=”g”>不帶http的目標(biāo)站點域名/(*)<div class=”c-tools” id=”tools_(*)_
結(jié)束字符串:” data-tools=
然后,如果你不放心寫的對不對的話,可以測試一下。
3、注意設(shè)置時間間隔
大家都知道,如果時間間隔過短,百度會出驗證碼的啦,我這里一般設(shè)置的3s查一次。
在文件保存及部分設(shè)置中設(shè)置。
設(shè)置好了,可以開始執(zhí)行任務(wù)了。
二、查詢頁面收錄
同樣,我這想的辦法也是用火車頭去做的,其他人怎么查詢收錄的邏輯我不大清楚,這里講講我的方法:
1、同樣的都需要先拼接url:
http://www.baidu.com/s?wd=http://ccpaokp.cn/
2、在采集內(nèi)容時,需要采集兩個地方,如下圖所示:
如果相關(guān)結(jié)果數(shù)不是0,且沒有出現(xiàn)“沒有找到該Url”,說明此頁面已經(jīng)收錄啦。
至于邏輯具體嚴(yán)不嚴(yán)謹(jǐn),還需要進(jìn)一步驗證,只是,可以采用此種方式試驗一下。
推薦閱讀
說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732