說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732
全網(wǎng)監(jiān)測海量數(shù)據(jù)按需發(fā)布監(jiān)測預(yù)警
實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭
一個(gè)大型的資訊網(wǎng)站在發(fā)表文章時(shí),如果是一條條的文章網(wǎng)上發(fā),這不僅浪費(fèi)時(shí)間,效率還不高,這時(shí)為了提高更新網(wǎng)站的效率,就出現(xiàn)了火車頭采集器,可是火車頭采集規(guī)則怎么寫呢?接下來就由小編來詳細(xì)的介紹吧。
火車頭采集規(guī)則寫法介紹
步驟一:新建一個(gè)文章采集節(jié)點(diǎn)
登錄后臺,依次點(diǎn)擊 采集>>采集節(jié)點(diǎn)管理>>增加新節(jié)點(diǎn)>>選擇普通文章>>確定
步驟二 :填寫采集列表規(guī)則
1.節(jié)點(diǎn)名稱:隨便(注意你要能分清哦,因?yàn)楣?jié)點(diǎn)多了的話,有可能會搞得自己混亂)
2.目標(biāo)頁面編碼:看目標(biāo)頁面的編碼
3.匹配網(wǎng)址:去到采集目標(biāo)列表頁面,查看它的列表規(guī)則!比如說很多網(wǎng)站的列表的第一面跟其它內(nèi)頁是有很大的差別的,所以我一般不采集目標(biāo)列表的第一頁!
最好是從第二頁開始(雖然可以找出第一頁,但很多的網(wǎng)站是根本沒第一頁的,所以,這里就不說怎么找第一頁了)
4.區(qū)域結(jié)束的HTML:在采集目標(biāo)列表頁打開源代碼!在要采集的文章標(biāo)題后面的附近找一段在本頁是唯一并且其它要采集的的頁面也是唯一的html標(biāo)簽!
寫好了,點(diǎn)擊保存信息并進(jìn)入下一步!如果寫正確了規(guī)則的話,那這些就會出現(xiàn)一個(gè)有內(nèi)容的網(wǎng)址獲取規(guī)則測試
再按下一步!進(jìn)入填寫采集內(nèi)容規(guī)則
步驟三:采集內(nèi)容規(guī)則
1.文章標(biāo)題:在文章標(biāo)題前后找兩個(gè)標(biāo)簽,能識別出標(biāo)題的!
2.文章內(nèi)容:在文章內(nèi)容前后找兩個(gè)標(biāo)簽,能識別出內(nèi)容的!我采集的網(wǎng)站的文章內(nèi)容前后唯一標(biāo)簽是<div class=”content”>…<ul class=”page clearfix”>,所以就寫成<div class=”content”>[內(nèi)容]<ul class=”page clearfix”>!
其它的功能,也不用管!這里只分享怎么能采到文章!然后,點(diǎn)擊保存配置并預(yù)覽,如果前面的列表規(guī)則跟內(nèi)容規(guī)則都寫對了的話,那現(xiàn)在就會預(yù)覽到內(nèi)容了!
點(diǎn)擊僅保存,如果你要馬上采集的話,也可以點(diǎn)擊隔壁的保存并馬上采集!
火車頭采集規(guī)則導(dǎo)入方法
1.導(dǎo)入規(guī)則方法一
右鍵點(diǎn)擊剛才新建的分組,選擇“導(dǎo)入任務(wù)至該分組”(記?。翰皇恰皩?dǎo)入分組規(guī)則”),在彈出的對話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。
2.導(dǎo)入規(guī)則方法二
也可以選擇剛才新建的分組,然后依次點(diǎn)擊菜單“分組”->“導(dǎo)入任務(wù)至該分組” 在彈出的對話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。
3.導(dǎo)入分組規(guī)則
如果你手上的規(guī)則文件后綴名為“.lgrp”,那么你需要通過菜單或右鍵快捷菜單選擇“導(dǎo)入分組規(guī)則”,而不是“導(dǎo)入任務(wù)至該分組”。
好了,有關(guān)火車頭采集規(guī)則寫法就介紹到這里了,當(dāng)然想要掌握這個(gè)寫法的可不是馬上就能完成的事情,是需要在不斷的實(shí)踐中去掌握和運(yùn)用的,所以想要掌握格則寫法的,現(xiàn)在就開始練習(xí)吧。如果想了解更多的內(nèi)容,歡迎關(guān)注我們文軍營銷的官網(wǎng)。
推薦閱讀
火車頭采集器教程步驟 火車頭采集器使用教程介紹 | 文軍營銷1點(diǎn)擊右下角的“網(wǎng)址采集測試”, 2測試后,如果網(wǎng)址是這么顯示出來的,那就是采集成功了。點(diǎn)擊其中一個(gè)網(wǎng)址左邊的“+”符號,可以看到該欄目頁面采集到的內(nèi)容。 火車頭采集器教程之?dāng)?shù)據(jù)采集步驟 火車采集器采集數(shù)據(jù)是分成兩個(gè)步驟的,一是采集數(shù)據(jù),二是發(fā)布數(shù)據(jù)。這兩個(gè)過程是可以分開的。 1、采集數(shù)據(jù),這個(gè)包括采集...火車頭采集規(guī)則寫法介紹 火車頭采集規(guī)則如何導(dǎo)入? | 文軍營銷點(diǎn)擊僅保存,如果你要馬上采集的話,也可以點(diǎn)擊隔壁的保存并馬上采集! 火車頭采集規(guī)則導(dǎo)入方法 1.導(dǎo)入規(guī)則方法一 右鍵點(diǎn)擊剛才新建的分組,選擇“導(dǎo)入任務(wù)至該分組”(記住:不是“導(dǎo)入分組規(guī)則”),在彈出的對話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。 2.導(dǎo)入規(guī)則方法二 也可以選擇剛才新建的分組,然后依次點(diǎn)擊菜單“...火車頭采集器 火車頭采集器是什么 | 文軍營銷采集器將數(shù)據(jù)發(fā)送給網(wǎng)站后臺程序,由網(wǎng)站后臺程序去處理數(shù)據(jù)通常后臺程序講數(shù)據(jù)存入網(wǎng)站數(shù)據(jù)庫中。 方式二:保存為本地文件 這種方式可以將采集的數(shù)據(jù)發(fā)布到本地的文件中,采集器支持保存成Txt格式、Csv格式和Html格式。 方式三:導(dǎo)入到自定義數(shù)據(jù)庫 這種方式可以通過采集器連接到其他數(shù)據(jù)庫從而將采集的數(shù)據(jù)從軟件內(nèi)置數(shù)據(jù)...火車頭采集器視頻教程大全 火車頭采集器v9使用視頻教程 | 文軍營銷好好填寫任務(wù)列表的規(guī)則。下面教大家如何填寫 END 火車頭采集器教程步驟(4)填寫采集列表頁的規(guī)則 1 找到頂頭的“起始網(wǎng)址”,可先不填??梢栽谟疫咟c(diǎn)擊”向?qū)砑印崩锩嫣顚?如圖: 2 點(diǎn)擊“批量網(wǎng)址”,如下圖: 3 (1)在“地址格式”空白欄里,復(fù)制想要采集的列表欄目網(wǎng)址 ,(先去對方網(wǎng)站某個(gè)欄目看 ...
說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732