說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732
全網(wǎng)監(jiān)測(cè)海量數(shù)據(jù)按需發(fā)布監(jiān)測(cè)預(yù)警
實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭
事先聲明下,本文純屬學(xué)術(shù)性探討,請(qǐng)勿將采集到的內(nèi)容用作商業(yè)用途。
火車頭,免費(fèi)版本的已經(jīng)夠用
Excel,要開啟宏,wps不支持
沒事,你愛用wps,我不會(huì)說你Low的。
二、操作方法
1、找呀找評(píng)論
顯然,評(píng)論的文字內(nèi)容源代碼中是木有的。
好吧,此刻你需要借助Chrome瀏覽器,F(xiàn)n+F12。
打開這個(gè)鏈接,認(rèn)真觀察。
你會(huì)發(fā)現(xiàn)很有趣的兩點(diǎn):
1)、Url中包含著景點(diǎn)的id;
2)、細(xì)細(xì)觀察,紅框所示的部分就是評(píng)論,當(dāng)然,需要把unicode轉(zhuǎn)成漢字。
換句話說,如果你能拿到所有的你需要采集評(píng)論的景點(diǎn)的id,你就可以批量把景點(diǎn)對(duì)應(yīng)的評(píng)論Url地址拼接出來,然后用火車頭進(jìn)行采集,可以獲取到這些unicode。
下一步就是怎樣批量的將unicode轉(zhuǎn)成漢字。
2、將unicode轉(zhuǎn)成漢字
哈哈,我偉大的excel可以。
打開excel,按alt+F11,然后插入,模板,粘入如下的代碼:
Function ChW(t)
If InStr(t, “\u”) Then
s = Split(t, “\u”)
For i = 0 To UBound(s)
If Len(s(i)) > 3 Then
ChW = ChW & ChrW(“&H” & Left(s(i), 4)) & Mid(s(i), 5)
Else
ChW = ChW & s(i)
End If
Next
Else
For i = 1 To Len(t)
s = AscW(Mid(t, i, 1))
If s > 0 And s < 255 Then
ChW = ChW & Mid(t, i, 1)
Else
ChW = ChW & “\u” & LCase(Hex(s))
End If
Next
End If
End Function
保存,此刻就相當(dāng)于你人工自定義了一個(gè)叫ChW的函數(shù),使用方法類似excel自帶的sum等函數(shù)。
A1單元格中放入你采集到的unicode,B1單元格中輸入=ChW(a1)。
怎么樣,是不是大功告成?
來吧,試試看你是不是也可以用火車頭去采集百度或淘寶等的下拉框了?
推薦閱讀
說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732