WJMonitor輿情之聲

企業(yè)大數(shù)據(jù)智能輿情監(jiān)測(cè)管理解決方案

全網(wǎng)監(jiān)測(cè)海量數(shù)據(jù)按需發(fā)布監(jiān)測(cè)預(yù)警

實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭

獲取驗(yàn)證碼

企業(yè)采購(gòu) 個(gè)人使用

首頁(yè) > 網(wǎng)站優(yōu)化 > SEO每日一博 > 搜索引擎反作弊的三個(gè)思路@rude

搜索引擎反作弊的三個(gè)思路@rude

時(shí)間:2015-06-02 13:06:37

前篇文章，提到了內(nèi)容農(nóng)場(chǎng)與鏈接農(nóng)場(chǎng)，這些都是相對(duì)較為傳統(tǒng)的作弊方式。至于其他，后面有時(shí)間我們?cè)僖灰涣_列。既然有作弊，為了維持良好的展現(xiàn)結(jié)果，搜索引擎也會(huì)有反作弊。

那么，搜索引擎會(huì)通過(guò)怎樣的方式進(jìn)行反作弊處理呢？

總的來(lái)說(shuō)，會(huì)有以下三種思路：

1、信任傳播模型

前段時(shí)間同事A跟我說(shuō)了一件事兒，他的姐姐B在國(guó)外留學(xué)，然后B在qq上跟A說(shuō)洗衣服把手機(jī)，銀行卡什么的全部洗了，讓A給B的老媽打電話寄點(diǎn)錢來(lái)，A立刻執(zhí)行，B的老媽也深信不疑，在即將打出的那一刻，B的一個(gè)電話，挽救了即將發(fā)生的損失。

細(xì)思恐極。

其實(shí)，這也是一個(gè)信任傳播模型，直接在QQ上跟B的媽媽說(shuō)，B的媽媽必然不會(huì)完全相信，但是經(jīng)由A的口一傳，立刻不一般。因?yàn)?，A在B的媽媽的信任名單中。

OK，由此而來(lái)，是一種反作弊的思路。

在海量的網(wǎng)頁(yè)數(shù)據(jù)中，通過(guò)技術(shù)或人工的手段，獲取值得完全值得信任的網(wǎng)頁(yè)設(shè)置為白名單。白名單中網(wǎng)頁(yè)的信任值由鏈接順著向外擴(kuò)散而遞減或者衰減。然后，設(shè)定一個(gè)值，高于此值，是OK的網(wǎng)頁(yè)，低于此值，不好意思，你作弊了。

2、不信任傳播模型

這個(gè)，其實(shí)跟種思路是及其類似的，找到一群作弊的網(wǎng)頁(yè)，然后通過(guò)鏈接關(guān)系分析不信任分值。

一點(diǎn)需要注意的是，信任分值，是通過(guò)鏈接正向傳遞的，不信任分值是通過(guò)鏈接反向傳遞的。舉個(gè)例子：

A為垃圾頁(yè)面，則指向A的鏈接B是垃圾頁(yè)面的概率比A指向的鏈接C的概率要大的多。

3、異常發(fā)現(xiàn)模型

所謂異常，可以是作弊頁(yè)面的特征，也可以是正常頁(yè)面的特征。

集合了這些特征，再由此來(lái)判定一個(gè)頁(yè)面是否作弊或者是否正常，也是蠻OK的一件事情。

來(lái)個(gè)簡(jiǎn)單的識(shí)別鏈接農(nóng)場(chǎng)的小例子：

鏈接農(nóng)場(chǎng)中的鏈接關(guān)系，是由設(shè)計(jì)者精心布置的，由此一來(lái)，必然會(huì)有些違背自然的特征，諸如：

1）、出鏈與入鏈的統(tǒng)計(jì)分布規(guī)律：正常的頁(yè)面出鏈與入鏈滿足Power-law分布，作弊的鏈接違反該分布；

2）、作弊的鏈接的Url網(wǎng)址往往過(guò)長(zhǎng)，包含較多的點(diǎn)畫(huà)線及數(shù)字等；

3）、諸如入鏈及出鏈的增長(zhǎng)率等，正常網(wǎng)頁(yè)和作弊網(wǎng)頁(yè)在這些變化模式上是不同的。

產(chǎn)品與服務(wù)

WJMonitor輿情之聲 WJInsight品牌洞察 SEO搜索引擎優(yōu)化網(wǎng)絡(luò)口碑營(yíng)銷信息流推廣

精品亚洲一区二区三区在线观看,在线观看国产精品日韩av,ass亚洲熟妇毛茸茸pics,髙清国产性猛交xxxand

WJMonitor輿情之聲

搜索引擎反作弊的三個(gè)思路@rude

相關(guān)資訊

產(chǎn)品與服務(wù)

最新文章

熱門文章