HITS是英文Hyperlink-Induced Topic Search 的縮寫(xiě),意譯為“超鏈誘導(dǎo)主題搜索”。HITS算法由Jon Kleinberg于1997年提出,并申請(qǐng)了專利:
https://patft.uspto.gov/netacgi/nph-Parser?patentnumber=6,112,202
按照HITS算法,用戶輸入關(guān)鍵詞后,算法對(duì)返回的匹配頁(yè)面計(jì)算兩種值,一種是樞紐值(Hub Scores),另一種是權(quán)威值(Authority Scores),這兩個(gè)值是互相依存、互相影響的。所謂樞紐值,指的是頁(yè)面上所有導(dǎo)出鏈接指向頁(yè)面的權(quán)威值之和。權(quán)威值指的是所有導(dǎo)入鏈接所在頁(yè)面的樞紐值之和。
上面的定義比較拗口,我們可以簡(jiǎn)單地說(shuō),HITS算法會(huì)提煉出兩種比較重要的頁(yè)面,也就是樞紐頁(yè)面和權(quán)威頁(yè)面。樞紐頁(yè)面本身可能沒(méi)有多少導(dǎo)入鏈接,但是有很多導(dǎo)出鏈接指向權(quán)威頁(yè)面。權(quán)威頁(yè)面本身可能導(dǎo)出鏈接不多,但是有很多來(lái)自樞紐頁(yè)面的導(dǎo)入鏈接。
典型的樞紐頁(yè)面就是如雅虎目錄、開(kāi)放目錄或好123這樣的網(wǎng)站目錄。這種高質(zhì)量的網(wǎng)站目錄作用就在于指向其他權(quán)威網(wǎng)站,所以稱為樞紐。而權(quán)威頁(yè)面有很多導(dǎo)入鏈接,其中包含很多來(lái)自樞紐頁(yè)面的鏈接。權(quán)威頁(yè)面通常是提供真正相關(guān)內(nèi)容的頁(yè)面。
HITS算法是針對(duì)特定查詢?cè)~的,所以稱為主題搜索。
HITS算法的最大缺點(diǎn)是,它在查詢階段進(jìn)行計(jì)算,而不是在抓取或預(yù)處理階段。所以HITS算法是以犧牲查詢排名響應(yīng)時(shí)間為代價(jià)的。也正因?yàn)槿绱?,原始HITS算法在搜索引擎中并不常用。不過(guò)HITS算法的思想很可能融入到搜索引擎的索引階段,也就是根據(jù)鏈接關(guān)系找出具有樞紐特征或權(quán)威特征的頁(yè)面。
成為權(quán)威頁(yè)面是第一優(yōu)先,不過(guò)難度比較大,唯一的方法就是獲得高質(zhì)量鏈接。當(dāng)你的網(wǎng)站不能成為權(quán)威頁(yè)面時(shí),就讓它成為樞紐頁(yè)面。所以導(dǎo)出鏈接也是當(dāng)前搜索引擎排名因素之一。絕不鏈接到其他網(wǎng)站的做法,并不是好的SEO方法。