搜索引擎HITS外鏈分析演算法之深度解剖

HITS(Hyperlink – Induced Topic Search)鏈接分析演算法誕生在1997年,該演算法是由康奈爾大學中的一位博士提出,並且該演算法沿用於全球多個搜尋引擎當中。當然,不同的搜尋引擎針對於該演算法的側重點和內部公式都有不一的演算法結構調整,並且HITS演算法也是鏈接分析中最為重要的基礎演算法之一。

對於目前國內的整體搜尋引擎而言,百度作為國內的搜尋引擎領頭羊,我會帶著HITS的公開文檔針對百度搜尋引擎進行多元化的角度和實驗來深度解析HITS在SEO中的實戰應用。

首先,我們先來了解一下什麼是HITS演算法,包括他的計算公式和演算法原理以及他優缺點。深刻的理解了這些含義以後,然後我們藉助一些特定的實驗來驗證HITS的效果和實用性。

在HITS鏈接分析演算法當中,闡述最多的兩個點就是Hub頁面與Authority頁面。

一、什麼是Authority頁面(權威頁面)

簡單來說Authority頁面(權威頁面)是指在某一個領域範圍內或者某一個相關主題範圍內的高質量網頁。比如招聘領域,前程無憂網站的首頁就是該領域的一個高質量優質網頁。比如淘寶首頁就是電商領域的優質網頁。

二、什麼是Hub頁面(樞紐頁面)

而Hub頁面(樞紐頁面)通常就是它頁面本身包含了很多高質量的Authority頁面的鏈接,比如360網址導航首頁就是一個非常好的Hub頁面(樞紐頁面)。因為在360網址導航的站點頁面裡面聚合了眾多的不同類型的權威站點集合,比如新聞板塊聚集了新浪、騰訊等權威站點。視頻板塊聚集了搜狐視頻、優酷視頻等權威站點。這個點和大家經常發布的一些分類目錄網站外鏈有點類似(所以為何網站目錄外鏈還存在一定的效果,正是因為搜尋引擎本身有自己特有的演算法才會影響到你的排名)。

三、HITS演算法意義

之所以存在HITS演算法,是因為搜尋引擎需要在全球所抓取的網頁文檔集合當中找到與用戶搜尋請求查詢詞匹配度與之相關最高的頁面進行符合匹配,而這裡的匹配度相關最高的則是一些高質量的「Authority」頁面和「Hub」頁面,而不是大家常常理解的站內文章優質原創等因素。尤其是一些權威頁面,搜尋引擎更加親耐,因為這類站點頁面的內容會更加滿足用戶查詢的內容。

有很多朋友可能會問到一個問題,如何成為權威頁面或者樞紐頁面呢?

其實樞紐頁面在前面從概念意義上解釋來說已經告訴了大家如何去成為樞紐頁面。比如360導航網站的某一個站點類型的聚合頁面,再比如網站分類目錄站點的某一個站點類型的聚合頁面,這些都屬於樞紐頁面,但是樞紐頁面也會分為高質量樞紐頁面和一般性樞紐頁面。比如360導航網站首頁不僅是樞紐頁面並且還是導航站點的權威頁面。

那麼又如何成為權威頁面呢?

這裡就會提到大家想要理解的一個深層次的東西了,所謂的高權重外鏈其實可以理解為高權威外鏈,即權重=權威。搜尋引擎針對每一個站點和該站點的每一個頁面都有一系列的網頁評分,而這類評分決定著頁面的鏈接是否為有效的信任度。而權威頁面往往會有幾個特點:

1、品牌屬性

不管是某一種類型的站點,一旦要想成為行業的權威,品牌屬性必定濃厚,這點大家可以從百度搜尋引擎的知心演算法可以得知。如當用戶搜尋網上商城會聯想到京東、天貓;再如當用戶搜尋空調會聯想到海爾、格力、美的等知名品牌。正是因為這類品牌屬性,可以讓這類品牌官網站點在某一個行業領域形成獨特的權威度。但是,對於搜尋引擎而言,這類品牌屬性搜尋引擎是感觀不到的,而用戶卻可以知曉。因為對於用戶而言,用戶可以通過報刊,電視等多媒體方式了解到這些品牌的循環曝光,從而積累品牌的印象程度。那麼搜尋引擎是如何計算出這些品牌屬性的權威程度呢?針對搜尋引擎來說,搜尋引擎會通過全網抓取技術檢索全球所有網頁集合,根據文檔檢索模型計算出詞頻,而詞頻計算出來的相關詞頻次結合度最高的一類詞就是一個主題的符合度。通常情況下,是行業產品詞+品牌詞檢索。

2、歷史屬性

歷史屬性我們可以稱之為信任度屬性,何為信任度屬性,簡單的理解就是一個權威的站點必定是本身的頁面存在一定的真實性、可靠性的價值信任信息,就如百度百科的詞條會有對應的參考資料來作為參考佐證,從而針對內容進行信任度提升。所以即使內容不是原創,如果頁面滿足了信任度屬性,你的內容一樣非常有價值,也利於搜尋引擎優化。信任度屬性除了信息價值信任之外還有一點就是歷史數據積累,這點在老域名站點體現的非常明顯。越老的站點信任度屬性就體現的越明顯,比如做一些灰色產業或者做醫療的SEO人員就非常喜歡採用使用過的並且乾淨底子的老域名進行優化效果最佳。

3、曝光屬性

權威頁面除了品牌屬性和歷史數據積累等屬性還有一點就是曝光屬性,這類曝光屬性會包含兩個大類,其中是站內曝光屬性和站外曝光屬性。站內曝光屬性可以理解為頁面收錄量,一般情況下,當一個域名使用了10多年,每天都在充實著一些主題非常一致的優質樞紐頁面的時候,那麼自然而然他的曝光也會放的很大。而站外曝光屬性就是在整個互聯網站點文檔集合裡面所體現出你品牌屬性的詞頻集合和關鍵詞主題一致的文檔數量,比如闡述淘寶的網頁相關結果數有X億個網頁。而X億張網頁集合裡面和淘寶相關度最密切的是關於電商、商城、網購等主題行業辭彙。那麼通過歷史屬性的數據積累,淘寶站點在電商領域歸屬於權威站點。

1 2 3

Techroomage Seo SEO TechRoomage 提供專業白帽 Search Engine Optimization (SEO) 服務與 Responsive Web Design (RWD) 響應式網頁設計,透過完善的服務幫助客戶建立高品質網站與後續強大的網路行銷。

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *