<del id="sbrgp"><dd id="sbrgp"></dd></del>
<nav id="sbrgp"></nav>

<form id="sbrgp"></form><sub id="sbrgp"></sub>

    <form id="sbrgp"></form> <nav id="sbrgp"><address id="sbrgp"></address></nav>

    <wbr id="sbrgp"><legend id="sbrgp"><video id="sbrgp"></video></legend></wbr>
    <form id="sbrgp"><span id="sbrgp"></span></form>
    <form id="sbrgp"><pre id="sbrgp"></pre></form>

    首頁 >> 大全

    SEO算法深度分析之倒排索引,來解釋SEO排名的問題

    2022-07-13 大全 12 作者:考證青年

    SEO算法深度分析之倒排索引,來解釋SEO排名的問題

    今天給大家分享一些關于倒排索引的事情。為什么說倒排索引?因為當用戶搜索一個詞時,返回的搜索結果頁面是倒排索引和一系列算法過濾排序的結果,seo不就是你要爭取的排名數嗎?

    更簡單的說,搜索引擎的索引,其實就是我們平時看書的目錄。為了讓大家更快的找到適合自己的東西,比如導航站,其實就是網上的一個索引結構小例子。

    會有新聞、電影、小說、圖片等一些分類,方便用戶快速找到自己需要的。

    索引是搜索引擎中最核心的技術之一,因為在大量的網頁中,如何才能更快、更準確地找到用戶查詢詞的搜索意圖?

    先說幾個概念,方便大家在下面的描述中理解。

    1、文檔:我們以網頁的形式看到互聯網頁面,而網頁中包含的東西很多,比如:TXT、EXCEL、PDF等很多文件都稱為文檔。

    2、文檔集合:由許多文檔組成的集合稱為文檔集合。

    3、文檔編號: 上的每個文檔都有自己的唯一編號。

    4、單詞編號:每個單詞都有自己唯一的編號,用來表示單詞或詞組或句子。

    5、倒排索引:是搜索引起的索引庫中的網頁對應單詞的一種存儲形式,可以根據單詞快速獲取相關文檔。

    其實倒排索引很簡單。下面結合一些特征案例,逐步深入分析這個算法。你可以先了解一些基本的想法。

    SEO算法深度分析之倒排索引,來解釋SEO排名的問題

    上圖為每個證件號對應的不同證件。比如數字“1”對應“小明吃早飯”,數字“2”對應“小明早上吃了什么”,以此類推。

    另外,由于中英文的文化屬性不同,漢字之間并沒有像英文單詞那樣明顯的分隔符。索引首先對中文進行分詞(下例暫不去除停用詞),從而將一個句子分詞。變成了一組詞組,如下圖所示。

    SEO算法深度分析之倒排索引,來解釋SEO排名的問題

    上圖中單詞的ID記錄了每個單詞的編號,第二列是編號對應的單詞,第三列是哪些文檔包含這個單詞。

    比如“小明”這個詞,它的詞數是“1”,倒排列表是“1,2,4,5”,說明這些文檔集都包含這個詞。其實搜索引擎比較復雜,不僅要記錄單詞的文檔號,還要記錄單詞出現的頻率(TF,是什么意思?很多seo從業者都在說關鍵詞的密度,

    市場上計算關鍵詞密度的三個公式:

    公式1:關鍵詞數/頁面總詞數x 100%

    公式2:關鍵詞個數/頁面總詞數/關鍵詞詞數x 100%

    公式3:關鍵詞數/頁面分詞數x 100%

    不討論哪個公式更準確,我們發現關鍵字在公式中出現的次數,那么這個TF就是這個詞在頁面上出現的次數)

    這個TF是在搜索引擎計算搜索結果的排名時,分析查詢詞和文檔庫中哪個文檔更相關的參考因子。

    SEO算法深度分析之倒排索引,來解釋SEO排名的問題

    上圖比較復雜,我們看一下文檔頻率,因為多個文檔都包含這個詞,例如:“小明”出現在“4個文檔”中。“吃”出現在“4個文件”中,以此類推。倒排列表 (1;1), 1 為文檔 1,中間的 1 為該詞在該文檔中的出現頻率,即該詞在文檔中的位置 1,即在文檔中的第一個文檔詞。

    實際應用,無論紙上談多少,最好還是通過實戰來驗證這個說法,是否對排名有幫助。讓我們來看看。

    SEO算法深度分析之倒排索引,來解釋SEO排名的問題

    以首頁有機排名的10個網站的頁面類型和標題為例:

    首頁,排名第一,“早訓_早訓班_早訓學校【免費食宿】”

    首頁,排名第二的《早餐培訓_早餐培訓班_早餐培訓學校【免費加入】》

    首頁,排名第三,“上海鼎正小吃培訓學校_早期培訓_油炸包子培訓_燒烤培訓全國最專業...”

    首頁,排名第四,“上海早餐培訓|重慶面條培訓|山東雜糧糕培訓|紅燒蔬菜培訓|小吃培訓...”

    首頁,排名第五,“小吃培訓_特色小吃_小吃項目加盟-老少臺特色小吃培訓學校”

    內頁,排名第六,《早訓正式早訓班-培訓通行證》

    首頁,排名第7,“宜尚時代-早早餐培訓”

    首頁,排名第八,“點心培訓、早餐培訓、上海糕點培訓、上海德智烹飪美食培訓中心021-……”

    首頁,排名第九,“早餐餐廳加盟_營養早餐加盟_特色早餐加盟加盟_早餐餐廳加盟培訓_開業...”

    內頁,排名第十,《早教課程正宗早教中心-培訓通行證》

    分析表明,這10個網站中基本有兩個詞用于早期訓練。有沒有發現 early 和 是同義詞,(比如:我早點吃了什么,早餐吃了什么。這兩句話表達的意思是一樣的。)表示詞頻增加了一次,即是,3次。這里提醒大家不要堆砌關鍵詞,保持自然。

    另外,通過前面的實驗數據,得出標題最左邊的詞權重最高。僅結合這兩點,排名第一的網站標題就優于其他網站標題。另外,在標題的最后,“【免費食宿】”是一個吸引用戶點擊的營銷點,所以標題是科技與藝術的結合。

    下圖是網站從上線到現在的收錄和權重部分截圖:

    從上面兩張圖可以看出,這個網站的權重從2017年12月11日的站長權重來看是0,4天后比較容易達到1。然后網站上的文章直到投稿5個月都沒有更新。為什么有的seoer每天都更新文章,網站排名卻做不到?有朋友說,不寫文章,每天都不知道干什么。

    在我看來,這并不是影響排名的重要因素,因為前期對網站的信任可以在后期省下很多事情(PS:這是佛系SEO,讓網站自己排名)。

    SEO算法深度分析之倒排索引,來解釋SEO排名的問題

    通過上圖,我發現早教這個詞一直是首頁的第一位,非常穩定。因此,通過算法優化網站是非常可靠的。

    搜索引擎是世界上最復雜的程序之一。公開的算法數不勝數。有興趣的朋友可以看看搜索引擎公司為其專利申請提交的文件。該文件還將涉及高等數學和其他知識。,如果你能堅持下來并結合實踐,那么你就不用靠猜測排名來優化你的網站了。

    鄭重聲明:本文版權歸原作者所有,轉載文章僅出于傳播更多信息之目的。如作者信息標注有誤,請盡快聯系我們修改或刪除,謝謝。

    關于我們

    最火推薦

    小編推薦

    聯系我們


    版權聲明:本站內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容, 請發送郵件至 88@qq.com 舉報,一經查實,本站將立刻刪除。
    Powered By Z-BlogPHP.
    復制成功
    微信號: vvvyyy159357
    添加上方婦科醫生微信好友, 免費咨詢婦科!
    我知道了
    日本成本人H动漫无码免费 - 视频 - 在线观看 - 电影影院 - 品赏网