最近seo教程自學網在思考一點關于各大搜索引擎排名的文字,有一點不成熟的想法分享討論。
各大搜索引擎在抓取頁面、提取文本、設置倒排索引進行分詞后,會對搜索關鍵詞進行分詞,將名詞、字符串等更重要的詞提取到分詞索引庫中進行交集,即得到一組基本相關的頁面文件,然后進入頁面排序部分。
在頁面排序部分,有兩個部分特別重要,一個是頁面在各大搜索引擎中的權重分值,另一個是重要詞性的分詞出現在頁面上的位置(標題、比較有效文本的初始區域等)。)。我覺得這兩部分的分數基本決定了大致的排名位置,其中頁面的權重分數會越來越多(偏向最大,比其他因素大很多),檢索。
不同的主要搜索引擎中頁面的權重分值明顯不同。一般來說,它們與鏈接關系密切相關。鏈接關系可以分為相對有效的鏈接(導出鏈接的網站主體、錨文本和目標網站高度相關)和高信任度的鏈接(來自大型網站、gov、edu等高pr網站)。這兩個環節可以參考山頂算法和trustrank算法。其中山頂算法的思路很有意思。在該算法的專利版本中,提到了對初始搜索顯示的結果頁面集再次進行鏈接關系相關性計算,以進一步精確搜索項范圍內權重最高的頁面。
頁面權重分數也會涉及到域名的建站時間因素(這里我認為不僅僅是因為鏈接存在時間因素)。在百度的算法中,主域名的權重對子域名和頁面的權重的影響會比Google大得多。
這些步驟完成后,進入最終的反作弊模塊,解決哪些作弊分數超過一定程度的頁面和沙箱中的頁面,然后得到最終的排序結果。
在考慮各大搜索引擎的這種排名算法時,我們基本上可以明確,大部分頁面在各大搜索引擎中沒有展示的機會,這是因為權重在各大搜索引擎的算法中具有較高的優先級。
在現有數據中,我認為Google以前的pr值是最能反映頁面權重的數據,雖然已經停止更新一年了。love stand、chinaz等第三方網站提供的百度權重,是根據過去從百度吸引的流量來計算的。雖然能在一定程度上反映域名的權重,但這種基于結果的方法并不能準確解釋問題。為了提高頁面權重,這些第三方數據不能作為標準。
正因為如此,做一個網站不應該是追求收集大量的文字(就像很多人拼命收集麥片搜索的文字一樣),也不應該是每天孜孜不倦的更新簡單的原創。如果沒有人分享收藏的文字和簡單的原創,就不會吸引到高質量的鏈接,頁面的權重也不會上升,也不會吸引到客戶。
正因為如此,網站應該更新有價值的原創,可以吸引多個網站的文本相關鏈接,或者制作有價值的工具網站,讓更多人分享,獲得高信任度的多個鏈接。只有這樣,各大搜索引擎最重要的權重分值排序階段才會獲得越來越多的機會。
標題:[新聞營銷]從各大搜索引擎的排序算法談談建站的
地址:http://www.jiuhuana2.cn/xinwen/25945.html
免責聲明:文芳閣軟文營銷平臺所轉載內容均來自于網絡,不為其真實性負責,只為傳播網絡信息為目的,如有異議請及時聯系[email protected],本人將予以刪除。