Google儲存資訊的方式

3.1.1 Google如何建立索引

3.1.2 Google 停用詞

3.1.3 Google儲存索引的方式

3.1.4 Google 查詢索引的方式

包含特定文字的文件清單稱為紀錄列表(Posting list),查找包含一個以上特定文字的文件叫做「紀錄列表相交」(intersecting a post listing)。

Google搜尋引擎會執行下列工作:

所索引中找到一組包含使用者搜尋詞組的網頁。
將搜尋相符的網頁依據重要性和相關度進行排名。

3.1.5 補充索引

引發垃圾過濾器的網頁有很大的可能會直接被移除,而不會放進補充索引裡
在補充索引內的網頁不太可能會傳回給執行搜尋的使用者,也不太可能會在搜尋結果中取得好排名。
如果網站內有很其他相似度很高的頁面,就很可能放到補充索引內。
其他網站和你的網站相似度很高,但是它被引用頻率高的話,你的網頁有可能被放在補充索引中。
大型網站中沒有足夠的PageRank的網頁也可能被放到補充索引內。
難以索引的網頁,如網址中太多參數,網頁太大,超過101k,也有可能。
補充索引內的網頁會以「壓縮摘要」的方式保存,所以不是網頁裡每個字被完整檢索。

抵銷補充索引影響的SEO步驟:
確認網站的結構平衡,盡量像樹一樣的平衡
盡量確保至少10%~15%的網站入站連結為「深度連結」,也就是連結到許多重要的內部內容或分類頁
測試網站內容和其他網站的相似度。可以用網頁相似度檢查工具(Similar Page Checker):http://www.webconfs.com/similar-page-checker.php,如果測試失敗很可能網頁進入補充索引了,重新撰寫網頁或是配置不同網址。
確認網址中不要有太多參數,網頁的大小不要超過101k。

如何查網頁是否進入補充索引:

查詢所有被索引的網頁總數,在Google輸入:site:job.achi.idv.tw
查詢主索引中的網頁總數,在Google網站輸入:site:job.achi.idv.tw –inallurl:jobachi.idv.tw
補充索引內的網頁總數 = 所有被索引的網頁總數 – 主索引中的網頁總數

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *