主頁 Google Google Search Console 【SEO】5個方法助您提高...

【SEO】5個方法助您提高網站被Google收錄(Index)機會

1942
0

網頁檢索(Crawling)和網頁收錄(Indexing) 兩個名詞可能對您很陌生或者抽象,簡單說這就是您的網站是否能顯示在Google的搜尋結果上的關鍵。基本上網頁檢索和收錄都是靠Google Bot(網絡機械人)處理,我們無法完全控制它每天將多少網頁收錄在Google索引上,但我們可以優化自己的網站,使Google Bot能更快抓取網頁,展示於人前,亦增加排名更高的機會。下面為您們介紹5個方法助您提高網站被Google收錄(Index)機會

1.Google search console基本設定

1.1 Robots.txt

Robots.txt 是引導Google Bot 如何檢索您的網頁的文字檔案。您可以透過Robots.txt去阻擋Google Bot檢索網頁某個目錄。一些含有敏感資料的網頁,例如會員帳戶/登入頁,最好不要被Google收錄到搜尋結果上吧。

這時候您就需要設定Robots.txt,只要開啟Notepad,加入下面程式碼

User-agent: *

如想將網頁某個目錄排除加入下面程式碼

User-agent: *
Disallow: /directory/*

*代表所有在這目錄下的所有網頁

儲存為robots.txt,上傳到網站目錄根即可。

www.mywebsite.com/robots.txt

設定完後便到Google search console測試是否成功排除

robots_txt

1.2 XML Sitemap

除robots.txt外,另一個對網頁收錄起最大作用的是XML Sitemap,這是用作電腦解讀您整個網站URL的網頁地圖。換句話說,就是告訴Google我的網站有幾多頁。同時,Sitemap會自動更新,並告訴Google網頁最近的更新狀態。

當您產生Sitemap後,可以到Google search console 上傳您sitemap的地址。不過Sitemap的缺點是只是建議Google 收錄網頁的URL,並不同robots.txt有引導Google Bot的能力,所以Google檢索時會有可能忽略在sitemap中的URL。

Sitemap的結構例子如下:

sitemap

網上有很多不同工具協助你產生Sitemap,例如使Wordpress架設網站可用外掛Google XML Sitemaps,你亦可以利用網上免費程式產生Sitemap。

當產生Sitemap後,便可上傳至網站根(Root directory),上傳後可打~/sitemap.xml測試是否上傳正確。

www.mywebsite.com/sitemap.xml

要注意的一點是Google建議如果網站多於50,000條URL的話便分開Sitemap,在這情況下你便要產生一個「Sitemap中的Sitemap」-「Sitemap index」,在「Sitemap index」裏需要包含之前產生不同的XML Sitemap,例子如下:

sitemap2

最後到Google search console 上傳您sitemap的地址

sitemap3

2.利用和優化檢索預算(Crawl Budget)

檢索預算(Crawl Budget)是指搜尋引擎分配給每個網站的資源,Google bot會以這個資源進行檢索,如果網站的檢索預算用完後,網頁就不會再被檢索或索引,被檢索的優先順序會被降低。

crawl-budget

從Google search console觀察檢索統計資料就能看到Google每日檢索的網頁數目等資料,這數據大致反映預算的高低,如果檢索統計資料呈現下滑的趨勢,表示你的檢索預算在下降。

要取得更多的檢索預算,便要從幾方面着手,包括網頁層級結構等因素。

簡單的網頁層級結構會令搜尋引擎更容易抓取,較佳的做法是使用者不會多過4個點擊才能找到需要的內容,如果網頁層級結構太複雜,Google Bot難以進入太深層網頁,而令網頁損失被抓取的機會。

3.避免網站無法進入(404 Error)

當我們在搜尋頁進入網站時見到404 Not Found,相信你也會即離開,也對網站的滿意度和信心下降,Google Bot亦如是。當Google Bot檢索到404頁,便會離開你的網站,太多的404頁會嚴重浪費檢索預算,所以作為網頁管理員,要經常監視着網頁是否有URL已經削除,並且要盡快修404頁面。

crawl-budget2

4.避免內容重覆

Google視網頁內容重覆為重要的排名因素,當搜尋引擎抓取到幾個版本的重覆網頁,便等於浪費檢索預算。同時,Google亦因太多重覆內容而降低你的網站排名。最常見的內容重覆是網頁有www和非www的版本被Google抓取,相同情況也在http和https的網站出現。避免內容重覆的做法便是使用301重新導向,將URL指向所需的版本。

5.持續監視

作為網頁管理員,經常性檢查Google search console的數據是能最快知道Google如何檢索和收錄你網站的最好方法。例如在Google search console中的檢索統計資料就能看到Google每日對你的網頁檢索數目,同時有Google下載網頁的時間和數目,這些數據持續下降的話,便是對網站的一個啟示,有可能是404頁增加,有可能是網頁太少更新等因素使然。

google_search_console1

你也會有興趣的.....  Google Mobile-Friendly 測試工具推出 Api Access