何謂庫存頁面?
說到庫存頁面,相信對於SEO從業人員一定都不陌生,通常SEO從業人員不論是在操作Google或是Yahoo或是Bing搜尋引擎時,都會透過個搜尋引擎的庫存頁面來確認蜘蛛來訪的時間,以及整個頁面的關鍵字分布情形。
在詳細說明之前,我們先來看看維基百科的定義:庫存頁面(英語:Web cache)又可稱為頁庫存檔、網頁快照是搜尋引擎的一項特色功能。搜尋引擎在收錄網頁時,對網頁進行備份,存在自己的伺服器快取里,由於頁庫存檔是儲存在搜尋引擎伺服器中,所以檢視頁庫存檔的速度往往比直接存取網頁要快。頁庫存檔中,搜尋的關鍵詞用亮色顯示,使用者可以點選呈現亮色的關鍵詞直接找到關鍵詞出現位置,便於快速找到所需訊息,提高搜尋效率。
從哪裡可以觀看庫存頁面?
當使用者輸入一段關鍵字時,我們可以在Google搜尋列表頁(SERP)上看到許多筆資料,這時我們就可以點擊網站網址列旁邊的向下箭頭,來觀察頁庫存檔囉~~
庫存頁面有哪些部份需要注意?
- 時間戳記:可以提供SEO從業人員來判斷搜尋引擎蜘蛛是否來訪過網站,以及何時來訪
- 關鍵字分布狀況:從下面兩張圖可以觀察到Google與Bing的差異在哪,不過原本Google的庫存頁面與Bing是相似的,在上個月之前就被Google突然拿掉了,畢竟Google本身就不太推崇站長操作SEO了(笑)
不過,相信上面的介紹已經是許多站長會使用的觀察方式,所以,以上純屬廢話(被毆),開玩笑的啦,我們還是要照顧一下業主或是剛踏入SEO領域的行銷人員囉(理直氣壯),但接下來我要談論的是在我操作的SEO過程中透過庫存頁面發現一些問題的經驗。
庫存頁面經驗談
案例一:我曾遇到一個狀況是,從庫存頁面裡面發現網站為甚麼原本有的天區(header)以及左側導覽都沒有被搜尋引擎cache到(也就是說整個網站只存在產品介紹那個區塊),由於這個狀況會影響到頁面收錄的程度,所以必須要去找出原因為何!
透過庫存頁面的原始碼,我們發現到由於網站宣告為DOCTYPE XHTML 1.0 Transitional規範,故本身語法的要求就比較嚴謹,所以XHTML所有標籤都必須閉合,也就是說開始標籤要有相對應的結束標籤。只有少數標籤是在開始標籤末尾加入斜線,比如<img … /> 、<br />。而原始碼當中就出現了上述的問題,<script>的呼叫語法缺少了閉合標籤,所以後方原始碼幾乎被認為是Javascript的程式碼(搜尋引擎蜘蛛會忽略),直到碰到下一組閉合</script>為止。
案例二:最近在觀察Bing的搜尋結果頁面時發現到許多網站的庫存頁面顯示不完全,主要問題在於原始碼都不夠簡潔,現階段Bing的緩存頁面有限制大小的問題,所以當原始碼過長,後面的程式碼就不會被緩存起來,也就是說在操做SEO的時候無法觀測到關鍵字分布的情形。
解決方法一:將__VIEWSTATE移至</form>之前,避免__VIEWSTATE過大導致速度變慢,以及變面搜尋引擎找不到正確的資料。
解決方法二:禁用__VIEWSTATE的功能,但會犧牲掉ASPNET的方便性。
案例三:使用meta標籤來控制緩存頁面,最近有看到一個案例是使用meta中的Pragma以及cache-control來控制緩存頁面(如下圖),導致無法觀測到時間戳記以及關鍵分布狀況,所以請務必小心使用此語法,不希望被搜尋引擎Cache的頁面在使用即可。
結論:其實庫存頁面對於SEO從業人員只是一個參考的指標,並非絕對,但就以案例二而言,雖然無法觀測到關鍵字分布情況,但不代表搜尋引擎真的沒有爬到內容,所以不必太過緊張,但須注意其中的一些微小細節,例如案例一的狀況,相信透過今天的[SEO教學文章 – 庫存頁面來教你SEO]一定能夠幫助站長所多~
看完上述內容之後,如果還是無法解開您的問題,歡迎跟awoo聯絡XD