重複內容會影響SEO排名嗎?避免SEO排名分散的「重複內容」重點整理

隨著 Google 自 2011 年至今不斷地更新演算法,以及更多打擊低質量內容網站的措施,「內容為王」不論是對於使用者體驗、網站經營或 SEO,已經是公認不變的趨勢。因此在操作 SEO 時,如何優化內容品質,一直是行銷人不斷討論的議題。
「重複內容」對於搜尋排名有哪些影響?一直是操作 SEO 內容品質優化常見普遍的問題,過去也不斷地被人們討論著。究竟重複內容到底會不會影響搜尋排名?重複內容會不會受到搜尋引擎的「懲罰」呢?SEO產業常聽到兩種觀點,重複內容對於爬蟲不友善,但亦同時有主張重複內容影響不大的論點;這篇Benson將為各位講解何謂重複內容,其影響為何?以及是否 Google 對於重複內容的因應措施。

什麼是搜尋引擎中的重複內容?

根據 Google 官方說法:「重複內容泛指的是,一或多個網域中完全或大致與其他內容相符的實質內容區塊。」包含行動版內容、多個不同網址導向的商品項目以及列印頁面,一般而言,Google並不會懲罰重複內容的網站,但若是在整個網域中置入大量重複內容,讓使用者在同個搜尋結果頁面看到相同內容,就會讓網頁的使用者體驗受影響。

重複內容對搜尋排名的影響

.不會對重複內容進行「處罰」,但卻會影響搜尋排名

根據Google官方針對重複內容的問答表示,Google官方並不會對重複內容特別進行「懲罰」,不過 Google 希望人們理解,如果Google能在別的地方發現和你的頁面相同的內容,而競爭對手可能會獲得在你頁面之上的搜尋排名,這並不算是一種懲罰。

.Google SERP (搜尋結果頁面) 會過濾重複的內容

Google 為了打造良好的使用者搜尋體驗,並且希望對使用者呈現多樣化的搜索結果,並不會一遍又一遍地重複同一篇文章,所以他們會選擇只顯示一個版本。

.Google鼓勵獨特、有價值的原創內容

當搜尋引擎抓取到相同的內容時,他會使用各種「信號」來辨別這篇頁面內容誰才是原創者,或是哪個頁面較有價值,做為排名的指標,因此原創內容是較利於搜尋排名競爭的。例如搜尋引擎能從文章頁面的發布時間,可以用來判定誰才是原作者。而另一種狀況是參考網站的權重,若你的原創內容投稿到大型媒體網站,因大型媒體網站平時有更多的使用者,為了讓優質的內容被更多使用者看見,可能會有非原創作者,但是排名卻更優異的狀況,因此文章內容投稿也會是操作 SEO 時應注意的環節。
(關於文章投稿的操作細節可參考談《文章投稿》對 SEO 的影響,文章投稿會傷害 SEO 嗎一文)

.消耗爬取「預算」

搜尋引擎爬取網站時,並不會一直停留在特定網站上,將網站所有頁面完整爬取,而重複的頁面內容會消耗頁面索引的數量,品質也會降低。此外網站的速度也會影響搜尋引擎的爬取效率(關於網站速度優化與爬取預算詳細介紹可參考做 SEO 你絕對不可以忽略的【網站速度優化】,關於速度優化的三兩事一文)

.分散頁面權重

搜尋引擎會針對頁面的權重、內容品質、相關性進行評分,來作為搜尋排名的參考依據,若有太多相同頁面有重複內容,則會將這些權重、分數,分散到不同的網址。
瞭解重複內容影響之後,大家一定能瞭解到,避免重複內容所造成的負面影響,和維持頁面內容的獨特性、原創性有多麼的重要!那麼經營網站時,只要踏實地做好內容經營,撰寫高品質的原創文章,網站就不會出現重複內容的頁面嗎?不幸的是,多數的重複內容頁面,其實是在「不經意」的情況下產生的,而不是刻意操作的結果。

造成重複內容的常見狀況

.動態網址Session ID 或 URL參數

動態網址是藉由網址參數調用資料庫的數據,來生成頁面內容,而不是在伺服器有一個靜態的HTML文件存在。因此當網址的參數相同,只是參數排列的順序不同,就會產生不同網址,但頁面內容其實一模一樣的狀況(從資料庫調用的數據一模一樣),此時就會出現重複內容、重複頁面的問題。
範例:
http://example.com /?paged=2&cat=8

http:// example.com /?cat=8&paged=2
很可能會是完全一樣的內容
session ID也是常見的重複內容發生狀況,當瀏覽網站的每一個用戶,網址參數URL中有不同session ID時,就會發生這種情況。

.www及非www頁面/http與https

網站常會因伺服器設定不同,而有保留www或去除www皆會有網址存在的狀況
例如:
www.example123.com

example123.com
可能就會存在兩個不同網址,但卻有相同內容的狀況。
而http與https也是類似的狀況,許多網站為了資訊安全的考量,將原本http的網址改為https,而形成存在兩個不同網址,但卻有相同內容的狀況。
例如:
http://www.example123.com

https://www.example123.com

.僅有些微差異的頁面

最常見的案例是在電商網站,同商品但不同規格的情形。例如同一套衣服不同顏色,同一款鞋子不同size等狀況,產品頁面的內容完全相同,只有些微的差異。
那要怎麼解決上述這些呢?接下來就針對上述幾種常見狀況解決的方法做介紹。

解決重複內容的方法

.動態網址參數造成的重複內容

於search console的主選單,選取檢索>網址參數。在search console中設定希望google處理的特定參數(例如參數page),選取「編輯」,針對會造成重複頁面的參數進行設定。
關於最新版Search Console教學,可參考 Google Search Console 教學 & 所以問題處理 一文。
重覆內容-網址參數處理1
以參數page為例,選取:變更、重新排序或限制網頁內容->編排頁次->讓googlebot決定
重覆內容-網址參數處理2

.針對http/https或www/non-www 301轉址

由於不同的網址會將相同的頁面權重分散,因此建議使用能傳遞頁面權重的301轉址是最為理想的做法,將重複的頁面轉址到標準網址,使頁面的權重能夠集中,也能避免搜尋引擎搜尋到重複內容的頁面,能更利於搜尋排名的競爭!
此外301轉址的方式,會因為選用的伺服器不同,而有不同的轉址方式。
若是Apache的伺服器可使用htaccess來進行301轉址,關於htaccess的301轉址的方法可參照[SEO 技術分享] htaccess 301 Redirect 教學一文,而若是微軟IIS的伺服器,可參照301/302轉址如何影響網站SEO?三大要點讓你做好網站SEO一文。

.針對內容相近的頁面設定canonical標準網址

可使用canonical屬性,指定標準網址,告知搜尋引擎希望哪個版本的頁面被收錄,而不會將權重分散給非標準網址。
那麼要如何使用canonical屬性呢?若今天有兩個重複內容的頁面,而我希望頁面內容只出現在A頁面的網址(偏好網址)
A頁面:(偏好網址)
B頁面:(非偏好網址)
要使用canonical屬性指定偏好網址作法如下:
在B頁面(非偏好網址)HTML的<head>標籤中加入下列語法
<link rel=”canonical” href=”A頁面的網址” />
這樣就能告知搜尋引擎你所偏好的網址了!
範例:
偏好網址:http://www.example123.com.tw/product.php?act=view&id=692&item=4757
非偏好網址:http://www.example123.com.tw/goods.php?act=view&id=692&item=4757

這樣就能成功地向搜尋引擎指定偏好網址。
延伸閱讀:rel=”canonical” 語法應用教學,SEO上的最佳使用時機

結語

儘管對於重複內容,有部分人將其視為排名的次要因子;然而Benson過去的實測回顧,過多的重複頁面,亦會影響爬取預算及網頁收錄,此外,在2024年的Google搜尋引擎內部文件外洩事件,確立了「網頁權重」真實存在的概念,因此Benson推測,我們仍應盡量避免,看不見的權重分散在不同的網址上。以上就是重複內容常見問題,希望大家在這個內容為王的時代,創造優質內容的同時,別讓這些「不經意」的重複內容問題,讓你的優質內容打了折扣!