多語言網站優化和hreflang標籤

從近兩年我個人的SEO服務項目情況看,有越來越多的公司需要做多語言網站優化。國內公司做多語種網站,以電商公司居多,要往外賣產品。國外公司也有不少要做中文網站,不過電子商務類的不多,大品牌、留學/移民之類的比較多。

如果涉及語言比較少,比如只有英語和中文網站,語言使用範圍不複雜的話,做SEO時倒沒有什麼特殊要求,英文、中文網站可以放在兩個獨立域名上,也可以放在同一個域名的兩個子域名上,甚至可以放在二級目錄上,內容和結構等可以沒什麼關聯,基本上可以各做各的。即使頁面內容是對應翻譯的也沒問題,中譯英或英譯中,內容一樣,語言不同,搜索引擎不會認為是複製內容。

有時候情況複雜點,同一個國家使用多種語言,而且使用人數差別沒有那麼大,像中文在中國這樣具有壓倒性主流地位,如加拿大使用英語、法語,瑞士使用德語、法語、義大利語。一個語言也經常在多個國家使用,英語在英國、美國、加拿大、澳大利亞、紐西蘭,甚至新加坡,都是最使用廣泛的語言。

在這些稍複雜的情況下,需要考慮一些多語言網站的SEO問題:

  • 同是英文網站(或其它語言),不同國家或地區有各自獨立域名,雖然也許有些許修正,如不同拼寫(英國拼為colour,美國拼為color之類),但主體內容是一樣的,怎樣避免被搜索引擎認為是複製內容?

  • 一個語種頁面收錄良好,另一個語種收錄有問題,能不能讓搜索引擎知道另一個語種版本在哪裡,從而改進收錄?

  • 同一個國家,有不同語言使用者,怎樣讓搜索引擎知道這個頁面是針對哪個語言的?

使用hreflang標籤設置語言和地區,可以幫助解決這些問題。

hreflang標籤的標準格式是這樣的:

<link rel=」alternate」 href=」https://www.abc.com.cn」 hreflang=」zh-cn」 />

hreflang標籤分兩部分,前面是語言,後面是地區。上面標籤指明的是,這個頁面針對中文(zh)、中國地區用戶(cn)。

對應的:

<link rel=」alternate」 href=」https://www.abc.com.au」 hreflang=」en-au」 />

指的是英文、澳大利亞。

<link rel=」alternate」 href=」https://www.abc.co.uk」 hreflang=」en-gb」 />

指的是英文、英國。

在三個網站上,上面三個標籤都放上,搜索引擎就知道針對不同語言、地區的版本是關聯的,各自的網址是什麼,並且不會被當成複製內容。

還有幾個細節要注意。

hreflang標籤可以放在同一個域名的不同頁面上,也可以跨域名,放在不同域名上。

hreflang可以只寫語言部分代碼,如:

<link rel=」alternate」 href=」https://www.abc.com」 hreflang=」en」 />

但不能只寫地區部分:

<link rel=」alternate」 href=」https://www.abc.ca」 hreflang=」ca」 />

上面這個是無效的,只寫地區代碼ca,不會被自動判斷為是英文還是法文。

所有語言頁面上都要加上所有hreflang標籤,形成互相確認。中文頁面指明自己是中文,同時指明英文版本在哪裡,英文頁面同樣要確認自己是英文版本,對應的中文版本在哪裡。

代表語言的代碼要符合ISO 369- 1 標準,代表地區的代碼要符合ISO 3166-1 Alpha2 標準。寫代碼時最好到官網查一下,不要想當然。比如上面提到的,英國的地區代碼是GB,不是UK,和域名後綴不一樣的。

中文的語言代碼是ZH,不是CN。這個是有效的:

<link rel=」alternate」 href=」https://www.abc.cn」 hreflang=」zh」 />

這個是無效的:

<link rel=」alternate」 href=」https://www.abc.cn」 hreflang=」cn」 />

再比如,最近一個客戶的日文頁面寫成這樣:

<link rel=」alternate」 href=」https://www.abc.co.jp」 hreflang=」jp」 />

這個是錯的。前面提到,可以只寫語言代碼,但日語的語言代碼是JA,不是JP。

再比如,韓語的語言代碼是KO,不是KR,雖然韓國的地區代碼和域名後綴是kr。

發表迴響