HTML5的lang要設成zh-TW或zh-Hant

HTML5的lang要設成zh-TW或zh-Hant

在HTML5的<html>中可增加lang=來標註網頁的語系,讓瀏覽器能更正確的解析與編碼,但從XHTML 1.0以來lang=???就不斷演進中,而在HTML5的時代究竟要怎麼定義?

目前最主要的規範是依照IETF(Internet Engineering Task Force 國際網路工程研究團隊)的RFC 4646 (http://www.ietf.org/rfc/rfc4646.txt )的Tags for Identifying Languages所定義。它的要求為 language-script-region-variant-extension-privateuse 就是 語言 – 字體 – 地區 – 方言 – 特殊附加資訊。

以台灣繁體標示即為zh-Hant-TW 如

<!DOCTYPE html>
<html lang="zh-Hant-TW">
<head>
<title>page title</title>
</head>
<body>
</body>
</html>

一般寫法是language標籤應全部小寫,region標籤全部大寫,script標籤只有首字母大寫。不同標籤之間用連字型大小-串聯起來。不過不管大小寫,目前瀏覽器都能處理,只不過可能是實際現況,用舊式的zh-TW相容性似乎要高一些。

它也可以用在段落以區別語法如

<span lang="zh-Hans-HK">xxxx</span>

但因現在HTML多以UNICODE編碼,各國語系都能在同一頁面呈現,似乎很少人這樣處理。

以下是其他語言的標示法(照字母排序)。

zh-Hans 簡體中文

zh-Hans-CN 大陸地區使用的簡體中文

zh-Hans-HK 香港地區使用的簡體中文

zh-Hans-MO 澳門使用的簡體中文

zh-Hans-SG 新加坡使用的簡體中文

zh-Hans-TW 臺灣使用的簡體中文

zh-Hant 繁體中文

zh-Hant-CN 大陸地區使用的繁體中文

zh-Hant-HK 香港地區使用的繁體中文

zh-Hant-MO 澳門使用的繁體中文

zh-Hant-SG 新加坡使用的繁體中文

zh-Hant-TW 臺灣使用的繁體中文

其他舊式用法,PS:不符合RFC 4646規範

zh-hakka 客家話

zh-cmn 普通話

zh-cmn-Hans 簡體普通話

zh-cmn-Hant 繁體普通話

zh-gan 江西話

zh-guoyu 國語

zh-min 福建話

zh-min-nan 閩南話

zh-wuu 吳語(上海話)

zh-xiang 湖南話

zh-yue 粵語