字碼簡介
■ GB碼:GB碼是1980年國家公佈的簡體漢字編碼方案,在大陸、新加坡得到廣泛的使用,也稱國標碼。國標碼對6763個漢字集進行了編碼,涵蓋了大多數正在使用的漢字。
■ GBK碼:GBK碼是GB碼的擴展字符編碼,對多達2萬多的簡繁漢字進行了編碼,向下與GB碼兼容,簡體版Windows是使用GBK作系統內碼。
■ BIG5碼:BIG5碼是針對繁體漢字的漢字編碼,目前在台灣、香港的電腦系統中得到普遍應用,繁體版Windows是用Big5作系統內碼。
■ Unicode碼:Unicode碼是最新的國際標準編碼,採用二個字節 (16-bit) 編碼,收入了幾乎所有國家的文字符號,適用於所有語言的作業平台,但與ANSI碼不兼容,只應用於支援Unicode的程式。Unicode Little Endian普遍用於x86系統(ie. Intel),而 Unicode Big Endian 普遍用於RISC 系統 (ie. Alpha, Mac)。
■ UTF-8: Unicode 的變體,用 8-bit 編碼,每個字符由一至四個字節組成。
■ HZ碼:HZ是GB碼的變體,只用每個字節的首7-bit作編碼(即ANSI的首128個字符),常用於網絡資料傳送。
■ JIS: 日文編碼,即ISO-2022-JP,只用每個字節的首7-bit作編碼,常用於網絡資料傳送。
■ Shift-JIS: Microsoft制訂的日文編碼標準,適用於Windows日文平台。
■ EUC-JP: 常用於日文Unix平台,日文的PHP及MySQL多用這種編碼編寫。