GBK 編碼是一種針對漢字的字符編碼標準,是漢字編碼國家標準 GB 2312-1980 的擴展,也被稱為 GBK/GB2312。GBK 編碼包含了 GB2312 編碼中的全部漢字,并對一些生僻漢字和少數民族文字進行了擴充,共收錄了 21003 個中日韓漢字和符號。
GBK 編碼是雙字節編碼,每個字符占用 2 個字節。其中,第一個字節的范圍是 0x81 - 0xFE,第二個字節的范圍是 0x40 - 0xFE(不包括 0x7F),這樣總共可以組合 190 * 94 = 17860 個漢字和符號。
由于 GBK 編碼是針對漢字的編碼標準,所以在 GBK 編碼中,英文字母、數字、標點等非漢字字符仍然只占用一個字節,其編碼值與 ASCII 碼相同。同時,由于 GBK 編碼是 GB2312 編碼的擴展,所以 GB2312 中的漢字可以直接使用 GBK 編碼解碼。
需要注意的是,GBK 編碼與 Unicode 編碼不同,GBK 編碼并不是全球通用的字符編碼標準,僅適用于中文語境下的字符編碼和文本處理。
相關文章
關注千鋒學習站小程序
隨時隨地免費學習課程
掃一掃快速進入
千鋒移動端頁面
掃碼匿名提建議
直達CEO信箱