GBK

  • 建立在 GB2312 的基础上
  • 向下兼容 GB2312
    • GB2312 编码的字符和二进制表示,在 GBK 编码里是完全一样的
  • 同样使用固定的两个字节表示
  • 字节范围
    • 高位字节:0x81~0xFE
    • 低位字节:0x40-0x7E 或 0x80~0xFE
    • 低位字节可以从 0x40 开始,最高位可能为 0
    • 判断汉字还是 ASCII 字符的方法:
      • 解析二进制流时,如果第一个字节的最高位为 1
      • 将下一个字节读进来一起解析为一个汉字
      • 解析完后,跳到第三个字节继续解析

文章作者: huan
版权声明: 本博客所有文章除特別声明外,均采用 CC BY-NC-ND 4.0 许可协议。转载请注明来源 huan !
  目录