GB18030

  • 向下兼容 GBK
  • 使用变长编码
    • 有的字符是两个字节
      • 字节表示范围与 GBK 一样
    • 有的字符是四个字节
      • 字节范围:
        • 第一个字节:0x81-0xFE
        • 第二个字节:0x30~0x39
        • 第三个字节:0x81-0xFE
        • 第四个字节:0x30-0x39
    • 如何判读两个字节还是四个字节表示一个字符呢?
      • 看第二个字节的范围,如果是 0x30~0x39 就是 4 个字节表示,因为两个字节编码中第二个字节都比这个大。

文章作者: huan
版权声明: 本博客所有文章除特別声明外,均采用 CC BY-NC-ND 4.0 许可协议。转载请注明来源 huan !
  目录