UTF-32
UTF-32
- 描述
- 最简单方案
- 直接使用字符编号的整数二进制形式
- 固定 4 个字节
- 字节序问题
- 大端 (Big Endian, BE)
- 高位字节在前,低位字节在后
- UTF-32BE
- 小端 (Little Endian, LE)
- 低位字节在前,高位字节在后
- UTF-32LE
- 大端 (Big Endian, BE)
- 缺点
- 每个字符都用 4 字节,浪费空间
- 实际采用较少
UTF-32 UTF-16 UTF-8 对比
UTF-16