常见的文字编码格式
常见的文字编码格式
GB2312字符集
作用:国家简体中文字符集,兼容 ASCII。汉字编码
位数:使用2个字节表示,能表示7445个符号,包括6763个汉字,几乎覆盖所有高频率汉字。
范围:高字节从A1-A7,低字节从A1到 FE 。将高字节和低字节分别加上0xA0即可得到编码。
GBK 字符集
作用:它是GB2312的扩展,加入对繁体字的支持,兼容GB2312。
位数:使用2个字节表示,可表示21886个字符。
范围:高字节从81到 FE ,低字节从40到 FE。
GB18030字符集
作用:它解决了中文、日文、朝鲜语等的编码,兼容GBK。
位数:它采用变字节表示(1ASCII,2,4字节)。可表示27484个文字。
范围:1字节从00到7F;2字节高字节从81到 FE,低字节从40到7E和80到 FE ;4字节第一三字节从81到 FE,第二四字节从30到39。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。