中文字符集基础知识

  1. ASCII : 它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO 646
  2. GB2312 : 收录的汉字已经覆盖99.75%的使用频率。“分区”处理。在中国大陆和新加坡获广泛使用。不包括繁体字。
  3. BIG5 : Big5字符集共收录13,053个中文字,该字符集在中国台湾使用
  4. GB18030 : GB 18030字符集标准解决汉字、日文假名、朝鲜语和中国少数民族文字组成的大字符集计算机编码问题。该标准的字符总编码空间超过150万个编码位,收录了27484个汉字,覆盖中文、日文、朝鲜语和中国少数民族文字。满足中国大陆、香港、台湾、日本和韩国等东亚地区信息交换多文种、大字量、多用途、统一编码格式的要求。
  5. Unicode : UTF-8 UTF-16 和 UTF-32

个人理解

UTF-8、GB2132、GBK、 UTF-8 的区别

* GB2312收录简化汉字及符号、字母、日文假名等共7445个图形字符,其中汉字占6763个。

  • GBK是GB2312-80的扩展,是向上兼容的。它包含了20902个汉字
  • GB18030-2000(GBK2K)在GBK的基础上进一步扩展了汉字,增加了藏、蒙等少数民族的字形。

参考资料

编码转换

讨论

tech/中文字符集.txt · 最后更改: 2009/04/16 00:58 由 kenvin
到顶部
chimeric.de = chi`s home Creative Commons License Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0 红麦软件 红麦软件