GB2312简体中文编码表详解:汉字与字符集划分
需积分: 15 44 浏览量
更新于2024-07-17
收藏 420KB DOCX 举报
GB2312简体中文编码表是中国早期的汉字编码标准之一,由国家标准总局于1981年发布,用于在计算机系统中存储和传输简体中文字符。该标准收录了6763个字符,分为一级汉字(3755个)和二级汉字(3008个),以及682个全角字符,如拉丁字母、希腊字母、日文假名和俄语西里尔字母等。
GB2312采用的是区位码体系,将字符集划分为94个区域,每个区域包含94个字符。其中,01-09区是特殊符号,10-15区和88-94区未被编码,16-55区是一级汉字,按照拼音顺序排列,而56-87区则是二级汉字,依据部首或笔画进行排序。每个汉字或符号由两个字节组成,高位字节(0xA1-0xF7,对应区号加0xA0)存储区码,低位字节(0xA1-0xFE,对应位号加0xA0)存储位码。例如,汉字“啊”的区位码为1601,高位字节为0xB0(0xA0+16),低位字节为0xA1(0xA0+1)。
值得注意的是,GB2312编码中虽然理论上可以容纳82个区乘以94个位,即6768个编码位置,但由于存在五个编码空缺(区码215,位码250-254),实际编码的汉字数量为6763个。在计算机存储时,GB2312通常使用EUC-CN编码方法,以兼容ASCII编码,并且每个汉字占用两个字节,确保了简体中文字符的正确表示。
GB2312编码在早期的中文计算机应用中扮演了重要角色,尤其是在Windows操作系统早期版本中,它作为默认的中文编码格式广泛使用。然而,随着Unicode的普及,GB2312逐渐被GBK(扩展的GB2312)所取代,后者支持更多的汉字和字符集,能够更好地满足现代中文处理的需求。尽管如此,对于一些历史文档和特定场景,GB2312仍然是理解和处理简体中文字符的重要参考。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2014-03-04 上传
184 浏览量
2020-08-06 上传
2021-12-13 上传
2021-03-30 上传
2022-07-06 上传
jimmycn2358
- 粉丝: 6
- 资源: 18
最新资源
- 半导体行业-功率半导体对比(斯达半导VS华润微)-200225.rar
- Mapping_Earthquakes
- 目的:Проект4:Место
- 【地产资料】XX地产 经纪人工作日报表.zip
- Scratch游戏编程案例 Scratch小猴数草莓
- CppDiFactory:一个简单的C ++ 11单头依赖注入容器
- FinalProject-Frontend
- java宿舍管理系统.rar
- cleverspeech-exp:cleverSpeech存储库的实验定义-https
- 毕业设计&课设--毕业设计-学生信息管理系统.zip
- anchor-ui:基于Bootstrap的前端框架
- WPA-Wi-Fi-Key-Changer,用于基于Arduino的运动学和Mikrotik:用于使用telnet的路由器的Wi-Fi WPA密钥转换器
- jozz-casino.github.io:我的新模板
- esayPoiExcel.zip
- ReactJS.NET-with-require.js-getting-started-tutorial:ReactJS.NET 和 require.js 入门教程代码
- FarmMonitor:农场监控器启动项目