hello年夜家好,我是健康百科网网小航来为年夜家解答以上题目,汉字编码对比表gb2312,汉字编码尺度2022版收录汉字87887个)良多人还不知道,此刻让我们一路来看看吧!
汉字编码尺度GB18030-2022版,收录汉字87887个,比2005版增添17643个冷僻汉字
历史 清算
GB为国度强迫性国度尺度,GB 18030《信息手艺 中文编码字符集》是我国继GB 2312-1980和GB 13000.1-1993以后最主要的汉字编码尺度。GB 18030的总编码空间跨越150万个码位,为解决人名、地名等用字题目供给了方案,为汉字研究、古籍清算等范畴供给了同一的信息平台根本。
那末,我国汉字编码尺度有着如何的成长过程呢?
1980年3月9日,国度尺度总局发布了我国第一个汉字编码字符集尺度《信息互换用汉字编码字符集 根基集》,即GB 2312-80,共收了6763个汉字及经常使用符号,此中一级汉字3755个,二级汉字3008个,奠基了中文信息处置的根本。
1993年12月30日,全国信息手艺尺度化手艺委员会发布GB 13000.1-1993《信息手艺 通用多八位编码字符集(UCS)第一部门:系统布局与根基多文种平面》。该尺度采取ISO/IEC国际尺度ISO/IEC 10646-1:1993,采取了全新的多文种编码系统,收录了中、日、韩20902个汉字,是编码系统将来成长标的目的。
1998年10月,信息财产部电子四所等手艺职员构成尺度草拟组,提出了尺度拟定原则——与GB 2312信息处置互换码所对应的事实上的内码尺度兼容,在字汇上撑持GB 13000.1-1993的全数中、日、韩(CJK)同一汉字字符和全数CJK扩充A的字符,而且肯定了编码系统和27484个汉字,构成兼容性、扩大性、前瞻性兼备的方案。
2000年3月17日,信息财产部和国度质量手艺监视局发布GB 18030-2000《信息手艺 信息互换用汉字编码字符集 根基集的扩充》,收录了27533个汉字。
2005年11月8日,中华人平易近共和国国度质量监视查验检疫总局、中国国度尺度化办理委员会发布GB 18030-2005《信息手艺中文编码字符集》,收录了70244个汉字。
2022年7月28日,国度尺度化办理委员会、产业和信息化部、国度说话文字工作委员会在京结合召开《信息手艺 中文编码字符集》(GB 18030-2022)强迫性国度尺度发布宣贯会。新版《信息手艺 中文编码字符集》强迫性国度尺度将于2023年8月1日正式实行,共收录汉字87887个,比GB 18030-2005,增添录入了17643个汉字。
《说文解字》收单字9353个,《康熙字典》收单字47035个,《汉语年夜字典》收单字60370个,今朝收单字最多的词典是《中华字海》,收单字85568个。GB 18030-2022收字比《中华字海》多2319个。
据统计,汉字单字可达14万个,而经常使用汉字3500个就够用了,只有前人名、古地名、古籍清算、文字考古等会碰到一些冷僻字。汉字字库的扩充,首要是为了特别行业和研究职员便利,汉字鼎新永久不会走“返古”“返繁”的复旧道路。
本文就为年夜家讲授到这里,但愿对年夜家有所帮忙。