汉字编码中的字数


  我们知道,电脑是外国人发明的,它的键盘为通用键盘,只有26个英文字母键,所以输入英文时,可以快速而高效地输入。但是要用世界通用键盘来输入中文就遇到了很大的难题。因为外国人在发明电脑时,没有想到,也不可能想到占世界人口五分之一的中国人成千上万个中国方块字如何输入的问题。

  汉字由音、形、义三要素构成,它的特点是字数多、笔画多、同音字多和字形复杂,还有一字多音,一字多义等,这就更加造成汉字输入电脑的难度。鉴于这种情况,我国已经在不断规范汉字的数量,规范汉字的笔画和笔顺,制定了一些行之有效的标准,使汉字编码有了有章可依。

  现在在中文编制码中,国家一般采用两个标准。一是常用字:1980年制定的国家标准(GB2312-1980)信息交换编码字符集中的6763个字为常用字,其中一级字为3755个,二级字为3008个。二是次常用字 。2000年制定的国家标准(G B18030-2000)信息交换用汉字编码字符集的14232个繁体字或异体字。以上两项合计,共有21003个字。这两种数据库是编码汉字中,都必须输入中文规定的汉字。这也就是说,凡是制作中文输入软件的,都必须能够输入这两万多汉字的才是正规的。