挣脱旧拼音部首束缚,更新汉字输入基础
现在流行的打字码,都局限于西洋式拼音与旧部首法观念,错打了基础。需知道汉语拼音方案与旧部首法都不是根据电脑需要设计的,因它们出现时还不知道会有电脑出现。
如流行的形码主要是像旧部首法那样用几百个部件(字根、偏旁部首等),十分难记难学。流行的音码都是用西洋式分词连写音素拼的汉语拼音方案,比传统的民族式拼音繁难得多。
把注音识字查字打字与手语结合起来,当系统工程考虑的三峡汉字工程室,认为先要考虑好小学识字查字打字入门的基础码的研究,它们也是中文信息处理的基础。不能因汉语拼音方案与旧部首也可用于查字打字,就误以为它们是宜于电脑打字的模式与基础,把三十多年来的小学查字打字教学陷在泥坑式的基础里不能自拔提高。深入分析了这些而推出的系列化三峡码(S码),提出了新的汉字输入基础模式。
(1) 汉语拼音基本式
小学生一入学,就要学注音识字,就需要选好注音查字打字法。而民族传统的拼音中,有比汉语拼音方案更好的拼音法。S码揭示,汉语中潜藏有某两字快读,可能拼出另一个汉字的音的秘密规律。如“几安”快读就可拼出“间简”音。而且只要38个汉字,就够普通话拼音用了。
用单音节的汉字或表示单音节的字符当拼音字母,或用汉字表示音母(声韵母)来拼音,就是音节字母拼。西方是用拉丁字母表示辅元音音素来拼音,是音素字母拼。
元音大致相当于传统用汉字表示的韵母。辅音在汉语汉字中,没有对应的字或字符。因汉语中辅音一般都是后接元音拼成单音节字音,所以有字音概念而没有显性的辅音概念与相应的字符表示。千多年来流行的反切注音法就是用汉字表示音母的声韵母拼音法。
制定汉语拼音方案时,还不知道可能有电脑,也就不可能考虑到电脑来设计。当时还不知道有比西洋拼音好的音节字母拼,认为汉字落后,中国传统注音的反切落后,西洋分词连写音素拼的文字先进,想把汉字改为西方那样的文字。因此推出了西洋式分词连写音素拼的汉语拼音方案,比传统注音法或当时小学用的注音字母都繁难得多,更不合新出现的电脑需要。
在S码简拼体系中,表示音母的字母符号有汉字式的H型、简笔画式的J型、拉丁字母式的P型等。电脑表示“八百般”的声母键上,同时标有H型汉字表示字(引导字)的“不”、简笔式表示符“阝”和拉丁式的B,即同时标有“阝B不”的键。38音简拼的H、P型代码见下表。
38字式简拼音母(声韵母、引导字)表
┌┈┈┈┈┈┈┈┈┈┬┈┈┈┬┈┈┈┈┈┈┈┈┐
┆几j七q夕x 四s十sh ┊一i于v┊啊a艾ai安an袄ao ┊
┊子z支zh次c尺ch日r ┊五u ┊昂ang额e诶ei二er┊
┊得d特t讷n乐l个g克k├┈┈┈┤恩n(en)嗯ng ┊
┊不b扑p木m夫f 核h ┊介母 ┊也ie喔o翁ong偶ou┊
├┈┈┈┈┈┈┈┈┈┼┈┈┈┴┈┈┈┈┈┈┈┈┤
┊ 声 母 21 个 ┊韵 母 17 个 ┊
├┈┈┈┈┈┈┈┈┈┴┈┈┈┈┈┈┈┈┈┈┈┈┤
┊声调码:1、阴;2、阳;3、上;4、去。5、轻声 ┊
├┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┤
┊与音母同音的字就用该音母的代码注音与打字 不另加字母┊
└┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┘
38音简拼就是最简最基本的拼音,或说是汉语拼音方案的基本式,它除了用“于v”代替汉语拼音方案的“迂yu”外,其它声韵母代码是和汉语拼音方案一样的。但比三个表近60个声韵母的汉语拼音方案简明得多,又不用汉语拼音方案那些涉及几千字拼写变化的规定,直接按声韵母表选声韵母拼,如“七q安an”快读拼出的“欠千钱”音是qan而不是多一个字母i的qian,“义务”是“义i务u”而不yi、wu,因此几千字都可少按打字键。
(2) 简拼与汉语拼音方案繁简对比
38字简拼体系中,有少部分汉字要用到声介韵三拼。虽然这并不比汉语拼音方案的音素拼难,但对于识字入门的幼儿来说,是个难点。S码揭示,我国传统的反切音节字母拼中,有把声母与介母拼出的单音节字音当作声母用的现象。如《康熙字典》中说“斂”的注音在《【集韻】【韻會】【正韻】》中是“力冉切”。要由“力li冉ran”中上字取声下字取韵来拼出“敛lian”这音,取的声母只能是“力li”这字音,去与下字“冉ran”中的韵母an相拼,才能拼出“敛lian”这音。不能是从上字“力”中舍韵取辅音l与下字“冉ran”的韵母an来拼,因这样拼出的字不是读“敛lian”而是读“烂懒lan”这音。所以反切中是把整个上字“力li”当声母来与下字“冉”中的韵母an相拼,因此古代说的声母可以是单音节字音,是音节字母而不一定只能是辅音,只是有时隐含表示隐性的辅音。制定汉语拼音方案时,还没重视到这些,把声母都当辅音用了。
因此S码把38音中声母与介母“一五于”相拼出的字音,各选一字(共26字)当声母(扩展声母)用,补充到38音系统中而得到64音简拼系统。这26个扩展音母及介母与其它声母一起叫前音字(反切上字);其余14个韵母叫后音字(反切下字),统称引导字。供手语与盲文双拼用的P型48字简拼,则只把声母与介母“一i”相拼出的字音各选一字当声母(前音字),介母“五于”与其它韵母相拼出的字音各选一字补充进后音字中构成。
64字与48字简拼中,凡与引导字不同音的字音,可以用前后音字各一个快读拼出,都不需用到三拼。古书反切中要考虑上下字声韵取舍“上字取声,下字取韵”的反切,叫繁式反切。不需考虑上下字声韵取舍,只要上下字(前后音字)快读就可拼出所需字音叫简式反切。如古书中的“廉,力延切”就是简式反切,它是从传统反切中优选出的精华。因此S码64字简拼等,就是简式反切音节字母拼体系,也是汉语拼音方案的简化体系。
音节字母拼中,作为前后音字的两个单音节汉字快读时,前音字中的元音因快读变短弱,形成前音字中的辅音与后音字(元音、韵母)相拼为主的听觉效果。如前后音字“得de啊a”,快读时,前音字“得de”中的韵母e因快读变短弱,形成前音字“得de”中的辅音d与后音字a相拼为主的“大da”这音,因此辅元音音素拼的da,与前后音字“得de啊a”快读的最终听觉效果是一样的“大da”。这与美国腔的victory(胜),用英国腔快读时o弱化成victry类似。所以音节字母拼与音素拼都是科学合理的,而不是反切用汉字当音母拼落后不科学,对于汉语,反而比音素拼更便用。
64字P型简拼(简式反切音节字母拼)音母代码表
┌┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┬┈┈┈┈┈┈┐
┊ 前 音 字 50 个 ┊ 后音字14个 ┊
├┈┈┬┈┈┬┈┈┬┈┈┬┈┈┈┬┈┈┼┈┈┈┈┈┈┤
┊不b ┊支zh┊匕bi┊足zu┊主zhu ┊一i ┊啊a 额e ┊
┊扑p ┊尺ch┊皮pi┊粗cu┊出chu ┊ ┊艾ai 诶ei┊
┊木m ┊十sh┊米mi┊苏su┊术shu ┊五u ┊安an 二er┊
┊夫f ┊日r ┊ ┊入ru┊ ┊ ┊袄ao 也ie┊
┊得d ┊子z ┊地di┊肚du┊ ┊ ┊昂ang(或aw) ┊
┊特t ┊次c ┊提ti┊土tu┊ ┊ ┊恩n (或en) ┊
┊讷n ┊四s ┊你ni┊奴nu┊女nv ┊于v ┊嗯ng (或w) ┊
┊乐l ┊ ┊力li┊路lu┊吕lv) ┊ ┊喔o (或uo)┊
┊个g ┊几j ┊ ┊古gu┊巨jv) ┊ ┊偶ou ┊
┊克k ┊七q ┊ ┊苦ku┊去qv) ├┈┈┤翁ong(或uw) ┊
┊核h ┊夕x ┊ ┊户hu┊许xv) ┊介母┊ ┊
├┈┈┈┈┈┼┈┈┴┈┈┴┈┈┈┼┈┈┴┈┈┈┈┈┈┤
┊声母21个 ┊ 声介合母 26个 ┊ 韵 母 17 个 ┊
├┈┈┈┈┈┴┈┈┈┈┈┈┈┈┈┴┈┈┈┈┈┈┈┈┈┤
┊声调码:①阴平声;②阳平声;③上声;④去声;⑤轻声 ┊
├┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┤
┊凡与前后音字不同音的字音可用前后音字各一个快读拼出┊
├┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┤
┊与音母同音的字,就用该音母的代码注音与打字,不另加字母。 ┊
└┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┘
S码P型简拼中,用“v于”代替汉语拼音方案的“迂yu”就是P2型。若再以w代汉语拼音方案的ng,就是P3型而最大码长缩为五位。需要分词连写又可能字界混淆时用y作隔音符,不至于混时不用隔音符y,不用汉语拼音方案w、y等三种隔音的多条规定。
注音字母与国罗(国语罗马字)、北拉(北方话拉丁化新文字)的21个声母中,规定占三分之一的“思s厶”等7个自成音节,注音时不再加元音。如“四”注音为s厶而不是si厶ㄧ,因此s是当音节字母用。汉语拼音方案的第一条规定说“思s厶”等7个声母及其同音字注音时韵母用i,如“四”注音为si。因此不是把“思s厶”中的s当音节字母,而是当辅音音素字母,要加元音i来拼出si注音。所以汉语拼音方案是全部西化了的音素拼,不像注音字母与国罗、北拉部分用进了民族式的音节字母拼。汉语拼音方案的主要设计者周有光先生,不愧被称为音素拼的汉语拼音方案之父,因他第一个实现了汉语拼音的全盘音素化。可惜他没理解好注音字母、国罗、北拉用进音节字母拼可简化拼音的作法,害得几十年来一代一代的小学生用比注音字母繁难得多的注音法,害得今天众多人天天按数以亿计的冤枉键。
S码简拼中明确约定,与音母同音的字就用该音母的代码注音与打字,不另加字母。如“不得”的注音与打字码就是“不b、得d”,而不必是“不bu得de”。这就赶走了西洋音素拼,把字母代码全当音节字母看待。因此与21个声母同音的上千字,都比汉语拼音方案少考虑加哪种元音并且少按打字键。
与简拼一样的韵母代码“衣i、乌u、因in、烟ian”,在汉语拼音方案中各字的注音是多一个字母的“衣yi、乌wu、因yin”,但“烟眼”音的字的注音既不是ian又不是yian而是yan,十分繁乱不利于少儿初学。而S码简拼与注音字母中没这些麻烦规定要记,与韵母同音的字的注音就是韵母的代码,不另加字母或变字母,注音如:衣一i而不是yi、乌五u而不是wu、因in而不是yin、烟眼ian而不是yan。因此与“一五于因”等同音的几百字,汉语拼音方案又比简拼多按冤枉键。S码约定,注音时不需用汉语拼音方案的w、y等三类多种隔音法,只在需要分词连写又可能字界混淆时用y作隔音符,不至于混时不用隔音符y。这样又可免得小学教学不知所云打胡乱说,一会说w、y是声母、零声母,一会说是半元音,又说不清为什么韵母(元音)“牙ya”不是两个元音而是“一个半”元音,而“啊a”又不加零声母或半元音。
又如S码中“几j、安an”快读拼的“简jan”,在汉语拼音方案中是多一个字母i的“简jian”。因此,凡J、Q、X开头的上千字的汉语拼音方案打字,每字都比S码简拼多按冤枉键。
由此可见,S码简拼比汉语拼音方案简明易容易得多,性能也好得多,几千字都可少按打字键。S码注音识字查字打字入门四步法的第一步,是教64个引导字的注音识字,第二步是教引导字的P2型代码的注音识字查字打字。在没有熟习P2码打字前,不宜教汉语拼音方案,以免养成几千字多按冤枉键的不良打字恶习。在熟练简拼打字后,再把原汉语拼音方案当拼音常识补教。上世纪向汉字编码专委会提交的S码BP型打字码软件中,可以随意用简拼或汉语拼音方案输入而不需切换,不影响原来只会汉语拼音方案打字的人用,又可帮助他们摆脱周氏洋恶习享受更简拼音之利。
因此建议中文信息学会及汉字编码专委会,优选注音识字查字打字的拼音基本式,并向人大、教育部、语委等相关部门推荐,为小学生减负增效,为全国用拼音打字的人提供更简易高效的拼音输入法。
(3) 查字打字的基础体系揭密
出台汉语拼音方案时,以为汉字落后不好查字,拼音才好查字。但几十年推行汉语拼音方案,汉字仍不如西文好查,该反思反省了。不认识不会拼的字不能用拼音查字打字,因此拼音不是解决查字打字的根本办法。局限于照搬西洋拼音,几十年来没多大长进。局限于照搬古代部首,也使中文信息处理查字打字几十年来没有多大进展。教育部门花大量人力物力搞出200来个规范部首,信息部门花大量人力物力搞出600多个规范部件,都没能使查字打字好用一点。难道汉字根本不可能像西文一样好查吗?
其实古代部首法中,潜藏有根治拼音查字打字毛病的简法。关键在于该继承发扬光大传统精华,但又不能局限于照搬古法。
距今近两千年的汉代,五经无双博士许慎,在他的历史性巨著《说文解字》中,重视到了从形音义全面分析汉字,并且创新的提出了形音义兼顾对汉字分类的文字分类观。而且他还把近万个小篆这样分为500多类,每类一部定出部首列出字表,《说文解字》就是这样一个汉字分类集的字表与字典。
许老全面分类汉字的创新,当然包含与允许不全面而是着重某些方面的汉字分类。如只按义分,只按形分,只按音分,音分的又可只按声分、只按韵分等。古代有很多种韵书,就是按韵分类的字表。现代鼓吹的汉语拼音方案,不过是不管形义的一种按音分类的字表方案,并不是便用的查字打字法。因按音分的汉语拼音方案或韵书,不知声韵的字就不便查字打字。要像西文一样不知字音也便查字打字,只能是许老文字分类中不管音义的纯按字形规律分类的系统,这样才不管知不知道字音字义都便查字打字。
若发扬许慎从形音义分析汉字的创新精神,就允许创新提出不管音义的纯形部首。S码还揭示,西文好查字打字不是因为拼音,而是不管音义只看字形。如英语同音的eye(眼)与I(我)的拼音都是[ai],查字打字都不管这音与义,只看字形去i部找我,去e部找眼。因此中西文好查字打字的办法,都只能是不管音义只看字形的纯形部首法,而不是纯拼音法。所谓拼音文字先进、汉字落后不过是一种误解。
西文字典是不管音义,只看HITLZ之类字形元件(形元、字母)的书写顺序排序检索的,因此不管认不认识的字都便查。汉字也是由类似含有HITLZ之类的形元构成,如“上下工乙亡”就含有类似HITLZ的单复笔形元。中文字典若也按这些形元在字中的书写顺序排序,就不难像西文那样不管会不会拼的字都便查。这才是便于查字打字的关键,而不是拼音才便查字打字。
问题是西文是由在便记范围内的几十个显性形元(字母)线性连成,汉字是由隐性的单复笔形元件平面组合成,没有现成明确的在便记范围内的几十个显性形元。但了解了这根本,就不难选定几个或几十个形元以便查字打字与确立中文信息处理基础。
官定的规范部首与规范部件,都没重视汉字形元,只是在许氏形音义兼顾的文字学部件中折腾炒冷饭,作点小小的简化。如《康熙字典》把许氏500多个部首简化到2百多个,规范部首再简化为2百来个。局限于音义兼顾的文字学部件,是不可能想像到部件或部首可能少到几个几十个的便记范围内,也就不可能使汉字好查字打字。因按音义形兼顾的文字学部件与部首,至少在几百个以上。只能把许氏五百部首胡乱合并一些,没法大幅度精简。
如规范部件规定,从形音义兼顾看,“肉衣”是不能再拆的基本部件与独体字。“肉”在字源学上是带肋骨的不允许骨肉分离的象形独体字,不能拆为“内人”,它与“内人”音义无关。虽然这是有道理的,但只是合某一个角度的道理,还允许有另一个角度的道理。连古人也不那么保守,不认为“衣”字不可拆烂,因此才造出了“褒裹衷”。所以S码认为,查字打字不宜用音形义兼顾的许氏文字学分类部件与部首,宜用不管音义的形元(纯形部首、纯形部件、字形元件)。文字学部件与部首数量受到音义形兼顾的限制,至少在几百个以上,不可能大幅度精简。形元是随装拆需要选取的纯形部件,有相对按需优选数量而没有绝对数量限制,“肉衣”可拆可不拆。如“肉”在S码BD、BQ、C型中用到不同拆法,八部首单笔画BD码中拆为6个单笔画形元。由BD码补充进八类复笔形元的14部首BQ码中,有形元“A人”但没有形元“内”,“内”应拆为单笔画。进一步缩短码位与同码率的C型码中,“内N、人A”都被选为形元,而允许只管字形不管音义把“肉”拆为“内人”两个形元。也就是说不能把“内人”看成是音义上与“肉”有关文字学部件,但可看成是只合字形学的纯形部件(形元、编码部件)。
因此,我们不宜照抄西文模式,也不宜拘泥于古法,宜在洞悉中西语言文字特点传统精华的基础上结合现实发展创新。如中文字典的排序检索,既不宜用西洋拼音又不宜用许氏部首,创新形元与纯形部件、纯形部首等概念,就可使中文信息处理与查字打字水平上一个新台阶。
因此建议中文信息学会与教育部门,在已出台的规范部首与规范部件方案中,补充说明它们是音义形兼顾的文字学部件体系,还允许有形元(纯形部首、纯形部件)体系用于简化查字与打字。
(4) 克服拼音查字打字缺点的BD码
了解了中西文都只能是不管音义只看字形才好查字打字,只按HITLZ之类单复笔形元(字母)书写顺序排序才不管认不认识的字都便查。问题是汉字没有现成明确的形元体系,但可能优选出一些便用的形元体系。复笔形元也是单笔画形元组成,汉字的单笔画形元相对于复笔形元来说,情况简明得多。可以先优选好单笔画体系,复笔形元的情况就可能更明朗些。
汉字的单笔画只有30多种,已是在便记的范围内。林语堂大师的上下形查字打字法就是把33种单笔画各用两位数编码,再加50类复笔部件及左右形等字型码构成。流行的一些查字打字法用到的单笔画通常为五种,如王永民码的五笔画码与五笔字型码,就是用的横竖撇点折五种笔画。S码分析实践揭示,笔画编码不需要细分为30几种,可以归类合并。兼顾码位与同码几率及便记便用性,笔画种类该归类有一优选值。这极值不是林语堂码的33 种,也不是王永民码的五种,而宜十种上下。王永民五笔画若像汉语拼音方案那样不超过六位码,则同码字很多比拼音还多,没有多大的实用性。若用十种上下,六位码内只约百分之十的字的同码字略多于十个。由此可见优选极值作用,不可忽视。
单笔画元件既是复笔部件的基础,也是查字打字码的基础。忽视它的查字打字形码必然性能不佳。上世纪末既得到云南大学张在云老师约我批评王码的信,又收到王码十周年庆的邀请信。笔者没有去就是因认为王码功不可没但有基础性缺陷,去了可能使喜庆扫兴。正是王码单笔画偏离优选值,又用五种笔画框框限定字根分类与用键数量,而使键数也偏离30键的优选值,必然同码字偏多,不得不挖肉补疮加末笔字型码和很多繁杂规定来减少同码字。若他不用五种而是用十种单笔画,用26键或稍多而不是只用25键,同码字就少得多而不需用末笔字型码等。但这样五笔没有了且字型也没有了,岂不使五笔字型码名存实亡扫兴吗。
因此S码B1到B10(B0)型中的单笔画BD码,用到8—12类单笔画,如B10型用到十个数码作十类单笔画代码,B2型用字母作11种单笔画代码。八部首B2型笔形与代码助记口诀为:
横F 竖i k撇笔,点d 捺A 提笔t。 JLZS形相似,7形L 3形B。
BD型笔形与代码间有许多音形联想便记因素而不难很快记住,如点与提(挑)笔是分别用声母d.t作代码,BJLSZ都与它们代表的笔形有形似关系,如乙字形折笔代码是字母Z。不难依笔顺写出字的各笔代码(笔形笔顺全息码),如:二ff.上iff.川kii.卜id.入ka.刀jk.刁jt.孔LjtL.乃bk.队bika.亏ffs.专ffsd。
BD码中,字的部首就是它的首笔。因11 种单笔画中,有三种不出现在字首,所以是八部首法。
S码还对码位与码序等进行了优选化化,采用了正逆序取码编码法,就是依笔顺取前四笔后,跳到字尾去按笔顺的逆序取笔画码排序。国标字(GB2312字表中的近七千字)中,前四笔末笔BD码(四头一尾码)的同码字普遍比拼音少得多。若再加倒数第二笔码的四头尾腹码(四顺两倒码),就只有约10%的字的同码字略多于十个。也就是说,约90%的字的四头尾腹码,就是字在B型字典中的页码或电脑同码字屏的页码。
国家已有规范笔形笔顺规定,小学都要教按规范笔顺写字。S码的单笔画码正逆序取码就是以规范笔顺为准来决定正序与逆序,因此不难取码查字打字。不需要先背熟BD码就可查字,因B型字典每页顶上有一行BD型单笔画代码表。S码入门四步法的第三步,就是教BD码查字打字。
(5) 拼音不用翻页键的PB码法
S码揭示,西洋式分词连写不合汉语汉字实情。因西语有复辅音等,有单音节多音词,单音节种类有几万。语言文字是以单音节多音词与多音节词为主,同音字极少。而汉语普通话基本上没有复辅音与单音节多音词,单音节种类只几百种。汉语是以单音节单音词为骨干,同音词极多。如英语ask(问)是单节节三音词,有类似汉语“阿斯克”这样三个音,没有同音词。汉语“问”是单音词,有一批同音字。
又如使用频度最高的一千字词中,英语绝大多数是多音词,极少有同音词。汉语是两字词与单字词各约一半,但其中单字词的使用频度远大于两字词,且都有很多同音词。这样多不该连写的单音词又同音词多,分词连写对区分它们无效,所以分词连写不能根本解决汉语同音词的问题。因此汉语没有发育成拼音为主的文字,而是发育成以字形部件组合不同能区分开同音字的形声字为主的体系。因此不宜以西式分词连写为区分同音字为唯一办法,宜考虑进形声字用形来区分同音字的特点。1987年在承德医学院开的中国中文信息学会汉字编码专委会年会上,S码的交流材料中更详的谈了这方面的意见,这里不再详述。该次会的闭幕会上,专委会主任新华社郭冶方高工作总结报告说,原拟提汉字输入以词为基础,现在看来该提以单字为基础,以词组为引导。
S码的形码自然是以单字区分开同码字的单字为基础,S码的音码也与用进单字区分同音词为基础,多字连写作辅助区分。如入门简拼音码,就用入了单字区分同音字的音形码法来把同码字减少到不用翻页键找字。
S码法第一二步只教简拼,不管区分同音字。第三步学了单笔画BD码后,拼音同音字多要用翻页键找字的难题,就有了一个简易的根治办法,也就是S码的PB型音形码法。只要在一个字的拼音后,按BD表加首次尾笔码,就没有超过十个同码字的组,也就不需再用翻页键找字。
简拼P3型的PB码打字时,音码形码总计超过六位的码若略去,也没有超过十个同码字组,字的PB码就是字在B型字典中的页码或荧屏同码字页的页码。若音码是用的P2型或汉语拼音方案,也只有zhuang这音是满六位码不加笔形码而有11 个同码字。可以加记一条P2码中zhuang这音用w代ng,加首笔后就也不需用翻页键。
由此可见,不盲从西洋拼音的BD码与PB码,把汉语拼音方案和旧部首查字打字的各种缺点一扫而光,使汉字像西文一样好查字打字。B型码软件中,一个字可以随意用汉语拼音方案与P1、P2、P3型简拼音码与音形码、BD码输入而不需切换。因此不影响原来只会汉语拼音方案打字的人用,又可帮助他们摆脱洋、古查字打字框框束缚,享受更简便自由的查字打字之利。
(6) 提高打字效率的复笔部件与拆字
只用到单笔画的BD与PB码,虽然已克服了汉语拼音方案和旧部首查字打字的各种缺点,但与还用到复笔字母的西文相较,效率仍有差距。当然也可以像西文一样,不只是用单笔画字母(单笔画形元),还用进复笔字母(复笔形元)来改善散离性。已优选得到了较好的单笔画系统,复笔元件的情况也就明朗多了。影响同码字特多的一批复笔部件已经暴露出来,它们就藏在四头尾腹BD码同码字多于十个的组中。
分析四头尾腹BD码同码字多于十个的组可以看出,主要是含了几类字多的复笔偏旁部首等部件。若把这几类部件各约定一个字母代码,就可消除同码字多于十个的组和简化拆字及缩短一批字的码位。因此B型码中有八类复笔部件代码表(BF表),助记口诀为:
八字形B A金人,日D 月y 木M。交叉X 口形O,W是小字形。
单笔画BD表与BF型复笔元件代码表,合称B型码全表(BQ表)。或者说把BF表补充进BD码表中,就是BQ表。按14部首的BQ码取前四位加倒数一二位码后,就没有超过十个同码字的组,不再需用翻页键找字,字的BQ码就是字在字典中的页码或电脑同码字提示屏中的页码。
BQ码也是用正逆序取码法。但用进复笔形元后,就多了一个复笔部件的拆字取码方法与顺序的问题,这是多年困扰编码的老大难题。
如五笔字型码.郑码等规定不依笔顺把“或”字拆为“戈口一”,老五笔字型码还规定不管笔顺把撇笔当“或”的末笔追加“末笔字型交叉识别码”,表形码则规定不管笔顺与笔画数把8笔的“或”拆为9笔的“一口一戈”,又如“夷”字,郑码规定不依笔顺拆为“大弓”两个字根,王码则规定拆为“一弓人”三个字根再加末笔字型交叉识别码。近400个部件的表形码则规定“夷”就是一个不能拆的部件,与表形码一样有300多个部件的认知码,也同样有这类不合笔顺规范的拆字取码规定。各主要形码都有很多这类规定,要一条条记住,既繁杂又冲击写字习惯与规范。
上海教育局教研室《计算机教与学》1995年2期《认知码的优缺点与改进探讨》与成都科大《中文信息》1995年4期《认知码的部件为何多》等文中说,部件数量与拆字法都可像S码那样简化。S码没有那些繁杂拆字规定,优选出了复笔形元简易拆取法。要点就是不从交叉结构中拆取复笔元件,碰到不是代码表上复笔元件的结构,就该依笔顺拆取单笔画。如“或”字BQ型四头一尾码是fotl d,只有一个同码字“惑”;四头尾腹码fotl dk,就没有同码字了。又如“夷”就不需要像规范部件或表形码、认知码那样选作不拆部件使部件繁多难记,也不必要像郑码、五笔字型码那样规定特殊拆法,就该依笔顺拆取单笔画编码,它的四头一尾码BD码FLFS A,没有同码字。
官方的规范部首与规范部件规定,既没能解决部首部件体系的简化问题,更没能解决拆字的规范问题。如“十土戈木”都是规定的规范部首与规范部件,“栽”字查哪部与怎样打字取码,仍是不清楚的难点。由于规范部件不允许拆,于是出现五花八门的打字取码拆法,如不合笔顺的“十戈木”“十木戈”,笔顺与笔画数都不合的“土戈木”“土木戈”,小学教起来无所适从十分繁难。S码中则既简易又不与笔顺规范矛盾,BD码中“栽”必是查“一F”部,必在fiff d那页。或在PB型音形码中zai fid页。BQ码中必在“十x”部,在xfml d页(十x、一f、木m、しL、丶d)。
BQ码不比四角号码部件多,笔顺有规范而四角结构不便有简明规范,四五位码后四角号码仍有很多组同码字不在一页内,没有再定字到页的简法与打字要求同码率更低的简法。因此BD、BQ码比四角号码更好记,,性能也更好。S码法的第四步,就是教BQ码查字打字。在S码多功能BP型码中,一个字可以随意用汉语拼音方案或各种P型简拼、BD、PB、BQ码输入而不需要切换。B型检字表中,也可任意用这些码快速查字。
按S码四步编的多种识字读本、BD型字典、BP型打字码等,都可免费从网上得到。在小学初小阶段就可能完成这四步练习,为学生打下音码、形码、音形码基础,为进一步选学效率更高的打字码打下了基础。如S码的形码有B、C、G、T、A五级,其中B型(BD、PB、BQ型)就是基础,后一级就是由前一级补充进30几个复笔部件而成,逐级缩短码位与减少同码字提高输入效率。
呼吁中文信息学会与相关小学打字入门教学部门,努力改变被西洋拼音等扭曲了的注音识字查字打字现状,为少儿注音识字查字打字教学减负增效,莫再让下一代学繁难的汉语拼音方案和繁难的旧部首查字,莫再天天按数以亿计的冤枉键。
BQ码与PB码字例
┈┈┬┈┈┈┬┈┈┬┈┈┬┈┈┈┬┈┈┬┈┈┬┈┈┐
汉┊ BQ ┊同码┊拼音┊简拼 ┊同码┊PB型┊同码┊
字┊ ┊ ┊同码┊加前 ┊ ┊音形┊ ┊
例┊ 码 ┊字数┊字数┊两笔 ┊字数┊ 码 ┊字数┊
┈┈┼┈┈┈┼┈┈┼┈┈┼┈┈┈┼┈┈┼┈┈┼┈┈┤
许 dzkf x 0 35 xv dz 1 xv dzi 0
慎 ddix b 0 29 shn dd 4 shnddd 0
说 dzdk Lk 0 11 sho dz 0 shodzL 0
文 dfx 2 15 un df 2 un dfa 0
解 kLkj if 3 46 jie kL 2 jiekLi 0
字 ddll fj 0 39 z dd 4 z ddf 1(淄)
检 mafw f 0 71 jan fi 11 jan fif 4
索 xdll w 0 16 so fi 3 so fid 0
(7) 小结与补充建议
少儿发蒙入学,先要学注音识字,这时就宜配合注音教拼音打字。但不宜教汉语拼音方案的注音与打字,而宜先教S码64字简拼的注音识字查字打字。一是简拼比汉语拼音方案简易得多,二是以免养成按汉语拼音方案多按冤枉键的不良打字习惯,三是为了弘扬传统国学拼音精华。也就是说,宜按S码注音识字教学入门四步法的一二步教。
初识字后,语文课就要教笔顺与一笔一笔的写字。这时就宜与用规范笔顺写字与查字配合,教S码八部首单笔画BD码与PB型音形码打字。也就是说进行S码四步法的第三步,为形码与音码打好基础,以便以后再沿音码或形码逐步提高。
随着识字由简单字到较杂的字增多,语文课要讲到字的部件分析,要讲到偏旁部首等。这时就宜教含有复笔部件的14部首BQ码查字打字,也就是进行S码注音识字查字打字教学入门四步法的第四步。这就完成了入门教学,为再提高汉字输入效率打好了基础。
入门四步法完成后的再提高的第一步或S码法第五步,是选学C型形码与PC型音形码。C型码是由BQ码补充进30几个复笔部件而成,BD、BQ码的部件与代码在C型码中照样用,因此新学的内容不太多。补充入C型码的部件是为了进一步缩短码位与减少同码字,提高打字效率。C型码只要取前三位与末一位码,就没有超过十个同码字的组,不再需用翻页键找字。若再加倒数第二位码,同码字就少到基本上可以不看屏盲打。
若拼音后按C型码代码表加字形的首次尾位码,且音码形码总计超过6位的码省略,同码字也只约3%,已十分便于不看屏选字快速盲打了。分词连写的一般拼音输入,无同码字的组很难达到90%以上,因有不能用连写区分同音字的单字词和同音字也多的双字词,阻止了同码率的再下降。这也就是S码揭示分词连写不能根本解决汉字同音词的具体例,以及S码是以单字区分同音字为基础的特点。
一般人打字与文秘专业人员和专业打字员,是对打字效率要求不同的三个层次。S码B、C型只是打字基础,还不能满足文秘人员与专业打字员的要求,所以S码还有再提高效率的G、T、A型码供不同的需要选用。
由C型码再补充进30几个复笔部件而成的G型码要点为,首次尾码才三键,所要的字必可见。若要更快盲打,可用首次尾腹码。
比G型码少几类部件的L型码,是供PL型音形码手语用的。PL型码约定了前后音字各24个的手势和L型26部字形码部件码手势,在口边左右手打出前后音字手势确定出字音,在肩下左右边打字形首尾部件码手势来区分同音字。这样,就只有百分之几的同码字,国标字(国标GB2312字表中的近七千字)中有六千多字都可区分开,已够手语用。S码PL型手语与盲文详况可见绥化学院学报2011年第3期笔者的《聋盲智障识字入门课本的统筹考虑》等文。
若去与用五笔字型码的打字员比较,可选T型或A型码。A型码取前三位与末一位码,不需再加五笔字型码那样的识别码,同码字比五笔字型还少,要记的部件总量也少些。由于可以沿B、C、G等逐步学,入门难度当然小得多。
搜狗、谷哥、QQ拼音等用了最新的电脑搜索逻辑判断功能,把拼音输入效能推向了一个新高度,占了大部分打字市场。但它们的基础仍是汉语拼音方案的分词连写音素拼与五笔画码,而没有以单字为基础的完善办法与性能好的笔画码法。也就避免不了要按大量冤枉键,其数量每天以亿键计。
2008年8月,笔者在网上《搜狗等拼音新码之争与进言》一文中,评述这些码时曾分析到,所谓的电脑智能并不能根本解决单字与双字词的众多同音字的问题,如输入花名册,分词连写加句输入甚至篇章搜索逻辑判断,也难认识百家姓。只有以单字输入为基础,才能减少误按无效多字词提高盲打率。因此建议这些码加进BP码,做到像S码BP型那样,P型简拼与汉语拼音方案及PB码、BD码、BQ码不切换兼容输入,实现单字输入为基础,一定能按BP码打出所需字而不需翻页找,且可扭转汉语拼音方案几千字比简拼多按冤枉键的习惯。另一个具体作法建议是同码字提示窗口分为两段或两个,一窗同码字词的顺序固定不变,前几个为常用高频字或词,其余同码字顺序按PB码固定不变,另一窗的字序才是随最近使用词频变动。QQ网回复说已把这建议转有关部门,看技术上能否实现。几个月的元旦后,我发现搜狗推出的新版说,十亿人名可能有你。我以为是对我的质疑有突破,那知一试,实际是十亿人名很可能没有你,也许百亿人名可能也没有你,免不了还是要按很多冤枉无效键,并不好用多少。不理解打字该以单字为基础,词与句段输入为引导,就难免要长期盯着同码字窗口选词而难以轻松高速盲打。
2010年春,号称汉语拼音方案之父的百岁人瑞周有光先生,不再提他前年还要证明汉语拼音方案比简式反切好的看法,公开承认按分词连写音素拼的汉语拼音方案实现汉字改革,是500年难以实现的幻想。而编码界很多人还不理解分词连写不能根本解决中文信息问题,没法限制新取的人名是你百亿姓名库中有的。
虽然五百年也难用分词连写的拼音文字,但比学习掌握分词连写法还简易些的PC型音形码与PL型手语对应的简拼字,推广到流行可能不需要等上百年。中国科技情报研究所与中国科技情报研究学会1979年印发的《汉字编码方案目录(第一集)》中近两百个方案,很多是就是打字与汉字发展创新相结合的。如其中流水编号为54号的《简拼字草案》,就是S码简拼加字形部件码区分同音字的新形声字(拼音简笔字)草案。PC型音形码对应于J型简拼音旁加首次尾笔部件的拼音简笔字,PL型音形码手语对应于J型简拼音旁加首尾部件的拼音简笔字。
如前音字“扑”的P型简拼是P,J型简拼符是卩,电脑键盘上它们的H、P、J型符“扑P卩”是标在同一键上。“埔”字的首次尾码是“t土、f一、d丶”,PC型简拼音形码是p tfd,PL型音形码是p td。它不但没有同码字,这音是土旁的国标字也只有它一个,所以只要pt两键就没有同码字了。因此“埔”对应的简拼字可以是“卩土”,既实现了拼音化又把十笔的字简化为5笔。S码把pt与“卩土”看成是简拼字的两种体,拉丁体与简笔体。简笔体易被混同于简笔字夹在旧字中,比夹用拉丁体可能更易流行些。笔画还多的通用字,就可这样简化而实现常用汉字的通盘简化与拼音化。非常用的几万字可变窄加J型简拼音旁恢复成方块型的注音体,也就实现了拼音化,当然这样繁化了字体,但这只供电脑显示与书刊用,手写可略去J型音旁。也许这样的拼音化,比改为分词连写的西式拼音字可行性更大些,更便于中文信息处理。