苍耳球发明了一种为汉字笔画编码的方式。
为了方便表示汉字笔画,为每一种笔画赋予编码是有必要的,这种编码方式暂且叫做完全编码吧。汉字完全笔画编码使用阿拉伯数字及拉丁字母(不含I、O)共计33个符号。
但是,33个符号对于人们的记忆是一个挑战,因此有必要在传统的五码笔画表示法与完全笔画编码之间寻找一种既方便记忆又能将笔画相对分开的一种笔画表示法,这就是汉字十码笔画表示法。
汉字十码笔画表示法采用十个阿拉伯数字,综合分析汉字笔画在常用汉字中出现的频率,将部分笔画编码进行归并。归并的规则,可以归纳为:横为1,竖为2,撇为3,点与捺为4,提为5,竖钩为6,横向起笔一折为7,竖、撇起笔一折为8,横向起笔多折为9,竖向起笔多折与捺向起笔一折为0。
目前字(词)典对于只知字形不知读音的汉字一般采用部首检字法,鉴于这种检字法需要数部外笔画,一定程度上需要花费较多时间,难以快速检索,并且对于部分特殊汉字容易数错笔画,苍耳球发明了部首笔顺检字法。
汉字部首笔顺检字法也是面向只知字形不知读音的汉字,将检索笔画数量改为检索笔顺。它仍然需要先确定部首,但是接下来只需要检索部外部分的笔顺,如果部外部分超过4笔,则省去前3笔与最后1笔之间的笔画。这是一个水到渠成的过程,不需花费太多时间,哪怕中间有些笔画不确定,也不受影响。
比如:“罐”字,缶部,部外部分前3笔为122,最后1笔为1,那么只需要检索“缶+1221”;
“齉”字,鼻部,部外部分前3笔为127,最后1笔为4,那么只需要检索“鼻+1274”;
“鬣”字,髟部,部外部分前3笔为888,最后1笔为0,那么只需要检索“髟+8880”。
这种检字法相对于传统的部首检字法,还有一个优点就是同一检索码内汉字数量大大减少,避免从数十个汉字中检索的窘境。
如果是收字量特别巨大的字典,为降低同一检索码内汉字数量,我们还可以将检索码位数增加到前4位+后1位、前4位+后2位或者更多。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。