一般汉字的编码规则
一般汉字就是除了上述两类汉字之外的所有汉字,这部分汉字也称合体汉字,这是五笔字型需要处理的绝大部分汉字。
为了能正常对这些汉字进行编码,五笔字型同时规定了字根码和识别码。
1、字根码:
五笔字型的每一个字根都位于某一个键上,这个键的编码就是字根码。任何字根,只要位于同一个键上,则它们的字根码都相同。
2、识别码:
一个汉字的识别码就是这个汉字的最后一笔的代码与该汉字的字型结构代码相组合而成。
⑴、汉字的最后一笔代码:
汉字的最后一笔可分为五种笔画,其为横、竖、撇、捺、折,分别用代码1、2、3、4、5来表示。
⑵、汉字的字型结构代码:
五笔字型把汉字分为三种字型结构,即左右结构、上下结构和混合结构,分别用代码1、2和3来表示。
如从汉字的组成明显能分成左右两部分,则这类汉字就为左右结构型。如从汉字的组成明显能分成上下两部分,则这类汉字就为上下结构型。除左右结构和上下结构包括
汉字的其余汉字均为混合结构型。
例如:陈、汉、江、语、码 为左右结构 代码为1
字、笔、定、案、要 为上下结构 代码为2
虎、运、未、图、包 为混合结构 代码为3
⑶、汉字的识别码:
汉字识别码=汉字最后一笔代码+汉字字型结构码。 汉字识别码的示例见下表4-6。
表4-6 汉字识别码示例表
例字 最后一笔 代码 字型结构 代码 识别码 陈 捺 4 左右 1 41 识 捺 4 左右 1 41 最 捺 4 上下 2 42 数 捺 4 左右 1 41 字 横 1 上下 2 12 案 捺 4
上下 2 42 问 横 1 混合 3 13 包 折 5 混合 3 53 虎 折 5 混合 3 53 未 捺 4 混合 3 43
回 横 1 混合 3 13
3、一般汉字总的取码原则:
⑴、按书写顺序从左到右、从上到下、从外到内的原则。
例如:
"陈"字取码顺序是"阝"(52)、"七"(15)和"小"(43)。
"字"字取码顺序是"宀"(45)和"子"(52)。
⑵、取大优先的原则。即尽量用笔画较多的五笔字型的基本字根来取码,而不是把其分成更小的单元来取码。 例如:
"页"字取码顺序是"丆"(13)和"贝"(25),而不是"丆"(13)、"冂"(25)和"人"(34)。
⑶、兼顾直观的原则。为了以五笔字型基本字根来取码,有时就不一定按书写顺序来取码。
例如:
"固"字取码顺序是"囗"和"古",而不是"冂"、"古"和"一"。
为了便于理解和记忆,传统的五笔字型把取码原则编成了一首编码口诀,在这里给出该口诀以方便学习理解和记忆:
五笔字型最直观,依照笔顺把码编;
键名汉字打四下,基本字根请照搬;
一二三末取四码,顺序拆分大优先;
不足四码要注意,交叉识别补后边。
4、一般汉字的编码规则为:
(1)、第一字根+第二字根+第三字根+最后一个字
根;
(2)、如果不足四个字根,则字根取完后再加该字的
识别码;
(3)、如果加识别码后还不足四码,则以空格键结束。
表4-7给出了达到四字根及以上汉字编码示例。
表4-8给出了三字根汉字编码示例。
表4-9给出了二字根汉字编码示例。
表4-7 达到四字根及以上汉字编码示例表
例字 第一字根编码 第二字根编码 第三字根编码
最后字根编码 键码
智 31 13 23 22 TDKJ
键 35 53 12 45 QVFP
握 32 51 11
12 RNGF
编 55 41 51 15 XYNA
搬 32 31 33 54 RTEC
围 24 12 51 21 LFNH
歌 14 23 14 34 SKSW
照 22 53 23 44 JVKO
表4-8 三字根汉字编码示例表
例字 第一字根编码 第二字根编码 第三字根编码
识别码 键码汉字编码
等 31 12 12
42 TFFU
保 34 23 14
41 WKSY
定 45 11 21
42 PGHU
顺 23 13 25
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论