汉语编码及其汉字输入法和汉字检索法

阅读: 评论:0

著录项
  • C200410064731.9
  • 20040924
  • C1752899
  • 20060329
  • 杨锋
  • 杨锋
  • G06F3/023(2006.01)I
  • G06F3/023(2006.01)I

  • 江苏省南京市建邺区南湖小区玉塘村18幢57号401室
  • ,C,江苏(32)
摘要
汉语编码及其汉字输入法和汉字检索法属于一种新颖的汉语编码技术、汉字输入技术和汉字检索技术,其主要特征在于:首先从一般汉字字典部首中选取一部分部首作为本发明中的字元;然后将所有字元进行分组,并且分别给每组字元赋予同一个单字符或同一个双字符串作为本组内每一个字元的同一代码;再用字元的代码按照规则,分别给汉字单字、词、词组、短语和语句进行编码和取码,所取得的码被简称为汉语杨码;用汉语杨码能够输入中文信息,排序中文信息和处理非汉字字符或图形。本发明保持了汉字传统部首的精华,并且按照汉字的常规笔顺规则对汉语信息进行编码,能够达到思维连通、遇字知码、易学易记、简单快捷和方便各类人员使用的目的。
权利要求

1.汉语杨码及其汉字输入法和汉字检索法,其特征在于:首先从一般汉字字典的传统 部首中选取其中一部分部首作为本发明中构成汉字单字的标准部件,这些标准部件在本发明 中被简称为字元;然后将所有的字元按其同名或者按其结构相似或相近进行分组:

(1)简体汉字系统中的字元共分成50组,其中5组是单笔画字元组,它们分别是:“一、 组、“丨、亅”组、“丿”组、“丶、”组和“乙、*(*是代表除前面已经提到的汉 字单笔画部首以外的其它所有的汉字单笔画部首,以下同)”组,另45组是多笔画字元(是 指具有两笔画和两笔画以上的字元,以下同)组,它们分别是:“扌”组、“口”组、“人、 八、亻”组、“氵”组、 组、“王”组、“酉”组、“石”组、“车”组、“止”组、“田” 组、“山”组、“贝”组、“罒”组、“爫”组、“月”组、“鱼”组、“犭”组、“饣”组、“门” 组、“立”组、“羊、”组、“米”组、“衤、礻”组、“马”组、“尸”组、“弓”组、“女” 组、“纟”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫” 组、“”组、“夕、夂”组、“钅”组、“舟”组、“”组、“广、疒”组、“忄”组、“火” 组和“宀”组;

(2)繁体汉字(含异体汉字,以下同)系统中的字元共分成51组,其中5组是单笔画 字元组,它们分别是:“一、 组、“丨、亅”组、“丿”组、“丶、”组和“乙、*”组, 另46组是多笔画字元组,它们分别是:“扌”组、“口”组、“人、八、亻”组、“氵”组、 组、“王”组、“酉”组、“石”组、“車”组、“止”组、“田”组、“山”组、“貝”组、“罒” 组、“爫”组、“月”组、“魚”组、“犭”组、“飠”组、“門”组、“言”组、“立”组、“羊、 ”组、“米”组、“衤、礻”组、“馬”组、“尸”组、“弓”组、“女”组、“糹”组、“耳” 组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、 夂”组、“金”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组;

(3)简繁体汉字(含异体汉字,以下同)共存系统中的字元共分成51组,其中5组是 单笔画字元组,它们分别是:“一、 组、“丨、亅”组、“丿”组、“丶、”组和“乙、 *”组,另46组是多笔画字元组,它们分别是:“扌”组、“口”组、“人、八、亻”组、“氵” 组、 组、“王”组、“酉”组、“石”组、“车、車”组、“止”组、“田”组、“山”组、 “贝、貝”组、“罒”组、“爫”组、“月”组、“鱼、魚”组、“犭”组、“饣、飠”组、“门、 門”组、“言”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“马、馬”组、“尸” 组、“弓”组、“女”组、“纟、糹”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、 曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“钅、金”组、“舟”组、“”组、“广、 疒”组、“忄”组、“火”组和“宀”组; 并且,用9个不同的单字符分别按序给上述各汉字系统中的相同的5组单笔画字元组确“一、 组、“丨、亅”组、“丿”组、“丶、”组、“乙、*”组和相同的4组多笔画字元组“扌” 组、“口”组、“人、八、亻”组、“氵”组中的每组字元按组赋予同一个单字符作为该组内 每一个字元的同一代码,再用这9个不同的单字符进行排列组合后,取出其中42个不同的 双字符串,先用这42个不同双字符串中的33个不同双字符串,分别给上述各个汉字系统中 的另外33个相同的多笔画字元组 组、“王”组、“酉”组、“石”组、“止”组、“田” 组、“山”组、“罒”组、“爫”组、“月”组、“犭”组、“立”组、“羊、”组、“米”组、 “衤、礻”组、“尸”组、“弓”组、“女”组、“耳”组、“土、士”组、“艹”组、“木”组、 “日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“舟”组、“”组、“广、疒” 组、“忄”组、“火”组和“宀”组中的每组字元按组赋予同一个双字符串作为该组内每一个 字元的同一代码,再用这42个不同双字符串中的另外的8个不同的双字符串分别给上述简 体汉字系统中的多笔画字元组“车”组、“贝”组、“鱼”组、“饣”、“门”组、“马”组、“纟” 组、“钅”组中的每组字元按组赋予同一个双字符串作为该组内每一个字元的同一代码,同 样,用这8个不同的双字符串分别给上述繁体汉字系统中的多笔画字元组“車”组、“貝” 组、“魚”组、“飠”组、“門”组、“馬”组、“糹”组、“金”组中的每组字元按组赋予同一 个双字符串作为该组内每一个字元的同一代码,也同样用这8个不同的双字符串分别给上述 简繁体汉字共存系统中的多笔画字元组“车、車”组、“贝、貝”组、“鱼、魚”组、“饣、 飠”、“门、門”组、“马、馬”组、“纟、糹”组、“钅、金”组中的每组字元按组赋予同一 个双字符串作为该组内每一个字元的同一代码,之后,再用这42个不同双字符串中的最后 一个双字符串分别给繁体汉字系统中的最后一个多笔画字元组“言”组和简繁体汉字共存系 统中的最后一个多笔画字元组“言”组中的字元赋予这个双字符串作为该组内字元的同一代 码;最后,再用各个字元的代码按照本发明中的编码和取码规则,分别给各个汉字系统中的 汉字单字、词、词组、短语和语句进行编码和取码,所取得的码在本发明中被简称为汉语杨 码;将汉语杨码输入到中文信息处理设备中,就能够达到利用汉语杨码输入中文信息的目的; 将字典、词(辞)典或其它汉语信息中的条目依照汉语杨码序排列,就能够达到利用汉语杨 码检索字典、词(辞)典或其它汉语信息中条目的目的;将非汉字字符或图形依照汉语杨码 的形式分别赋予汉语杨码,就能够达到利用汉语杨码处理非汉字字符或图形信息的目的。

2.如权利要求1所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:用1、 2、3、4、5、6、7、8、9这9个阿拉伯数字字符分别代替权利要求1中所述的9个 不同的单字符,再分别按序给权利要求1中所述的各汉字系统中的相同的5组单笔画字元组 “一 组、“丨、亅”组、“丿”组、“丶、”组、“乙、*”组和相同的4组多笔画字 元组“扌”组、“口”组、“人、八、亻”组、“氵”组中的每组字元按组赋予同一个阿拉伯 数字字符作为该组内每一个字元的同一代码,再用这9个不同的阿拉伯数字字符进行排列组 合,取出其中双字符串14、16、17、18、22、26、27、29、34、36、38、46、47、48、49、 56、57、58、66、67、68、69、76、77、78、79、86、88、89、96、97、98、99分别代替权 利要求1中所述的42个不同的双字符串中的其中33个不同的双字符串,分别按序给权利要 求1中所述的各汉字系统中的另外33个相同的多笔画字元组 组、“王”组、“酉”组、 “石”组、“止”组、“田”组、“山”组、“罒”组、“爫”组、“月”组、“犭”组、“立”组、 “羊、”组、“米”组、“衤、礻”组、“尸”组、“弓”组、“女”组、“耳”组、“土、士” 组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“舟” 组、“”组、“广、疒”组、“忄”组、“火”组、“宀”组中的每组字元按组赋予同一个双 字符串作为该组内每一个字元的同一代码,取出其中双字符串19、28、37、39、42、55、59、 87代替权利要求1中所述的42个不同的双字符串中的另外8个不同的双字符串分别按序给 权利要求1中所述的简体汉字系统中的“车”组、“贝”组、“鱼”组、“饣”组、“门”组、 “马”组、“纟”组、“钅”组中的每组字元按组赋予一个双字符串作为该组内每一个字元的 同一代码,同样用19、28、37、39、42、55、59、87这8个不同的双字符串分别按序给权 利要求1中所述的繁体汉字系统中的多笔画字元组“車”组、“貝”组、“魚”组、“飠”组、 “門”组、“馬”组、“糹”组、“金”组中的每组字元按组赋予同一个双字符串作为该组内 每一个字元的同一代码,也同样用19、28、37、39、42、55、59、87这8个不同的双字符 串分别按序给权利要求1中所述的简繁体汉字共存系统中的多笔画字元组“车、車”组、 “贝、貝”组、“鱼、魚”组、“饣、飠”组、“门、門”组、“马、馬”组、“纟、糹”组、 “钅、金”组中的每组字元按组赋予同一个双字符串作为该组内每一个字元的同一代码;除 上述已取用的41个双字符串外,再取出其中最后一个双字符串45代替权利要求1中所述的 42个不同的双字符串中最后一个双字符串,给繁体汉字系统中的最后一个多笔画字元组“言” 组和简繁体汉字共存系统中的最后一个多笔画字元组“言”组中的字元分别赋予这个双字符 串作为该组内字元的同一代码;最后,再用各个字元的代码按照本发明中的编码和取码规则, 分别给各个汉字系统中的汉字单字、词、词组、短语和语句进行编码和取码,所取得的码在 本发明中被简称为数字型汉语杨码;将数字型汉语杨码输入到中文信息处理设备中,就能够 达到利用数字型汉语杨码输入中文信息的目的;将字典、词(辞)典或其它汉语信息中的条 目依照数字型汉语杨码序排列,就能够达到利用数字型汉语杨码检索该字典、词(辞)典或 其它汉语信息中条目的目的;将非汉字字符或图形依照数字型汉语杨码的形式分别赋予数字 型汉语杨码,就能够达到利用数字型汉语杨码处理非汉字字符或图形信息的目的。

3.如权利要求1所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:用9个 不同的英文字母单字符分别替代权利要求2中所述的9个不同的阿拉伯数字字符1、2、3、 4、5、6、7、8、9,和用这9个不同的英文字母的单字符及其排列组合后取出其中42 个不同的英文字母双字符串,分别替代权利要求2中所述的9个不同的阿拉伯数字单字符和 42个不同的阿拉伯数字双字符串后,再按照权利要求2中所述的用9个不同的阿拉伯数字字 符1、2、3、4、5、6、7、8、9及其排列组合后所取出的42个不同的阿拉伯数字 双字符串来构成各汉字系统中的每一个字元代码的方法来构成各汉字系统中的每一个字元 的字母型代码,然后,用此代码按照本发明中的编码和取码规则,分别给各汉字系统中的汉 字单字、词、词组、短语和语句进行编码和取码,所取得的码在本发明中被称为字母型汉语 杨码;将字母型汉语杨码输入到中文信息处理设备中,就能够达到利用字母型汉语杨码输入 中文信息的目的;将字典、词(辞)典或其它汉语信息中的条目依照字母型汉语杨码序排列, 就能够达到利用字母型汉语杨码检索该字典、词(辞)典或其它汉语信息中条目的目的;将 非汉字字符或图形依照字母型杨码方式分别赋予字母型汉语杨码,就能够达到利用字母型汉 语杨码处理非汉字字符或图形信息的目的。

4.如权利要求1所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:用9个 不同的其它单字符(指除英文字母和阿拉伯数字以外的单字符,以下同)或由其它单字符与 英文字母字符、网拉伯数字字符混合后所组成的9个不同的单字符,分别替代权利要求2中 所述的9个不同的阿拉伯数字单字符1、2、3、4、5、6、7、8、9,和用这9个不 同的单字符及其排列组合后所取出的其中42个不同的双字符串,分别替代权利要求2中所 述的9个不同的阿拉伯数字单字符和42个不同的阿拉伯数字双字符串后,再按照权利要求 2中所述的用9个不同的阿拉伯数字单字符1、2、3、4、5、6、7、8、9及其排列 组合后所取出的42个不同的阿拉伯数字双字符串来构成各汉字系统中的每一个字元代码的 方法来构成各汉字系统中的每一个字元的其它型代码;然后,用此代码按照本发明中的编码 和取码规则,分别给各汉字系统中的汉字单字、词、词组、短语和语句进行编码和取码,所 取得的码在本发明中被称为其它型汉语杨码;将其它型汉语杨码输入到中文信息处理设备 中,就能够达到利用其它型汉语杨码输入中文信息的目的;将字典、词(辞)典或其它汉语 信息中条目依照其它型汉语杨码序排列,就能够达到利用其它型汉语杨码检索该字典、词 (辞)典或其它汉语信息中条目的目的;将非汉字字符或图形依照其它型汉语杨码方式分别 赋予其它型汉语杨码,就能够达到利用其它型汉语杨码处理非汉字字符或图形信息的目的。

5.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征 在于:汉语杨码编码和取码规则:

(1)单个汉字的杨码编码和取码规则:

①按照1997年4月7日国家语言文字工作委员会和国家新闻出版署联合发布的《现 代汉语通用字笔顺规范》中规定的汉字笔顺和优先取大的规则,视单个汉字是由一个或多个 字元(是指两个或两个以上的字元,以下同)构成;

②按照汉字的笔顺和优先取大的规则,视拆该汉字,并且将构成该汉字的所有字元代 码字符按照拆分时的先后顺序排列在一起,就构成了一个新字符串(含单个字符),这个新 字符串(含单个字符)就是该汉字的编码;

③当该汉字的编码字符不足5个时,取该汉字编码作为该汉字的杨码;

④当该汉字的编码字符超过4个时,取出该汉字编码的前4个字符,这前4个字符按 原顺序所构成的字符串即为该汉字的杨码;

(2)两个汉字或两个汉字以上的词、词组、短语或语句的杨码编码和取码规则:

①先取出该词、词组、短语或语句的第一个汉字杨码中的全部字符,再分别依次取出 其后各个汉字中的每一个汉字杨码中的第一个字符,然后将它们按取出时的先后顺序排列成 一个新字符串,这个新字符串就是该词、词组、短语或语句的编码;

②当组成该词、词组、短语或语句的汉字不足7个时,就取该词、词组、短语或语句 的编码作为该词、词组、短语或语句的杨码;

③当组成该词、词组、短语或语句的汉字超过6个时,就取出该词、词组、短语或语 句前6个汉字的编码作为该词、词组、短语或语句的杨码。

(3)非汉字字符和图形的编码和取码规则:

①当非汉字字符或图形是由本发明中所定义的字元构成时,那么,这个非汉字字符或 图形的编码和取码规则均同上述的汉字单字、词、词组、短语、语句的编码和取码规则;

②当非汉字字符或图形不是由本发明中所定义的字元构成时,其编码和取码规则均由 用户自行定义,但是,用户在自行定义该非汉字字符或图形的编码和取码规则时,必须要使 用户自行定义中的所有非汉字字符或图形的编码字符类型与同版本中的汉字编码字符类型 保持一致。

(4)容错码

为了兼顾部分人的习惯,本发明容许部分汉字以下列“不规范”方式编码和取码,这样 所取得的杨码可作为“容错码”存在。本发明支持下列容错:

①支持笔顺容错

笔顺容错是指:每个汉字除了按1997年4月7日国家语言文字工作委员会和国家新闻 出版署联合发布的《现代汉语通用字笔顺规范》中所规定的标准笔顺外,其中部分汉字还具 有另外一种或多种人们习惯上所采用的其它笔顺,本发明中称该笔顺为该汉字的异笔顺;本 发明容许异笔顺存在的现象被称为笔顺容错;汉字以异笔顺编码后所取得的杨码,称之为笔 顺容错码;本发明支持笔顺容错码的存在,即支持笔顺容错。

②支持笔画笔形容错

笔画笔形容错是指:部分汉字中的部分笔画笔形易使人们误解,在本发明中容许这种误 解存在的现象被称为笔画笔形容错;汉字以误解的笔画笔形编码后所取得的杨码,称之为笔 画笔形容错码;本发明支持笔画笔形容错码的存在,即支持笔画笔形容错。

③支持视拆容错

视拆容错是指:人们在视拆汉字过程中,常常将部分汉字的字元拆错;在本发明中容许 这种拆错汉字字元存在的现象被称之为视拆容错;汉字以拆错的字元编码后所取得的杨码, 称之为视拆容错码;本发明支持视拆容错码的存在,即支持视拆容错。

④支持自定义容错

自定义容错是指:人们为了某种目的,有意识地将某些汉字的单字、词、词组、短语、 语句或非汉字字符、图形,按其缩写形式或密码形式自行定义成一种杨码;以这种形式所取 得的杨码,称之为自定义容错码;本发明支持自定义容错码的存在,即支持自定义容错。

6.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征 在于:优先取大的规则,是指在构成同一个汉字的所有字元中,笔画多的字元视为大,视拆 汉字时,该汉字中的笔画多的字元必须优先作为字元拆分出,即笔画多的字元应作为一个整 体字元存在,不可再将其拆分成两个或两个以上的笔画比它还要少的字元来作为构成该汉字 的字元。

7.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征 在于:中文信息处理设备,是指除了在硬件上至少要配备有与其软件相适应的运算器、控制 器、存贮器、输入设备或装置、输出设备或装置外,在软件上至少还要配备有与其硬件相适 应的中文操作系统和杨码汉字输入法系统。

8.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征 在于:汉字输入方法及其步骤。根据中文信息处理设备的不同,与其相对应的杨码汉字输入 方法及其输入步骤也不同,现分述如下:

(1)键盘式杨码汉字输入法:采用键盘,用手击键,逐一按序输入中文信息杨码及其选 择码字符,以达到利用键盘输入中文信息的目的。按照所配备的杨码输入法系统软件分类, 键盘式杨码汉字输入法分为以下三类:

①键盘式数字型杨码汉字输入法

a采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入汉语杨 码及其选择码字符的10个阿拉伯数字键和退格键、确定键,其输出设备或装置至少要配备 有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和键盘式 数字型杨码汉字输入系统。

b用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好 要输入中文信息的位置后,再进入键盘式数字型杨码汉字输入系统,此时,屏幕上显示出杨 码汉字输入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序,用 手指逐一地敲击键盘上相对应的数字键,这时,显示屏上的杨码汉字输入法窗口界面内也随 之逐屏显示出与敲击过的字符或字符串相对应的同杨码中文信息及其选择码和具有联想关 系的中文信息及其选择码,当敲击完要输入的中文信息的全部杨码字符及其选择码字符后, 此时,如果显示屏上的杨码汉字输入法窗口界面内不再显示出其它中文信息及其选择码,则 系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文 本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时 的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上的杨码汉字输入法窗 口界面内还在继续显示出下一屏的其它中文信息及其选择码,这时只要敲击一下键盘上的确 定键,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文 信息文本中所确定好的位置上显示出来,同时屏幕上又显示出杨码汉字输入法窗口开始状态 时的界面,等待操作者输入下条中文信息或进行其它操作。

②键盘式字母型杨码汉字输入法

a采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入中文信 息字母型杨码各个字符的字母键、输入中文信息各个选择码字符的10个阿拉伯数字的数字 键、翻页键、退格键、确定键,其输出设备或装置至少要配备有显示屏设备或装置,其系统 软件中至少要配备有与其硬件相适应的中文操作系统和键盘式字母型杨码汉字输入系统。

b用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好 要输入中文信息的位置后,再进入键盘式字母型杨码汉字输入系统,此时,屏幕上显示出杨 码汉字输入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序逐一 地用手指敲击键盘上相对应的字母键,这时,显示屏上的杨码汉字输入法窗口界面内也随之 逐屏显示出与敲击过的字符或字符串相对应的同杨码中文信息及其选择码和具有联想关系 的中文信息及其选择码,当敲击完要输入的中文信息的全部杨码字符后,显示屏上的杨码汉 字输入法窗口界面内就显示出与要输入的中文信息同杨码的全部中文信息及其选择码和具 有联想关系的中文信息及其选择码;最后根据显示屏上的杨码汉字输入法窗口界面内的提 示,输入与要输入的中文信息相关的选择码字符(是阿拉伯数字字符)或字符串(是翻页用 字符与选择码阿拉伯数字字符混合排列的字符串),此时,系统就会自动地将要输入的中文 信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出 来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条 中文信息或进行其它操作。

③键盘式其它型杨码汉字输入法

a采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入其它型 杨码字符的各个字符键、输入中文信息各个选择码字符的10个阿拉伯数字的数字键、、翻页 键、退格键、确定键,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至 少要配备有与其硬件相适应的中文操作系统和键盘式其它型杨码汉字输入系统。

b用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好 要输入中文信息的位置后,再进入键盘式其它型杨码汉字输入系统,此时,屏幕上显示出杨 码汉字输入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序逐一 地用手指敲击键盘上相对应的字符键,这时,显示屏上的杨码汉字输入法窗口界面内也随之 逐屏显示出与敲击过的字符或字符串相对应的同杨码中文信息及其选择码和具有联想关系 的中文信息及其选择码,当敲击完要输入的中文信息的全部杨码字符后,显示屏上的杨码汉 字输入法窗口界面内就显示出与要输入的中文信息同杨码的全部中文信息及其选择码和具 有联想关系的中文信息及其选择码;最后根据显示屏上的杨码汉字输入法窗口界面内的提 示,输入与要输入的中文信息相关的选择码字符(是阿拉伯数字字符)或字符串(是翻页用 字符与选择码阿拉伯数字字符混合排列的字符串),此时,系统就会自动地将要输入的中文 信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出 来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条 中文信息或进行其它操作。

(2)鼠标式杨码汉字输入法

①采用此法的中文信息处理设备中,其输入设备或装置至少要配备有鼠标设备或装 置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬 件相适应的中文操作系统和鼠标式杨码汉字输入系统。

②用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好 要输入中文信息的位置后,再进入鼠标式杨码汉字输入系统,此时屏幕上显示出杨码汉字输 入法窗口开始状态时的界面;然后用手操作鼠标,按照要输入的中文信息及其杨码字符的前 后顺序逐一地去点击杨码汉字输入法窗口界面内的与之相对应的信息提示处,或者按照要输 入的中文信息杨码字符的前后顺序逐一地去点击虚拟键盘上与要输入的中文信息杨码字符 相对应的字符处,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示与点击过信 息具有同杨码和联想关系的信息;当点击到与要输入的中文信息相符的信息后,或当点击完 与要输入的中文信息的杨码字符相对应的全部字符及其选择码字符后,如果显示屏上不再显 示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理 设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示 出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作; 如果显示屏上杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则点击 一下杨码汉字输入法窗口界面内的确定符后,系统就会自动地将要输入的中文信息输入到中 文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上 又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行 其它操作。

(3)触摸式杨码汉字输入法

①采用此法的中文信息处理设备中,其输入和输出设备或装置至少要配备有触摸屏设 备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和触摸式杨码汉字输 入系统。

②用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好 要输入中文信息的位置后,再进入触摸式杨码汉字输入系统,此时屏幕上显示出杨码汉字输 入法窗口开始状态时的界面;然后用手或笔或其它器物按照要输入的中文信息或其杨码字符 的前后顺序逐一地触摸杨码汉字输入法窗口界面内的与之相对应的信息提示处,这时,显示 屏上的杨码汉字输入法窗口界面内也随之逐屏显示与触摸过的信息具有同杨码和联想关系 的信息,当触摸到与要输入的中文信息相符的信息或触摸完要输入的中文信息杨码字符后, 如果显示屏上不再显示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息 输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同 时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信 息或进行其它操作;如果显示屏上杨码汉字输入法窗口界面内还在继续显示出其它中文信息 及其选择码,则触摸一下杨码汉字输入法窗口界面内的确定符处后,系统就会自动地将要输 入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上 显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输 入下条中文信息或进行其它操作。

(4)书写式杨码汉字输入法

①采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入字符的 书写笔和书写板设备或装置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软 件中至少要配备有与其硬件相适应的中文操作系统和书写式杨码汉字输入系统。

②用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好 要输入中文信息的位置后,再进入书写式杨码汉字输入系统,此时,屏幕上显示出杨码汉字 输入法窗口开始状态时的界面;然后用书写笔将要输入的中文信息杨码字符按照前后顺序逐 一地写在书写板上,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示出与输入 过的字符或字符串相对应的具有同杨码和联想关系的中文信息,当书写完要输入中文信息杨 码的全部字符后,显示屏上的杨码汉字输入法窗口界面内就显示出与要输入中文信息杨码同 杨码的全部中文信息及其选择码和具有联想关系的中文信息及其选择码;最后根据显示屏上 的杨码汉字输入法窗口界面内的提示,在书写板上写上与要输入的中文信息相关的选择码字 符或字符串(是翻页用字符与选择码字符混合排列的字符串),此时,如果显示屏上不再显 示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理 设备中,并且在要输入中文信息的文本中所确定好的位置上显示出来,同时屏幕上又重新显 示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操 作;如果显示屏上杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则 在书写板上写上确定符后,系统就会自动地将要输入的中文信息输入到中文信息处理设备 中,并且在要输入中文信息的文本中所确定好的位置上显示出来,同时屏幕上又重新显示出 杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。

(5)语音式杨码汉字输入法

①采用此法的中文信息处理设备中,其输入设备或装置至少要配备有语音输入设备或 装置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其 硬件相适应的中文操作系统和语音式杨码汉字输入系统。

②用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好 要输入中文信息的位置后,再进入语音式杨码汉字输入系统,此时,屏幕上显示出杨码汉字 输入法窗口开始状态时的界面;然后将要输入的中文信息杨码字符以其语音的形式按照前后 顺序逐一地通过语音输入设备或装置输入到中文信息处理设备中,这时,显示屏上的杨码汉 字输入法窗口界面内也随之逐屏地显示出与输入过的字符或字符串相对应的具有同杨码和 联想关系的中文信息,当输完要输入中文信息的全部杨码字符后,显示屏上的杨码汉字输入 法窗口界面内就显示出与要输入中文信息同杨码的全部中文信息及其选择码和具有联想关 系的中文信息及其选择码;最后根据显示屏上的杨码汉字输入法窗口界面内的提示,再输入 与要输入中文信息相关的选择码字符或字符串(是翻页用字符与选择码字符混合排列的字符 串)中的各个字符的语音,此时,如果显示屏上杨码汉字输入法窗口界面内不再显示出其它 中文信息及其选择码,则系统就会自动输入要输入的中文信息,并且在要输入中文信息文本 中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的 界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上的杨码汉字输入法窗口 界面内还在继续显示出其它中文信息及其选择码,则输入确定符的语音后,系统就会自动地 将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的 位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操 作者输入下条中文信息或进行其它操作。

(6)在实际应用中,本发明容许以上各类汉字输入法中的各个版本可以在各中文信息处 理设备中单独存在和应用,也容许它们之中的不同类型的不同版本或同类型中的不同版本同 时存在于同一个中文信息处理设备中,以便可以分别提取出来或同时提取出来进行应用,还 容许它们之中的之一或几种版本的杨码汉字输入法与其它非杨码汉字输入法中的之一或几 种版本汉字输入法同时存在于同一个中文信息处理设备中,以便可以分别提取出来或同时提 取出来进行应用。

9.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征 在于:杨码汉字输入法窗口界面的形式目前有两类:其一是用目前已在广泛应用的Windows 中文信息操作系统中的输入法生成器所生成的杨码汉字输入法窗口界面形式;其二是至少具 有如下设置的杨码汉字输入法窗口界面形式:

(1)该窗口界面内设置一个编辑框,用来显示和编辑已输入的中文信息杨码和选择码的 字符或字符串;

(2)该窗口界面内设置一个中文信息提示栏,用来显示与编辑框中的字符或字符串相对 应的具有同杨码或联想关系的中文信息;

(3)该窗口界面内,在中文信息提示栏内的每条中文信息的前端设置一个用来选择该中 文信息的选择码提示符;

(4)该窗口界面内,在中文信息提示栏内的每条中文信息上面都设置一个用来选择该中 文信息或选择该中文信息选择码提示符的不可见按钮;

(5)该窗口界面内设置有翻页符,并且,在此翻页符上具有不可见按钮,用来翻页中文 信息提示栏;

(6)该窗口界面内设置一个确定符,并且,在此确定符上具有一个不可见按钮,用来确 定已选定的中文信息;

(7)该窗口界面内设置一个窗口界面关闭按钮,用以关闭该窗口界面。

10.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征 在于:中文信息排序规则;

(1)杨码汉字输入法中的中文信息排序规则

①单个汉字的排序规则:

a在简体汉字系统或繁体汉字系统中的同版本杨码汉字输入法中,对于不同杨码的单 个汉字是按照各个汉字杨码字符的自然序列升序排序,对于同杨码的单个汉字是按照汉字的 使用频度(指该汉字与其同杨码汉字比较,在日常使用中所出现的频率)排序,使用频度高 者排在前面,使用频度低者排在后面;

b在简繁体汉字共存系统中的同版本杨码汉字输入法中,对于不同杨码的单个汉字是 按照各个汉字杨码字符的自然序列升序排序,对于同杨码的单个汉字是先按照汉字的使用频 度排序好简体汉字后,再接着按照汉字的使用频度排序好未排到的同杨码的繁体汉字,而且, 在同杨码的简体汉字中,使用频度高者排在前面,使用频度低者排在后面,同样,在同杨码 的繁体汉字中,使用频度高者排在前面,使用频度低者排在后面。

②两个或两个以上汉字的词、词组、短语和语句的排序规则:

a在同版本杨码汉字输入法中,同杨码的两个或两字以上汉字的词、词组、短语和语 句均排在同杨码单个汉字(除容错码单个汉字外)之后;

b在同版本杨码汉字输入法中,同杨码的两个或两个以上汉字的词、词组、短语和语 句之间是按照其汉字个数的多少进行排序,即字数少的词、词组、短语和语句排在前面,字 数多的词、词组、短语和语句排在后面;

c在同版本杨码汉字输入法中,不同杨码的两个或两个以上汉字的词、词组、短语和 语句是按照其杨码字符的自然序列升序排序。

③非汉字字符和图形的排序规则:

非汉字字符和图形在同版本杨码汉字输入法中的排序规则,均与同版本杨码汉字输入法 中汉语的排序规则相同,即非汉字字符和图形在同版本杨码汉字输入法中均视同同版本杨码 汉字输入法中汉字的单字、词、词组、短语或语句来处理。

④容错码汉字的排序规则:

a在同版本杨码汉字输入法中,依据容错码编码和取码的汉字,均排在依据标准码编 码和取码的同杨码汉字的单字、词、词组、短语和语句之后;

b在同版本杨码汉字输入法中,依据容错码编码和取码的同杨码汉字之间,使用频度 高者排在前面,使用频度低者排在后面;

c在同版本杨码汉字输入法中,依据容错码编码和取码的同杨码两个或两个以上汉字 的词、词组、短语和语句均排在其同杨码单个汉字之后,而它们之间则是按照其汉字个数的 多少进行排序,即字数少的词、词组、短语和语句排在前面,字数多的词、词组、短语和语 句排在后面。

(2)杨码汉字检索法中的中文信息排序规则

杨码汉字检索法中的中文信息是指在依据杨码序排列的字典、词(辞)典、其它中文信 息记录中的中文信息,其排序规则如下:

①单个汉字的排序规则:

在以杨码序排列的同版本中文信息中,对于不同杨码的字头及其信息是按照各个字头杨 码字符的自然序列升序排序,对于同杨码的字头及其信息先是分别按照字头简体汉字,繁体 汉字,异体汉字的先后顺序排序后,再将简体汉字字头之间的同杨码字头及其信息或繁体汉 字字头之间的同杨码字头及其信息或异体汉字字头之间的同杨码字头及其信息分别按照字 头编码自然序列升序排序,同编码的汉字字头及其信息是按照字头使用频度排序,使用频度 高者及其信息排在前面,使用频度低者及其信息排在后面;

②两个或两个以上汉字的词、词组、短语和语句及其信息的排序规则:

a在同版本中,两个或两个以上汉字的词、词组、短语和语句及其信息均排其字头信 息之后;

b在同版本中,字头相同的同杨码两个或两个以上汉字的词、词组、短语和语句及其 信息之间的排序是按照同杨码两个或两个以上汉字的词、词组、短语和语句汉字个数的多少 进行排序,即字数少的词、词组、短语和语句及其信息排在前面,字数多的词、词组、短语 和语句及其信息排在后面,字数相同时,按其最后一个汉字编码的自然序列升序排序;

c在同版本中,字头相同的不同杨码两个或两个以上汉字的词、词组、短语和语句及 其信息之间的排序是按照不同杨码两个或两个以上汉字的词、词组、短语和语句杨码的自然 序列升序排序。

③非汉字字符和图形的排序规则:

非汉字字符和图形在各个版本中的排序规则,均与同杨码汉字的排序规则相同,即非汉 字字符和图形在各个版本中均视同汉字的单字、词、词组、短语或语句来处理。

④容错码汉字的排序规则:

a在同版本中,依据容错码规则编码和取码的字头,均排在与其同杨码且依据标准码 规则编码和取码的字头的汉字的单字、词、词组、短语和语句及其信息之后,并在该容错码 汉字旁边标注上其标准码;

b在同版本中,依据容错码规则编码和取码的同杨码汉字字头及其信息之间的排序是 按照它们字头编码字符的自然序列升序排序;同编码的容错码汉字字头是按照其使用频度排 序,使用频度高者及其信息排在前面,使用频度低者及其信息排在后面;

c在同版本中,依据容错码编码和取码的不同杨码汉字字头及其信息之间的排序是按 照它们字头杨码字符的自然序列升序排序。

说明书

汉语编码及其汉字输入法和汉字检索法

技术领域  本发明涉及汉语编码技术、汉字输入技术和汉字检索技术,尤其涉及一种新的 汉语形码编码技术及其汉字输入法和汉字检索法。本发明属于汉语编码及其汉字输入和汉字 检索技术领域。

背景技术  自从电子计算机问世以来,汉语编码技术一直深受到人们重视。这些年来,不 少研究人员根据汉字的字形、发音等特性,从各个角度采用不同的方法对汉字进行了编码。 目前已申请专利的编码方案超过千种,形成了万“码”奔腾的局面,同时也促进了汉语编码 及其汉字输入法和汉字检索法朝着易学、易记、快速、好用的方向发展。

现有的汉语编码方案可分为四类:流水码类、纯音码类、纯形码类、音形结合码类。它 们分别具有以下的特点:

1.流水码类,如电报码等,其特点是:以流水方式编码。

此类编码方案中,因为其专业性强,难于记忆,所以,对于非专业人员来说,不易掌握 和直接应用它。

2.纯音码类,如全拼、双拼等,其特点是:直接用汉语拼音方案中的拼音字母进行编 码。

此类编码方案中,目前流行最广的是全拼汉字输入法和全拼汉字检索法。此法具有如下 优点:(1)现代人从小学就开始就学习汉语拼音,且具有一定的普通话基础,不必花更多额 外的精力,就能学会使用这种方法;(2)以词组输入效率较高;(3)编码直观,思维连贯; (4)与已有的中文知识和习惯兼容性好。但是,这种汉字输入法和汉字检索法还存在有如下 难以克服的缺点:(1)目前正在使用着的汉字超过15000余个,对于大多数人来说,他 们对其中很多汉字不认识,这就给他们用拼音来输入这些汉字和检索这些汉字带来了困难; (2)方言多且复杂,普通话基础差的人也不在少数,这就给推广和应用全拼汉字输入法 和全拼汉字检索法带来了障碍;(3)因为汉字同音字多,所以单字重码率很高;(4)有些汉 字发音相近,不容易分辩和区分;(5)用键多,使用不方便;(6)击键次数较多,输入汉字 速度不易提高。

3.纯形码类,如五笔字型、郑码、五笔画等;其特点是:它们是按汉字的笔形、部件、 结构特征进行编码。

此类编码方案中,目前流行最广的是五笔字型汉字输入法,它具有以下优点:(1)避免 了汉字语音的影响;(2)重码率低;(3)对于经过特殊训练的专业人员来说,输字效率较高。 但是,此方法还存在着不少的缺点:(1)编码不直观,不连贯,编码思维与人们习惯思维严 重脱离;(2)对汉字拆分过细,字根多且杂,不易记,容易忘;(3)规则复杂;(4)与已有 的中文知识和习惯兼容性差;(5)用键多;(6)操作此输入法人员要经过特殊训练,否则输 字效率较低。

4.音形组合码类,如表形码、万码、属性分类码、笔顺区位码、模糊元码、笔韵码、 音形码、快易码等,其特点是:这类编码同时兼有纯音码类和纯形码类中的一些特点。

此类编码方案中,一般汉字重码率都较低,但是,它们都要求其使用者同时要掌握汉字 语音和字形两种因素,因此,在输入汉字时,操作者不但要具有很高的普通话水平和中文水 平,而且,人脑还要多经过一道分辨和综合程序,所以,此类汉字输入法方案虽然很多,但 都较难掌握,使用也不方便。

以上四类汉语编码方案及其汉字输入法和汉字检索法,之所以目前形成万“码”奔腾的 局面,其主要的原因是,在易学、易记、快速、好用这几方面,它们各自有自己的优点,同 时,也都存在着顾此失彼,不能兼顾的缺陷。

发明内容  本发明的目的是要提供一种新颖地汉语编码方案,而且,要利用这种方案来创 造出一种易学、易记、快速、好用的汉字输入法和汉字检索法。

本发明是这样实现的:

一、字元及其代码

1.定义字元

一般常用汉语字典或汉语词典中的传统部首可分为两大类:一类是由单笔画构成的部 首,被称为单笔画部首;另一类是由两笔或两笔以上笔画构成的部首,被称为多笔画部首。

本发明从一般常用汉语字典或汉语词典的传统部首中,选取其中全部单笔画部首作为本 发明中构成汉字的单笔画型标准部件,再从一般常用汉语字典或汉语词典的传统部首中选取 其中部分多笔画部首作为本发明中构成汉字的多笔画型标准部件,这些构成汉字的单笔画型 标准部件和多笔画型标准部件在本发明中被统称为汉字的字元,并且,其中所有单笔画型标 准部件又被称为单笔画字元,所有多笔画型标准部件又被称为多笔画字元。

2.字元分组

目前汉字信息以简体汉字系统、繁体汉字(含异体汉字,以下同)系统、简繁体汉字(含 异体汉字,以下同)共存系统这三类系统形式存在着,因此,它们的字元及其字元组也分为 三类,现分述如下:

(1)简体汉字系统字元共分成50组,其中5组是单笔画字元组,它们分别是:“一、 组、“丨、亅”组、“丿”组、“丶、”组和“乙、*(*代表除前面已提到的单笔画部首 以外的其它所有的汉字单笔画部首,以下同)”组,另45组是多笔画字元组,它们分别是: “扌”组、“口”组、“人、八、亻”组、“氵”组、“ ”组、“王”组、“酉”组、“石”组、 “车”组、“止”组、“田”组、“山”组、“贝”组、“罒”组、“爫”组、“月”组、“鱼”组、 “犭”组、“饣”组、“门”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“马”组、 “尸”组、“弓”组、“女”组、“纟”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、 曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“钅”组、“舟”组、“”组、“广、 疒”组、“忄”组、“火”组和“宀”组;

(2)繁体汉字系统字元共分成51组,其中5组是单笔画字元组,它们分别是:“一、 组、“丨、亅”组、“丿”组、“丶、”组和“乙、*”组,另46组是多笔画字元组,它们 分别是:“扌”组、“口”组、“人、八、亻”组、“氵”组、“ ”组、“王”组、“酉”组、 “石”组、“車”组、“止”组、“田”组、“山”组、“貝”组、“罒”组、“爫”组、“月”组、 “魚”组、“犭”组、“飠”组、“門”组、“言”组、“立”组、“羊、”组、“米”组、“衤、 礻”组、“馬”组、“尸”组、“弓”组、“女”组、“糹”组、“耳”组、“土、士”组、“艹” 组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“金”组、“舟” 组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组;

(3)简繁体汉字共存系统字元共分成51组,其中5组是单笔画字元组,它们分别是: “一、 组、“丨、亅”组、“丿”组、“丶、”组和“乙、*”组,另46组是多笔画字 元组,它们分别是:“扌”组、“口”组、“人、八、亻”组、“氵”组、“ ”组、“王”组、 “酉”组、“石”组、“车、車”组、“止”组、“田”组、“山”组、“贝、貝”组、“罒”组、 “爫”组、“月”组、“鱼、魚”组、“犭”组、“饣、飠”组、“门、門”组、“言”组、“立” 组、“羊、”组、“米”组、“衤、礻”组、“马、馬”组、“尸”组、“弓”组、“女”组、“纟、 糹”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“” 组、“夕、夂”组、“钅、金”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和 “宀”组。

从上面三类汉字系统的字元组中可以看出,它们都具有5组相同的单笔画字元组:“一、 组、“丨、亅”组、“丿”组、“丶、”组、“乙、*”组,和37组相同的多笔画字元 组:“扌”组、“口”组、“人、八、亻”组、“氵”组、“ ”组、“王”组、“酉”组、“石” 组、“止”组、“田”组、“山”组、“罒”组、“爫”组、“月”组、“犭”组、“立”组、“羊、 ”组、“米”组、“衤、礻”组、“尸”、“弓”组、“女”组、“耳”组、“土、士”组、 “艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“舟”组、 “”组、“广、疒”组、“忄”组、“火”组和“宀”组;它们之间有所不同的字元组分别 是:(1)简体汉字系统中有8组多笔画字元组,它们分别是:“车”组、“贝”组、“鱼”组、 “饣”组、“门”组、“马”组、“纟”组和“钅”组;(2)繁体汉字系统中有9组多笔画字 元组,它们分别是:“車”组、“貝”组、“魚”组、“飠”组、“門”组、“言”组、“馬”组、 “糹”组和“金”组;(3)简繁体汉字共存系统中有9组多笔画字元组,它们分别是:“车、 車”组、“贝、貝”组、“鱼、魚”组、“饣、飠”组、“门、門”组、“言”组、“马、馬”组、 “纟、糹”组和“钅、金”组。

3.字元代码

本发明用9个不同的单字符分别依次给上述各类汉字系统中的前9组相同的字元组 “一、 组、“丨、亅”组、“丿”组、“丶、”组、“乙、*”组、“扌”组、“口”组、 “人、八、亻”纽和“氵”组中的每组字元赋予同一个单字符作为本组内每一个字元的同一 代码,再用上述的9个不同的单字符进行排列组合成的41个(简体汉字系统)或42个(繁 体汉字系统、简繁体汉字共存系统)不同的双字符串,分别给上述其后41组(简体汉字系 统)或42组(繁体汉字系统、简繁体汉字共存系统)中的每组字元赋予同一个双字符串作 为本组内每一个字元的同一代码。如果上述的9个不同的单字符分别被9个不同的阿拉伯数 字所代替,则这些字元的代码就被定义为数字型字元代码;如果上述的9个不同的单字符分 别被9个不同的英文字母所代替,则这些字元的代码就被定义为字母型字元代码;如果上述 的9个不同的单字符分别被9个不同的其它字符或其它字符与英文字母字符、阿拉伯数字字 符的混合所代替,则这些字元的代码就被定义为其它型字元代码。下面就这三类字元代码在 各类汉字系统中的具体内容分述如下:

(1)数字型字元代码

用1、2、3、4、5、6、7、8、9这9个不同的阿拉伯数字字符代替上述的9个 不同的单字符,分别给三类汉字系统中具有相同的字元组“一、 组、“丨、亅”组、“丿” 组、“丶、”组、“乙、*”组、“扌”组、“口”组、“人、八、亻”组和“氵”组这9个 组中的字元按序按组赋予同一个阿拉伯数字字符来作为该组内每一个字元的代码,用1、2、 3、4、5、6、7、8、9这9个不同的阿拉伯数字字符代替上述的9个不同的单字符进 行排列组合后,①取出其中双字符串14、16、17、18、22、26、27、29、34、36、38、 46、47、48、49、56、57、58、66、67、68、69、76、77、78、79、86、88、89、96、97、 98、99这33个不同的阿拉伯数字双字符串代替上述的41个(简体汉字系统)或42个(繁 体汉字系统、简繁体汉字共存系统)不同的双字符串中的其中33个双字符串,分别给三类 汉字系统中具有相同的多笔画字元组“ ”组、“王”组、“酉”组、“石”组、“止”组、“田” 组、“山”组、“罒”组、“爫”组、“月”组、“犭”组、“立”组、“羊、”组、“米”组、 “衤、礻”组、“尸”组、“弓”组、“女”组、“耳”组、“土、士”组、“艹”组、“木”组、 “日、曰”组、“目”组、“虫“组、“”组、“夕、夂”组、“舟”组、“”组、“广、疒” 组、“忄”组、“火”组和“宀”组这33个组中的字元按序按组赋予同一个双字符串作为该 组内的每一个字元的代码;②取出其中双字符串19、28、37、39、42、55、59、87这8 个不同的阿拉伯数字双字符串代替上述简体汉字系统中的41个不同的双字符串中的其余8 个双字符串,分别给简体汉字系统中的字元组“车”组、“贝”组、“鱼”组、“饣”组、“门” 组、“马”组、“纟”组和“钅”组这8个组中的字元按序按组分别赋予一个双字符串作为该 组字元的同一代码;同样,用其中双字符串19、28、37、39、42、55、59、87这8个不同 的阿拉伯数字双字符串代替上述繁体汉字系统中42个不同的双字符串中的另外8个不同的 双字符串分别给繁体汉字系统中的“車”组、“貝”组、“魚”组、“飠”组、“門”组、“馬” 组、“糹”组和“金”组这8个组中的字元按序按组分别赋予一个双字符串作为该组字元的 同一代码;也同样用其中双字符串19、28、37、39、42、55、59、87这8个不同的阿拉伯 数字双字符串代替上述简繁体汉字共存系统中42个不同的双字符串中的另外8个不同的双 字符串分别给简繁体汉字共存系统中的“车、車”组、“贝、貝”组、“鱼、魚”组、“饣、 食”组、“门、門”组、“马、馬”组、“纟、糹”组和“钅、金”组这8个组中的字元按序 按组分别赋予同一个双字符串作为该组内每一个字元的同一代码;③取出其中双字符串45 这最后一个阿拉伯数字双字符串代替上述繁体汉字系统和简繁体汉字共存系统各42个不同 的双字符串中的最后一个双字符串,分别给繁体汉字系统和简繁体汉字共存系统中的相同的 字元组“言”组赋予同一个双字符串作为该组内字元的同一代码。为了进一步说清楚各类汉 字系统中的数字型字元代码,现将本发明中各类汉字系统的数字型字元代码分别列表如下:

表1  简体汉字系统数字型字元代码表

表2  繁体汉字系统数字型字元代码表

表3  简繁体汉字共存系统数字型字元代码表

(2)字母型字元代码

本发明中当用9个不同的英文字母字符分别依次替代上述9个不同的阿拉伯数字字符 1、2、3、4、5、6、7、8、9后,则三类汉字系统中的所有字元代码就变成了字母 型字元代码。

例如,当用h、n、m、j、k、l、u、i、o这9个不同的英文字母字符分别依次 替代上述9个不同的阿拉伯数字字符1、2、3、4、5、6、7、8、9后,则三类汉字 系统中的所有字元代码就变成了如表4、表5、表6中所列字母型(HO型)字元代码:

表4  简体汉字系统字母型(HO型)字元代码表

  hi   ho   nn   nl   nu   石   车   止   田   山   kk   kl   ku   ki   ko   马   尸   弓   女   纟   ol   ou   oi   oo   广疒   忄   火   宀

表5  繁体汉字系统字母型(HO型)字元代码表

表6  简繁体汉字共存系统字母型(HO型)字元代码表

(3)其它型字元代码

本发明中当用9个不同的其它字符或其它字符与英文字母字符、阿拉伯数字字符的混 合,分别依次替代上述9个不同的阿拉伯数字字符1、2、3、4、5、6、7、8、9后, 则三类汉字系统中的所有字元代码就成为了其它型字元代码。

二、汉语杨码编码规则

1.笔顺规则

(1)本发明采用1997年4月7日国家语言文字工作委员会和国家新闻出版署联合发布 的《现代汉语通用字笔顺规范》来作为本发明汉字的笔顺基础,即本发明汉字标准笔顺是按 照1997年4月7日国家语言文字工作委员会和国家新闻出版署联合发布的《现代汉语通用 字笔顺规范》中的规定所定。

(2)为了兼顾部分人的习惯,本发明同时还采用了人们习惯上与1997年4月7日国家 语言文字工作委员会和国家新闻出版署联合发布的《现代汉语通用字笔顺规范》规定中不同 的其它汉字笔顺作为本发明中的汉字非标准笔顺而存在。为了区别于汉字的标准笔顺,本发 明将汉字的非标准笔顺又称之为汉字的异笔顺。

例如,汉字“非”字标准笔顺的前四笔画顺序是“丨、一、一、一”,为了兼顾部分人 的习惯,本发明中也存在该汉字前四笔画顺序为“一、一、一、丨”的异笔顺,即在本发明 中,两种笔顺编码后所取得的杨码可以同时存在同一版本中。按照标准笔顺编码后所取得的 杨码被称之为标准码,按照异笔顺编码后所取得的杨码被称之为容错码。本发明中在汉字标 准码存在的同时,也容许该汉字的容错码(包括下面所介绍的其它三种容错码在内)存在。

2.优先取大规则

在构成单个汉字的所有字元中,笔画多的字元视为大,它被优先作为构成该汉字的字元 拆分出,即不可将笔画多的字元再次拆分成两个或两个以上的笔画比它少的字元来作为构成 该汉字的字元。

例如,汉字“木”字是由一个字元“木”构成,我们不可将字元“木”再次拆分成三个 笔画比它少的字元“一、丨、八”来作为构成“木”字的字元,或再次拆分成四个单笔画字 元“一、丨、丿、丶”来作为构成“木”字的字元。

3.单个汉字的编码规则

(1)按照汉字的笔顺规则和优先取大规则,视单个汉字是由一个或多个字元(是指两个 或两个以上的字元,以下同)构成;

(2)按照汉字的笔顺规则和优先取大规则,视拆单个汉字:首先从该汉字的首笔(书写 该汉字时起始笔画称之为该汉字的首笔)开始,按照常规的笔顺规则连续地书写下去,直到 构成该汉字首显的第一个最大字元而又不破坏下一个最大字元为止,此字元即为构成该汉字 的第一个字元;然后再将其余部(除去该汉字第一个字元后所余下的部分)视为单个汉字, 按照单个汉字的拆分规则进行视拆,直到得到该余部的第一个最大字元显现而又不破坏下一 个最大字元为止,此字元即为构成该汉字的第二个字元……照此方法,不断地将其后的余部 视拆下去,直到没有余部为止;

(3)视拆完一个汉字后,将所得到的该汉字所有字元的代码字符,按照视拆该汉字时的 先后顺序排列在一起,形成一个字符或一个新字符串,这个字符或这个新字符串即为该汉字 的编码。

4.两个或两个以上汉字的词、词组、短语、语句的编码规则

先取出组成该词、词组、短语或语句的第一个汉字杨码(关于汉字杨码概念,见下面所 述)中的全部字符,再分别依次取出其后各个汉字的每一个汉字杨码中的第一个字符,然后 将取出的所有字符按其被取出时的先后顺序排列在一起,组合成一个新字符串,这个新字符 串就是该两个或两个以上汉字的词、词组、短语或语句的编码。

5.非汉字字符或图形的编码规则

(1)当非汉字字符或图形是由本发明中所定义的字元构成时,那么,这个非汉字字符或 图形的编码规则均同汉字单字、词、词组、短语、语句的编码规则;

(2)当非汉字字符或图形不是由本发明中所定义的字元构成时,那么,这个非汉字字符 或图形的编码规则由用户自行定义,但必须保证用户自行定义中的所有非汉字字符或图形的 编码字符类型均要与同版本中的汉字编码所使用的字符类型保持一致。

三、汉语杨码

本发明中所指的汉语杨码是单个汉字的杨码、两个或两个以上汉字的词、词组、短语、 语句的杨码、非汉字字符和图形的杨码和汉字容错码的统称。

1.单个汉字的杨码

(1)当单个汉字的编码只有一个字符时,那么,这个字符就作为该汉字的杨码;

(2)当单个汉字的编码是一个不足5个字符的字符串时,那么,这个字符串就作为该汉 字的杨码;

(3)当单个汉字的编码是一个超过4个字符的字符串时,那么,按照该汉字编码字符的 先后顺序取出该汉字编码字符串的前4个字符,这前4个字符按照原来的先后顺序排列后所 构成的新字符串就作为该汉字的杨码。

2.两个或两个以上汉字的词、词组、短语或语句的杨码

(1)当构成汉字的词、词组、短语或语句的汉字总数不足7个汉字时,那么,该汉字的 词、词组、短语或语句的编码就作为该汉字的词、词组、短语或语句的杨码;

(2)当构成汉字的词、词组、短语或语句的汉字总数超过6个汉字时,那么,取该汉字 的词、词组、短语或语句的前6个汉字的编码作为该汉字的词、词组、短语或语句的杨码。

3.非汉字字符或图形的杨码

(1)当非汉字字符或图形是由本发明中所定义的字元构成时,那么,这个非汉字字符或 图形的取码规则均同汉字单字、词、词组、短语、语句的取码规则,即将此类非汉字字符或 图形均视同汉字单字、词、词组、短语、语句来处理;

(2)当非汉字字符或图形不是由本发明中所定义的字元构成时,那么,这个非汉字字符 或图形的取码规则由用户自行定义,但必须要使用户自行定义中的所有非汉字字符和图形的 杨码字符类型均要与同版本中的汉字杨码字符类型保持一致。

4.容错码

为了兼顾部分人的习惯,本发明容许部分汉字以下列“不规范”方式编码后所取得的“杨 码”作为该汉字的容错码。本发明支持下列容错码的存在:

(1)支持笔顺容错

笔顺容错是指:每个汉字除了按1997年4月7日国家语言文字工作委员会和国家新闻 出版署联合发布的《现代汉语通用字笔顺规范》规定的标准笔顺外,其中部分汉字还具有另 外一个或多个人们习惯上采用的其它笔顺,本发明中称该笔顺为该汉字的异笔顺;本发明容 许汉字异笔顺存在的现象被称为笔顺容错;汉字以异笔顺编码后所取得的杨码,称之为笔顺 容错码;本发明支持笔顺容错码的存在,即支持笔顺容错。

(2)支持笔画笔形容错

笔画笔形容错是指:部分汉字中的部分笔画笔形易使人误解,在本发明中容许这种误解 存在的现象被称为笔画笔形容错;汉字以误解的笔画笔形编码后所取得的杨码,称之为笔画 笔形容错码;本发明支持笔画笔形容错码的存在,即支持笔画笔形容错。

(3)支持视拆容错

视拆容错是指:人们在视拆汉字过程中,常常将部分汉字的字元拆错;在本发明中容许 这种拆错汉字字元存在的现象被称之为视拆容错;汉字以拆错的字元编码后所取得的杨码, 称之为视拆容错码;本发明支持视拆容错码的存在,即支持视拆容错。

(4)支持自定义容错

自定义容错是指:人们为了某种目的,有意识地将某些汉字的单字、词、词组、短语、 语句、非汉字字符或图形的杨码自行定义成一种缩写形式或密码形式出现;以这种形式所取 得的杨码,称之为自定义容错码;本发明支持自定义容错码的存在,即支持自定义容错。

四、杨码汉字输入法

1.定义中文信息处理设备

本发明中所指的中文信息处理设备,除了至少要配备有运算器、控制器、存贮器、输入 设备或输入装置、输出设备或输出装置外,至少还要配备有与其硬件相适应的中文操作系统 和杨码汉字输入法系统。

2.定义杨码汉字输入法

将汉语中的字、词、词组、短语和语句、非汉字字符和图形用其杨码形式输入到中文信 息处理设备中,以达到用杨码输入中文信息的目的,此种输入法被称之为杨码汉字输入法。

3.杨码汉字输入法分类

(1)按照杨码字符类型分类

①数字型杨码汉字输入法

由数字型字元代码编码后所取得的杨码即为数字型杨码,用数字型杨码输入中文信息的 方法,称之为数字型杨码汉字输入法。

②字母型杨码汉字输入法

由字母型字元代码编码后所取得的杨码即为字母型杨码,用字母型杨码输入中文信息的 方法,称之为字母型杨码汉字输入法。

③其它型杨码汉字输入法

由其它型字元代码编码后所取得的杨码即为其它型杨码,用其它型杨码输入中文信息的 方法,称之为其它型杨码汉字输入法。

(2)按照所用的输入设备或装置分类

①键盘式杨码汉字输入法

a 键盘式数字型杨码汉字输入法

本法采用通用的数字键盘或通用英文键盘或其它键盘上所配置的数字键盘,人工敲击其 上所配置的数字键,按序输入与想要输入的中文信息杨码及其选择码字符所对应的数字型字 符,就会将中文信息的杨码及其选择码输入到中文信息处理设备中,以达到利用数字型杨码 输入中文信息的目的。本发明中用此法输入中文信息的方法被称为键盘式数字型杨码汉字输 入法。

b 键盘式字母型杨码汉字输入法

本法采用通用的英文键盘或其它键盘,人工敲击其上所配置的英文字母键、数字键和翻 页键,按序输入与想要输入的中文信息杨码字符所对应的字母型字符和与其选择码字符所对 应的数字型字符,就会将中文信息杨码及其选择码输入到中文信息处理设备中,以达到利用 字母型杨码输入中文信息的目的。本发明中用此法输入中文信息的方法被称为键盘式字母型 杨码汉字输入法。

c 键盘式其它型杨码汉字输入法

本法采用通用英文键盘或通用数字键盘或其它键盘,人工敲击其上所配置的其它字符 键、英文字母键、数字键和翻页键,按序输入与想要输入的中文信息杨码及其选择码字符所 对应的字符,就会将中文信息杨码及其选择码输入到中文信息处理设备中,以达到利用其它 型杨码输入中文信息的目的。本发明中用此法输入中文信息的方法被称为键盘式其它型杨码 汉字输入法。

②鼠标式杨码汉字输入法

本法采用通用中文信息处理设备中所配置的鼠标输入设备或装置,人工用鼠标按序点击 该中文信息处理设备上的显示屏中所显示出来的虚拟键盘上与想要输入的中文信息杨码及 其选择码字符所对应的字符虚拟键,就会将要输入的中文信息杨码及其选择码输入到中文信 息处理设备中,以达到利用杨码输入中文信息的目的,或者,人工用鼠标点击在该中文信息 处理设备上显示屏中所显示出来的杨码输入法窗口界面中的与想要输入的中文信息所对应 的中文信息提示处,就会将要输入的中文信息输入到中文信息处理设备中,以达到利用鼠标 输入中文信息的目的。本发明中用此法输入中文信息的方法被称为鼠标式杨码汉字输入法。

③触摸式杨码汉字输入法

本法采用通用中文信息处理设备中所配置的触摸输入设备或装置,人工用触笔或手指或 其它器物触摸该中文信息处理设备上显示屏中所显示出来的杨码输入法窗口界面中的与想 要输入中文信息杨码及其选择码字符所对应的信息提示处,就会将要输入的中文信息输入到 中文信息处理设备中,以达到利用触摸方式输入中文信息的目的。本发明中用此法输入中文 信息的方法被称为触摸式杨码汉字输入法。

④书写式杨码汉字输入法

本法采用通用中文信息处理设备中所配置的书写输入设备或装置,在其书写板上,用书 写笔按顺序书写与想要输入的中文信息杨码及其选择码字符相对应的字符,就会将要输入的 中文信息杨码及其选择码输入到中文信息处理设备中,以达到利用杨码输入中文信息的目 的。本发明中用此法输入中文信息的方法被称为书写式杨码汉字输入法。

⑤语音式杨码汉字输入法

本法采用通用中文信息处理设备中所配置的语音输入设备或装置,用其按顺序输入与想 要输入的中文信息杨码及其选择码字符相对应的语音,就会将要输入的中文信息杨码及其选 择码输入到中文信息处理设备中,以达到利用杨码输入中文信息的目的。本发明中用此法输 入中文信息的方法被称为语音式杨码汉字输入法。

4.输入中文信息的步骤

本发明中,对于不同的中文信息处理设备和不同的中文操作系统,所配置的杨码汉字输 入系统也不同,同时,输入中文信息的步骤也有区别,现分述如下:

(1)用键盘输入中文信息

①键盘式数字型杨码汉字输入法

采用此法的中文信息处理设备中,其输入设备或装置至少要配备有能够用于输入各个阿 拉伯数字字符的数字键、退格键、确定键,其输出设备或装置至少要配备有显示屏设备或装 置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和键盘式数字型杨码汉字输 入系统。

用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好输入中 文信息的位置后,再进入键盘式数字型杨码汉字输入系统,此时,屏幕上显示出杨码汉字输 入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序逐一地用手指 敲击键盘上与之相对应的数字键,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏 显示出与输入字符或字符串相对应的具有同杨码和联想关系的中文信息及其选择码;当敲击 完要输入的中文信息的全部杨码及其选择码字符后,此时,如果显示屏上的杨码汉字输入法 窗口界面内不再显示出其它中文信息,则系统就会自动地将要输入的中文信息输入到中文信 息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重 新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下一条中文信息或进行其 它操作;如果显示屏上的杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择 码,这时只要敲击一下键盘上的确定键,系统就会自动地将要输入的中文信息输入到中文信 息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重 新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下一条中文信息或进行其 它操作。

②键盘式字母型杨码汉字输入法

采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入字母型杨码 各个英文字母字符的字母键、用于输入各个阿拉伯数字字符的数字键、翻页键、退格键和确 定键,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其 硬件相适应的中文操作系统和键盘式字母型杨码汉字输入系统。

用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好输入中 文信息的位置后,再进入键盘式字母型杨码汉字输入系统,此时,屏幕上显示出杨码汉字输 入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序逐一地用手指 敲击键盘上相对应的字母键,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示 出与输入字符或字符串相对应的具有同杨码和联想关系的中文信息及其选择码;当敲击完与 要输入的中文信息相对应的的全部杨码字符字母键及其选择码字符键后,此时,系统就会自 动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定 好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等 待操作者输入下一条中文信息或进行其它操作。

③键盘式其它型杨码汉字输入法

采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入其它型杨码 字符的各个字符键、用于选择中文信息的各个阿拉伯数字字符的数字键、翻页键、退格键和 确定键,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与 其硬件相适应的中文操作系统和键盘式其它型杨码汉字输入系统。

用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好输入中 文信息的位置后,再进入键盘式其它型杨码汉字输入系统,此时,屏幕上显示出杨码汉字输 入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序逐一地用手指 敲击键盘上相对应的字符键,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示 出与输入字符或字符串相对应的具有同杨码和联想关系的中文信息及其选择码;当敲击完要 输入的中文信息相对应的的全部杨码及其选择码字符键后,此时,系统就会自动地将要输入 的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显 示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入 下一条中文信息或进行其它操作。

(2)用鼠标输入中文信息

采用此法的中文信息处理设备中,其输入设备或装置至少要配备有通用的鼠标设备或装 置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬 件相适应的中文操作系统和鼠标式杨码汉字输入系统。

用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好要输入 中文信息的位置后,再进入鼠标式杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法 窗口开始状态时的界面;然后用手操作鼠标设备或装置,按照要输入的中文信息杨码字符的 前后顺序逐一地去点击杨码汉字输入法窗口界面内的与之相对应的信息提示处,或按照要输 入的中文信息杨码字符的前后顺序逐一地去点击与要输入的中文信息杨码字符相对应的字 符按钮,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示与点击过信息具有同 杨码和联想关系的信息;当点击到与要输入的中文信息相符的信息后,或当点击完与要输入 的中文信息的杨码及其选择码相对应的全部字符后,系统就会自动地将要输入的中文信息输 入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时 屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息 或进行其它操作;或者,当点击到与要输入的中文信息相符的信息后,如果显示屏上不再显 示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理 设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示 出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作; 如果显示屏上杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则点击 一下杨码汉字输入法窗口界面内的确定处后,系统就会自动地将要输入的中文信息输入到中 文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上 又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行 其它操作。

(3)用触摸法输入中文信息

采用此法的中文信息处理设备中,其输入和输出设备或装置至少要配备有通用的触摸屏 设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和触摸式杨码汉字 输入系统。

用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好要输入 中文信息的位置后,再进入触摸式杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法 窗口开始状态时的界面;然后用手或笔或其它器物按照要输入的中文信息字符的前后顺序逐 一地触摸杨码汉字输入法窗口界面内的与之相对应的信息提示处,这时,显示屏上的杨码汉 字输入法窗口界面内也随之逐屏显示与触摸过的信息具有同杨码和联想关系的信息;当触摸 到与要输入的中文信息相符的信息后,如果显示屏上不再显示出其它中文信息及其选择码, 则系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息 文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态 时的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上杨码汉字输入法窗 口界面内还在继续显示出其它中文信息及其选择码,则触摸一下杨码汉字输入法窗口界面内 的确定处后,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输 入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗 口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。

(4)用书写法输入中文信息

采用此法的中文信息处理设备中,其输入设备或装置至少要配备有通用的书写笔和书写 板设备或装置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配 备有与其硬件相适应的中文操作系统和书写式杨码汉字输入系统。

用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好要输入 中文信息的位置后,再进入书写式杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法 窗口开始状态时的界面;然后用书写笔将要输入的中文信息杨码字符按照前后顺序逐一地书 写到书写板上,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示出与输入过的 字符或字符串相对应的具有同杨码和联想关系的信息;当书写完要输入中文信息杨码及其选 择码的全部字符后,此时,如果显示屏上不再显示出其它中文信息及其选择码,则系统就会 自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息的文本中所 确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界 面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上杨码汉字输入法窗口界面 内还在继续显示出其它中文信息及其选择码,则在书写板上写上确定符后,系统就会自动地 将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息的文本中所确定好 的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待 操作者输入下条中文信息或进行其它操作。

(5)用语音输入中文信息

采用此法的中文信息处理设备中,其输入设备或装置至少要配备有通用的语音输入设备 或装置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与 其硬件相适应的中文操作系统和语音式杨码汉字输入系统。

用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好要输入 中文信息的位置后,再进入语音式杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法 窗口开始状态时的界面;然后用语音输入设备或装置将要输入的中文信息杨码字符以其语音 的形式按照前后顺序逐一地通过语音输入设备或装置送入到中文信息处理设备中,这时,显 示屏上的杨码汉字输入法窗口界面内也随之逐屏地显示出与输入过的字符或字符串相对应 的具有同杨码和联想关系的信息;当输入完要输入中文信息杨码及其选择码的全部字符后, 此时,如果显示屏上杨码汉字输入法窗口界面内不再显示出其它中文信息及其选择码,则系 统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本 中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的 界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上的杨码汉字输入法窗口 界面内还在继续显示出其它中文信息及其选择码,则输入确定符的读音后,系统就会自动地 将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的 位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操 作者输入下条中文信息或进行其它操作。

5.容许各类输入法共存

在上述各类杨码汉字输入法的各个版本的实际应用中,本发明能够让它们分别在各个中 文信息处理设备中单独存在和应用,也能够让它们之中的几类或全部同时共存于同一个中文 信息处理设备中进行分别提取或同时提取和应用,还能够让它们之中的之一或几种或全部与 其它非杨码汉字输入法中的一种或几种同时共存于同一个中文信息处理设备中进行分别提 取或同时提取和应用。

6.杨码汉字输入法窗口界面

本发明中的杨码汉字输入法窗口界面的形式分两类:一类是各种Windows中文信息操作 系统中所提供的输入法生成器所生成的杨码汉字输入法窗口界面形式;另一类是本发明中自 创的一类杨码汉字输入法窗口界面形式,这类杨码汉字输入法窗口界面形式至少具有如下设 置:

(1)该窗口界面内设置一个编辑框,用来显示和编辑已输入的中文信息杨码和选择码 (含输入法窗口界面内的中文信息提示栏翻页码)的字符或字符串;

(2)该窗口界面内设置一个中文信息提示栏,用来显示与编辑框中的字符或字符串相对 应的具有同杨码或联想关系的中文信息;

(3)该窗口界面内,在中文信息提示栏内的每条中文信息的前端都设置一个用来选择该 中文信息的选择码提示符;

(4)该窗口界面内,在中文信息提示栏内的每条中文信息上面都设置一个用来选择该中 文信息或选择该中文信息选择码提示符的不可见按钮;

(5)该窗口界面内设置有翻页符,并且,在翻页符上面设置有不可见按钮,用来翻页中 文信息提示栏;

(6)该窗口界面内设置一个确定处,并且,在此确定处具有一个不可见按钮,用来确定 已选定的中文信息;

(7)该窗口界面内设置一个窗口界面的关闭按钮,用以关闭该窗口界面。

五、杨码汉字检索法

1.定义杨码序排列

本发明所指的杨码序排列,是指汉字的单字、词、词组、短语和语句以及非汉字字符和 图形等信息的条目是按照其杨码字符和字符串的自然序列排列。

2.定义杨码字典

本发明所指的杨码字典,是指字典中的目录、索引、检字表、正文等其全部或其部分条 目是依照杨码序排列的字典。

3.定义杨码词典

本发明所指的杨码词典,是指词(辞)典中的目录、索引、检字表、正文等其全部或其 部分条目是依照杨码序排列的词(辞)典。

4.定义杨码信息记录

本发明所指的杨码信息记录,是指信息记录中的目录、索引、检字表、正文等其全部或 其部分条目是依照杨码序排列的信息记录。

5.定义信息条目字头

本发明所指信息条目字头,是指本发明中的杨码字典、杨码词典或其它杨码信息记录中 的目录、索引、检字表、正文等信息记录条目中的每条信息条目的第一个汉字。

6.定义杨码汉字检索法

本发明所指的杨码汉字检索法,是指按照要检索的信息条目字头的杨码去检索杨码字典 或杨码词典或杨码信息记录中的与该信息条目字头杨码相关的信息的方法。

7.检索杨码信息条目的方法及其步骤

用杨码去检索杨码字典或杨码词典或杨码信息记录中的依据杨码序排列的信息条目的 方法和步骤很简单:按照要检索的信息条目字头的杨码,直接从杨码字典或杨码词典或杨码 信息记录中按照杨码序查该信息条目字头的杨码,到了该信息条目字头的杨码后,在相 同信息条目字头杨码的信息中再该信息条目;或者,按照要检索信息条目字头的杨码或要 检索信息条目的杨码,先从杨码与信息正文页码的对照表中查到该杨码所处的信息正文中的 页码,再按照信息正文中的页码查该信息条目。

六、中文信息排序规则

1.定义重码

在同一汉字系统的同版本汉字输入法或汉字检索法中,当中文信息条目之间具有完全相 同的杨码时,本发明就称这些中文信息条目具有重码。

2.定义选择码

当中文信息条目具有重码时,为了使它们各自具有一个唯一只代表自己而又能用来区别 其它同杨码中文信息条目的代码,本发明采用给它们各自的杨码字符之后增加一个互不相同 的字符或字符串,用来区分它们。这个用来区分它们的字符或字符串,就称为它们各自的选 择码。将它们各自的杨码字符与其选择码字符按序排列后所构成的新字符串,就是唯一只代 表它们各自的代码。

3.在杨码汉字输入法和杨码汉字检索法中,其信息条目的排序规则有所不同,现分述 如下:

(1)杨码汉字输入法中的信息条目排序规则

①单个汉字的排序规则:

a在简体汉字系统或繁体汉字系统中的同版本杨码汉字输入法中,对于不同杨码的单 个汉字是按照各个汉字杨码字符的自然序列升序排序,对于同杨码的单个汉字是按照汉字的 使用频度(指该汉字与其同杨码汉字比较,在日常使用中所出现的频率,以下同)排序,使 用频度高者排在前面,使用频度低者排在后面;

b在简繁体汉字共存系统中的同版本杨码汉字输入法的中,对于不同杨码的单个汉字 是按照各个汉字杨码字符的自然序列升序排序,对于同杨码的单个汉字是先按照汉字的使用 频度排序好简体汉字后,再接着按照汉字的使用频度分别排序好未排到的同杨码的繁体汉字 和异体汉字,而且,在同杨码的简体汉字中,使用频度高者排在前面,使用频度低者排在后 面,同样,在同杨码的繁体汉字和异体汉字中,分别将使用频度高者排在前面,使用频度低 者排在后面。

②两个或两个以上汉字的词、词组、短语和语句的排序规则:

a同杨码的两个或两字以上汉字的词、词组、短语和语句在同版本杨码汉字输入法中 均排在同杨码的单个汉字(除容错码单个汉字外)之后;

b同杨码的两个或两个以上汉字的词、词组、短语和语句之间的排序是按照其汉字个 数的多少进行排序,即字数少的词、词组、短语和语句排在前面,字数多的词、词组、短语 和语句排在后面。

c不同杨码的两个或两个以上汉字的词、词组、短语和语句的排序是按照其杨码字符 的自然序列升序排序。

③非汉字字符和图形的排序规则:

非汉字字符和图形在各个版本中的排序规则,均与同杨码汉字的排序规则相同,即非汉 字字符和图形在各个版本中均视同汉字的单字、词、词组、短语或语句来处理。

④容错码汉字的排序规则:

a在同版本中,依据容错码规则编码和取码的汉字,均排在依据标准码规则编码和取 码的同杨码汉字的单字、词、词组、短语和语句之后;

b在同版本中,依据容错码规则编码和取码的同杨码汉字之间,使用频度高者排在前 面,使用频度低者排在后面;

c在同版本中,依据容错码规则编码和取码的同杨码两个或两个以上汉字的词、词组、 短语和语句均排在其同容错码单个汉字之后,而它们之间则是按照其汉字个数的多少进行排 序,即字数少的词、词组、短语和语句排在前面,字数多的词、词组、短语和语句排在后面。

(2)杨码汉字检索法中的中文信息排序规则

杨码汉字检索法中的中文信息排序是指中文信息在依据杨码序排列的字典、词(辞)典 或其它信息记录中的排序,其排序规则如下:

①字头及其信息的排序规则:

在以杨码序排列的同版本中文信息中,对于不同杨码的字头及其信息是按照各个字头杨 码字符的自然序列升序排序,对于同杨码的字头及其信息先是分别按照字头的简体汉字,繁 体汉字,异体汉字的先后顺序排序后,再将简体汉字字头之间的同杨码字头及其信息或繁体 汉字字头之间的同杨码字头及其信息或异体汉字字头之间的同杨码字头及其信息分别按照 字头编码自然序列升序排序,同编码的单个汉字字头及其信息按照字头的使用频度排序,使 用频度高者排在前面,使用频度低者排在后面。

②两个或两个以上汉字的词、词组、短语和语句及其信息排序规则:

a两个或两个以上汉字的词、词组、短语和语句及其信息在同版本中均排在其字头信 息之后;

b字头相同的同杨码两个或两个以上汉字的词、词组、短语和语句及其信息之间的排 序是按照同杨码两个或两个以上汉字的词、词组、短语和语句汉字个数的多少进行排序,即 字数少的词、词组、短语和语句及其信息排在前面,字数多的词、词组、短语和语句及其信 息排在后面,字数相同时,按其最后一个汉字编码字符串的自然序列升序排序;

c字头相同的不同杨码两个或两个以上汉字的词、词组、短语和语句及其信息之间的 排序是按照不同杨码两个或两个以上汉字的词、词组、短语和语句杨码字符串的自然序列升 序排序。

③非汉字字符和图形的排序规则:

非汉字字符和图形在各个版本中的排序规则,均与同杨码汉字的排序规则相同,即非汉 字字符和图形在各个版本中均视同汉字的单字、词、词组、短语或语句来处理。

④容错码汉字的排序规则:

a 在同版本中,依据容错码规则编码和取码的字头,均排在与其同杨码且依据标准码 规则编码和取码的字头汉字的单字、词、词组、短语和语句及其信息之后,并在该容错码汉 字字头旁边标注上其标准码;

b 在同版本中,依据容错码规则编码和取码的同杨码汉字字头及其信息之间的排序是 按照它们字头编码字符的自然序列升序排序;同编码的容错码汉字字头是按照其使用频度排 序,使用频度高者及其信息排在前面,使用频度低者及其信息排在后面。

七、非汉字字符和图形

1.定义非汉字字符和图形

除汉字字符以外的其它字符和图形在本发明中均被称之为非汉字字符和图形。

2.对非汉字字符和图形的处理

(1)如果非汉字字符或图形的字节是以单字节或双字节形式存在的,则本发明就把它们 分别视同单个英文字母或单个汉字来处理;

(2)如果它们是以两个以上(不含两个)的多字节形式存在的,则本发明就把它们分别 视同两个或两个以上的汉字词、词组、短语或语句来处理。

八、造词功能

本发明为了方便用户和提高中文信息的输入速度,在各个版本的杨码汉字输入法中均设 置有用户造词功能系统。为了使杨码汉字输入法中具有造词功能,本发明在该输入法系统中 设置有:

1.用户词库

用户词库是用以贮存用户和管理者自造的词、词组、短语、语句、非汉字字符和图形信 息的词库,这样,用户在输入中文信息的过程中,就可以随时从用户词库中提取有关的信息 输入到要输入的信息文本中,也便于管理者用来管理和维护词库中的的信息。

在本发明中,用户词库以下列两种形式之一或两种形式的混合存在于杨码汉字输入法系 统中:

(1)用户自造的信息是单独贮存在用户专用的词库中;

(2)用户自造的信息是与本发明中已有的中文信息库共存在同一个或同一组词库中。

2.造词功能软件

本发明的用户造词功能软件以下列三种形式之一或其混合存在:

(1)利用已配备的中文信息处理系统中的造词功能软件;

(2)杨码汉字输入法系统中自带的用户手工造词功能软件;

(3)杨码汉字输入法系统中自带的自动造词功能软件。

九、本发明具有以下优缺点:

1.优点:

(1)规范

本发明使用的汉字部件(字元)和笔顺规则均符合国家语言文字规范。

(2)规则简单

本发明按照笔顺和优先取大的规则视拆汉字,按照字元代码及其视拆顺序进行编码和取 码。

(3)字元分布规律强

本发明根据字形的宏观结构,对字元进行归类,使字元有规律地分布在五类基本笔画共 九大区域的50(或51)组内,之间互为独立性强,易区分,不混淆,不模糊。

(4)编码连续,思维连贯

本发明按照书写习惯顺序对单字、词、词组、短语、语句连续编码,完全符合常人书写 汉字的习惯,遇字知码,思维连贯,能够连续输入汉字和直接检索汉字。

(5)适应性强

①不受语言影响

本发明除语音式杨码汉字输入法使用十多个字符语音外,其余的杨码汉字输入法和汉字 检索法均不受使用者的语音影响,即使使用语音式杨码汉字输入法,因为只用十多个字符语 音就可以输入中文信息,所以,对于语音水平差的人来说,也容易实现;

②不受设备影响

本发明中使用的中文信息处理设备均是目前通用的常规设备,对使用的设备和装置无特 殊要求;

③.不受汉字系统影响

本发明在简体汉字系统、繁体汉字系统、简繁体汉字共存系统中,中文信息编码规则一 致,而且,本发明中的汉字输入法和汉字检索法均能在各个汉字系统中实现;

④不受中文操作系统影响

本发明能够适应各个中文操作系统,能够中西文兼容输入,能够与目前已广泛应用的各 种汉字输入法共存,并可以随时切换,使用非常方便。只要在各个中文信息处理设备中配备 好与其相适应的中文操作系统和杨码汉字输入法系统,均能实现用本发明中的一种或几种杨 码汉字输入法来输入中文信息;

⑤不受汉字字符集影响

本发明适应各种汉字字符集,在各种汉字字符集下,中文信息编码规则一致;

⑥不受专业水平影响

不论是专业操作人员还是非专业操作人员,不论操作人员的语文水平和普通话水平是高 还是低,均能自由地应用本发明中的杨码汉字输入法来输入汉字和应用本发明中的杨码汉字 检索法来检索汉字;

⑦具有可扩张性

a本发明根据用户的需要,可以“定做”杨码汉字输入法,即采用变换杨码汉字输入 法中的编码字符的方法,以满足用户个性化的用键习惯和要求,用自己想用的输入键来输入 中文信息;

b对一些专用词语,用户可以按其缩写形式编码输入;

c对一些保密用词语,用户可以用其密码形式编码输入;

d对一些用户自己的常用词语,用户可以采用自造词语的方式将其编码再取码后贮存 在用户词库中,以便以后随时可以提取和输入。

(6)用键少

①在键盘式数字型杨码汉字输入法中输入键加翻页键加选择键只用十个数字键;

②在键盘式字母型杨码汉字输入法中,比通用的拼音汉字输入法和通用的五笔字型汉 字输入法均至少要少用16个键。

(7)击键次数少

本发明中,单字,词,词组,短语,语句可连续输入;单个汉字一般只要击2至5次键 即可输入;按汉字的单字、词、词组、短语、语句联想输入统计,一般平均每个字只要击2 次键即可输入。

(8)易数码化

因本发明中数字型杨码汉字输入法中能用阿拉伯数字直接对中文信息进行编码,所以, 本发明能用阿拉伯数字键来输入中文信息,能用书写阿拉伯数字的形式来输入中文信息,能 用输入阿拉伯数字的语音形式来输入中文信息,能直接用数码形式传输中文信息;因本发明 中能用阿拉伯数字对字典、词(辞)典和其它信息记录中的条目进行排序,所以,本发明能 直接用阿拉伯数字来检索杨码序排列的字典、词(辞)典和其它信息记录中的条目。

(9)容错性强

本发明支持笔顺容错,支持笔画笔形容错,支持视拆容错,支持自定义容错,从而为用 户提供了汉字冗余的输入路径。

(10)合理的重码

本发明中中文信息重码率比目前广泛使用的拼音汉字输入法重码率低。如果在本发明中 是采用国标GB2312-80汉字字符集中的6763个汉字作为杨码汉字输入法中的用字,则其中 绝大部分重码汉字不超过10个,即重码的汉字不用翻页就能选择到。

(11)易实现书写输入

本发明在书写式杨码汉字输入法中,只要书写10个阿拉伯数字字符和用于代表退格键、 确定键等几个简单的字符,就可以输入信息、选择信息和确定其输入的信息。

(12)易实现语音输入

本发明在语音式杨码汉字输入法中,只要输入10个阿拉伯数字字符和用于代表退格键、 确定键等几个简单的字符的语音,就可以输入信息、选择信息和确定其输入的信息;

(13)易实现非汉字字符和图形输入

本发明能将非汉字字符和图形以汉字杨码形式输入到要输入的文本中,这样极大地方便 了非汉字字符和图形输入,也极大地有利于文本的编辑。

(14)易实现用户自造词输入

本发明中具有用户自造词功能系统和用户自造词库,可以实现用户自造词输入,极大地 提高了用户的输入中文信息的速度。

(15)兼容性好

①本发明保持了汉字传统部首的精华,并且按照汉字的常规笔顺规则对汉语信息进行 编码,所以,本发明与已有的中文知识和习惯兼容性好;

②本发明输入法窗口界面保持或类似于传统的Windows中文输入法窗口界面,其输入 信息的方式和步骤也类似于传统的中文输入法,所以,本发明与已有的中文输入法兼容性好, 这样,既有利于操作者学习,也利于操作者掌握和应用它。

综上所述,本发明具有易学、易记、简单、快捷和方便各类人员使用的特点。

2.缺点:

本发明虽然具有以上的优点,但还存在有以下不足之处:

(1)存在有重码

在本发明中,有些汉字的单字、词、词组、短语或语句还存在有重码,而且,其中的单 个汉字和双汉字词的重码率还较高,在输入中文信息的过程中,要输入具有重码的汉字的单 字、词、词组、短语或语句,必须要经过一次选择过程才能输入该汉字的单字、词、词组、 短语或语句,这样,既降低了输入速度,也增加了劳动强度。

(2)字元较多

在本发明中,字元还较多,为了记住字元和字元的代码,还存在有一定的记忆量。

(3)词库量大

在本发明中,为了提高输入中文信息的速度,减少击键次数,降低劳动强度,在词库容 量许可的情况下,本发明采用了增加词语量的方法来解决,特别是要增加三个汉字和三个汉 字以上的常用词语库存量,因为,随着词语条目字数的增加,词语出现的重码率就会大大地 降低,这就有利于对词语的选择和输入。但是,在采用增加词语量的同时,又会遇到下列两 个难题:

①本发明的汉字输入法如果是用目前广泛使用的Windows输入法生成器生成的,则词 库容量会受到已存在的Windows词库容量大小的约束;

②本发明的汉字输入法如果不是用目前广泛使用的Windows输入法生成器生成的,而 是由本发明中的软件系统所生成,则词库容量可以增加到千倍以上,但是,如果还是采用一 个词库或两个词库来贮存数千万条词语,则随着这词语量的增大,反之又会影响到输入中文 信息的速度,因此,这是一对矛盾。

十、克服缺点的措施

为了减小以上各种缺点对杨码汉字输入法的影响,本发明采取以下措施:

1.减小重码影响的措施

(1)本发明中对重码的汉字的单字、词、词组、短语或词句之间是按照其使用频度排序 的,使用频度高者排在前面,使用频度低者排在后面,以达到频度高的汉字的单字、词、词 组、短语或词句先见易选目的;

(2)本发明中采用尽量扩大常用词语库存量,特别是增加三字和三字以上的词、词组、 短语和语句的库存量的方法,以达到更多地使用多字词来输入中文信息目的,以至减少汉字 单字及其两字词重码多的影响;

(3)本发明中采用造词功能软件和用户词库系统,以及尽量扩大用户自用词贮存量的方 法,以达到减少操作者对重码字词的选择,减少操作者击键次数和降低操作者劳动强度的目 的。

2.减小字元影响的措施

本发明中字元的排序虽具有很强的规律性,但对于初学者来说,要到此规律和记住字 元及其代码,还需要学习。为了帮助用户学习和记住本发明中的字元及其代码,本发明中创 造了以下的字元代码表和字元代码歌,分别列于以下:

(1)字元代码表

表7  简体汉字系统中的字元代码表

表8  繁体汉字系统中的字元代码表

 5  6  7  8  9   乙*   扌   口   人八亻   氵   馬   尸   耳   日曰   夕夂   广疒   弓   土士   目   金   忄   女   艹   虫   舟   火   糹   木         宀

表9  简繁体汉字共存系统中的字元代码表

(2)字元代码歌

简体汉字系统中的字元代码歌

一王酉石车,扌耳土艹木;

二田山贝罒,口日目虫;

三月鱼犭饣,人夕钅舟:

四立羊米衤,氵广忄火宀;

五尸弓女纟,编码笔顺;

止爫门马,杨码检字妙。

繁体汉字系统中的字元代码歌

一王酉石車,扌耳土艹木;

二田山貝罒,口日目虫;

三月魚犭飠,人夕金舟;

四立羊米衤,氵广忄火宀;

五尸弓女糹,言码另外;

止爫門馬,杨码检字妙。

3.减小词库量影响的措施

在本发明中,为了提高输入中文信息的速度,减少击键次数,降低劳动强度,必须增加 词库量。而单个词库的词库量过大反过来又会降低输入词语速度。为了解决单个词库的词库 量过大反过来又会降低输入词语速度这一对矛盾,本发明中采取增加词库数量的方法,即将 一个特大的词库分成若干个小词库,例如,将一个特大的数字型杨码信息词库按照其中文信 息条目数字型杨码的第一个字符,分成9个数字型杨码信息小词库,然后,再通过计算机软 件由计算机按照要输入的中文信息数字型杨码的第一个字符,选择其中与中文信息数字型杨 码的第一个字符相对应的数字型杨码信息小词库,这就将一个特大的数字型杨码信息词库转 换成一个数字型杨码信息小词库来为操作者提供有关的中文信息,这样做,既增加了信息的 词库容量,又不会因词库容量的增加而影响到操作者输入中文信息的速度。

具体实施方式    实施例之一

本例是用Windows95中文版提供的输入法生成器生成本发明中一种键盘式字母型杨码输 入法(版本HO54),其步骤如下:

1.确定汉字系统

目前国内外使用最广泛的是简体汉字系统,所以,本实施例中选用简体汉字系统作为本 杨码汉字输入法版本HO54的汉字系统。

2.确定输入键

本杨码汉字输入法决定使用通用英文键盘字母键来输入其杨码字符,因此,在创建输入 法前,先要确定好使用哪几个字母键来输入杨码字符,从而才能确定本输入法杨码所使用的 字符。根据人体工程学原理,按照人们的动手习惯,绝大多数人使用右手的食指、中指和无 名指这三只手指操作键盘键最方便和最灵活,而且,再根据通用英文键盘上键的分布规律和 右手操作英文字母键的习惯,所以,决定在本输入法中采用英文字母键h、n、m、j、k、l、 u、i、o作为杨码字符输入键。

3.字元代码

根据本输入法中所采用的杨码字符输入键是英文字母键h、n、m、j、k、l、u、i、o这 九个键,这也就确定了本输入法中的字元代码所用的字符是h、n、m、j、k、l、u、i、o这 九个字符,按照右手击键习惯,本实施例确定本输入法中的字元与其代码对照表如表4所示。

4.创建输入法

(1)编辑中文信息库

按照本发明的编码和取码规则,用已经确定了的字元代码对汉字的单字、词、词组、短 语和语句进行编码和取码,编辑中文信息库,确定本输入法中所用的中文信息。

(2)编辑码表源文件

按照Windows95中文版所提供的输入法生成器中的方法,编辑本输入法码表源文件如下:

[Description]

ame=杨码

MaxCodes=9

MaxElement=2

UsedCodes=hijklmnou

WildChar=y

umRules=5

[Rule]

ca6=p11+p12+p13+p14+p21+p31+p41+p51+p61

ce2=p11+p12+p13+p14+p21

ce3=p11+p12+p13+p14+p21+p31

ce4=p11+p12+p13+p14+p21+p31+p41

ce5=p11+p12+p13+p14+p21+p31+p41+p51

[Text]

一h

二hh

一直hh

中un

口岸un

口齿un

口内un

中专unh

中式unh

中医unh

中班unh

中毒unh

中转unh

中型unh

中亚unh

中雨unh

中下unh

中欧unh

中原unh

员uni

呗uni

中华uni

中途uni

中介uni

中外uni

中盘uni

中等uni

员工unih

中介人unii

中外合作uniii

中外合资uniij

中外合资企业uniijin

中华人民共和国uniiklm

中华全国工商联合会uniinhj

中华全国总工会uniinjh

中华全国妇女联合会uniinkk

噪音uuuuj

噪声uuuul

目瞪口呆uuuuu

(3)创建杨码输入法版本HO54

按照Windows95中文版所提供的输入法生成器中所规定的程序创建杨码输入法版本 HO54。

5.用杨码输入法版本HO54输入中文信息

(1)打开要输入中文信息的文本编辑窗口(如写字板),使之处于活动状态,并且在其 中定位好要输入中文信息光标所在位置;

(2)进入杨码输入法版本HO54

进入杨码输入法版本HO54有下列两种途径:

①使用键盘时,按Ctrl+Shift键在英文或各种中文输入法之间进行切换,直到切换 到杨码输入法版本HO54,就进入了杨码输入法版本HO54;

②使用鼠标器时,只需单击任务栏上的键盘语言指示器,在显示出可选的输入法名称 中,单击杨码输入法版本HO54,就进入了杨码输入法版本HO54。

(3)输入中文信息的三个例子

例一、输入汉字“中”字

①视拆汉字“中”字,得到汉字“中”字的两个字元“口”和“丨”及其代码分别是 u和n;

②按照汉字的编码和取码规则,用汉字“中”字的字元“口”的代码u和字元“丨” 的代码n对汉字“中”字进行编码和取码,得到汉字“中”字的编码和杨码均为un;

③按照汉字“中”字的杨码字符un分别按序敲击键盘上u键和n键各一下,汉字“中” 的杨码所有字符un就被输入中文信息处理设备中,此时,屏幕上的外码输入窗口内也随之 显示出其输入的所有字符un,同时屏幕上的候选窗口内也随之显示出与输入字符串un所构 成杨码的所有同杨码和具有联想关系的所有中文信息及其选择码,等待操作者选择:

1:中

2:口岸

3:口齿

4:口内

5:中专h

6:中式h

7:中医h

8:中班h

9:中毒h

0:中转h

④敲击键盘上的数字键1或敲击键盘上的空格键一下,此时,汉字“中”字就被选中, 并且被输入到要输入中文信息的文本编辑窗口(如写字板)中的光标处,同时,光标后移一 格,屏幕上的候选窗口内也随之显示出与输入汉字具有联想关系的所有中文信息及其选择 码,等待操作者选择:

1:中专

2:中式

3:中医

4:中班

5:中毒

6:中转

7:中型

8:中亚

9:中雨

0:中下

⑤因为操作者对屏幕上候选窗口内显示出来的及其经翻页后所显示出来的所有提示 中文信息都不需要,所以操作者可以接着输入下一条想要输入的中文信息杨码字符或者进行 其它的操作。

例二、输入词语“中华”

①按照汉字的单字、词、词组、短语和语句的编码和取码规则,得到词语“中华”的 杨码uni;

②按照词语“中华”杨码字符uni,按序分别敲击键盘上u键、n键和i键各一下, 词语“中华”的杨码所有字符uni就被输入中文信息处理设备中,此时,屏幕上的外码输入 窗口内也随之显示出其输入的所有字符uni,同时屏幕上的候选窗口内也随之显示出与输入 字符串uni所构成杨码的所有同杨码和具有联想关系的中文信息及其选择码,等待操作者选 择:

1:员

2:呗

3:中华

4:中途

5:中介

6:中外

7:中盘

8:中等

9:员工h

0:中介人i

③敲击键盘上的数字键3一下,此时,词语“中华”就被选中,并且输入到要输入中 文信息的文本编辑窗口(如写字板)中的光标处,同时,光标也后移到词语“中华”之后, 屏幕上的候选窗口内也随之显示出与输入汉字具有联想关系的所有中文信息及其选择码,等 待操作者选择:

1:中华人民共和国

2:中华全国工商联合会

3:中华全国总工会

4:中华全国妇女联合会

5:中华民族

6:中华儿女

④因为操作者对屏幕上候选窗口内显示出来的所有中文提示信息都不需要,所以操作 者可以接着输入下一条想要输入的中文信息杨码字符或者进行其它的操作。

例三、输入词语“中华人民共和国”

①按照汉字的单字、词、词组、短语和语句的编码和取码规则,得到词语“中华人民 共和国”的杨码uniiklm;

②按照词语“中华人民共和国”杨码字符uniiklm按序分别敲击键盘上相对应的英文 字母键,当按序分别敲击键盘上u键、n键、i键、i键、k键各一下时,屏幕上的外码输 入窗口内随之显示出其输入的所有字符uniik,同时,屏幕上的候选窗口内也随之显示出与 输入字符串uniik有关的中文信息及其选择码,等待操作者选择:

1:中华人民共和国lm

③因为候选窗口内显示出来中文信息只有一条,所以操作者不必再输入词语“中华人 民共和国”的杨码uniiklm其后的字符lm,可以直接敲击键盘上的数字键1或敲击键盘上的 空格键一下,就会将词语“中华人民共和国”输入到要输入中文信息的文本编辑窗口(如写 字板)中的光标处,同时,光标后移到词语“中华人民共和国”之后,屏幕上的候选窗口内 随之消失,屏幕上的外码输入窗口内也随之显示出空白来,等待操作者输入下一条中文信息 或者进行其它的操作。

实施例之二

本例是用自创软件生成本发明中一种键盘式数字型杨码输入法(版本54),其步骤如下:

1.确定汉字系统

目前国内外使用最广泛的是简体汉字系统,所以,本实施例中选用简体汉字系统作为本 杨码汉字输入法版本54的汉字系统。

2.确定输入键

因本杨码汉字输入法是键盘式数字型杨码输入法,所以用通用的数字键盘上的数字键 1、2、3、4、5、6、7、8、9来作为杨码字符的输入键,用通用的数字键盘上数字 键1、2、3、4、5、6、7、8、9、0来作为中文信息提示符即选择码字符的输入键, 同时也用通用的数字键盘上数字键0来作为翻页符和空格符的输入键。

3.字元代码

本实施例确定本输入法中的字元与其代码对照表如表1所示。

4.创建输入法

(1)创建中文信息库

先确定本输入法中所用的中文信息,再按照本发明的编码和取码规则,用字元代码对汉 字的单字、词、词组、短语和语句进行编码和取码,然后编辑中文信息,并将本法中所用的 中文信息按其杨码第一字符进行分类,分别创建9个以杨码为主索引的中文信息库,同时, 再创建一个以杨码为主索引的用户中文信息库。

(2)创建本输入法窗口界面,编辑其子系统软件,使此窗口界面中具有如下设置和功能:

创建一个窗口,该窗口有一个边框,在边框上边线的下方设置一个标题栏,标题栏内的 标题是“请输入杨码”,在标题栏的左端设置一个位图和类似于Windows汉字输入法窗口内 下拉式菜单功能的下拉式菜,在标题栏的右端分别设置类似于Windows汉字输入法窗口内最 小化窗口按钮、最大化/恢复窗口按钮、关闭窗口按钮功能的三个按钮,在标题栏下方的右 边设置一个编辑框,用来显示和编辑已输入的杨码字符和选择码字符,在标题栏的下方左边 设置一个显示框,用来显示与编辑框中杨码字符所对应的首条中文信息,并且,在显示框的 上面设置一个不可见按钮,功能同确定键,在编辑框和显示框的下方设置一个类似于W indows汉字输入法窗口内提示栏功能的提示栏,在提示栏的左侧,自上而下地纵向设置有1、 2、3、4、5、6、7、8、9、0阿拉伯数字作为信息提示符,在提示符的右边分别设 置有信息提示处,在信息提示处的上面设置有不可见按钮,操作这些不可见按钮就能够操作 按钮下的中文信息或操作中文信息左边的提示符。

(3)创建中文信息库维护窗口界面,编辑其子系统软件,使之具有造词功能,查询功能 和维护中文信息数据库功能。

(4)创建帮助窗口界面,编辑其子系统软件,使之具有本输入法的帮助功能。

5.用杨码输入法版本54输入中文信息

(1)打开要输入中文信息的文本编辑窗口(如写字板),使之处于活动状态,并且在其 中定位好要输入中文信息光标所在位置;

(2)打开杨码输入法版本54窗口,进入杨码输入法版本54;

(3)输入中文信息“共产党”

①视拆词语“共产党”中的各个汉字,得到词语“共产党”中的各个汉字的 字元及其代码;

②按照汉字词语的编码和取码规则,用词语“共产党”中的各个汉字的字元的代 码对词语“共产党”进行编码和取码,得到词语“共产党”的杨码是722642;

③按照词语“共产党”杨码字符722642分别按序敲击数字键盘上7键、2键、2 键、6键、4键、2键、各一下,这时,词语“共产党”杨码所有字符722642就被输入 到窗口界面内的编辑框内,同时,在显示框内显示出词语“共产党”的中文信息,屏幕 上的信息提示栏内也随之显示出与词语“共产党”具有联想关系的部分中文信息及其选 择码,等待操作者选择或进行其它操作:

1:共产党要

2:共产党党员

3:共产党的

4:共产党总书记

5:共产党能够

6:共产党把

7:共产党是

8:共产党领导

9:

0:

④因为我们只想输入词语“共产党”,所以,不再选择提示栏内的其它中文信息, 此时,只要敲击一下确定键,就将词语“共产党”输入到要输入中文信息文本的光标所 在位置处,同时光标下移到词语“共产党”所在的位置之后,输入法窗口界面也恢复到 初始状态,等待操作者输入下一条中文信息或者进行其它操作。

实施例之三

本例是依据杨码序排列的杨码字典。在此字典中,字典字头的编码和杨码均是数字型的, 并且,字典中的正文字头、杨码与正文页码对照表(杨码索引)均是按照数字型杨码升序排 列,要检索此字典中的信息条目,直接按照信息条目字头的杨码,翻到正文的同杨码字头处, 再按要查的信息条目字头到该信息条目;或者,按照要检索的信息条目字头的杨码,先 从杨码与正文页码对照表(杨码索引)中查到该杨码所处的正文中的页码,再按照正文中 的页码查该信息条目。

以上的三个实施例只是说明了本发明中各种具体实施方案中的三个具体实施方案。必须 指出,本发明不仅仅限于上面已给出的实施方案,在实际应用中,发明人已经根据本发明的 构思,开发出了不脱离本发明实质的多种变型实施方案,可供用户选择和使用。

本文发布于:2023-03-19 16:56:41,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/73470.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号-17 站长QQ:729038198 网站地图