一种基于搭配冲突的中文自动查错方法

    公开(公告)号:CN111079415A

    公开(公告)日:2020-04-28

    申请号:CN201911101660.8

    申请日:2019-11-12

    Abstract: 本发明实施例公开了一种基于搭配冲突的中文自动查错方法,所述方法包括:扫描待查错中文句子,根据搭配检测规则检查句子中的词语的搭配,得到检查结果,根据检查结果标记错误的词语,输出错误的词语,实现自动查错。所述方法还包括根据给定搭配知识库制定搭配检测规则,所述搭配检测规则包括相似词串识别规则、语境搭配规则、搭配冲突规则和搭配强度规则。本发明实施例所述基于搭配冲突的中文自动查错方法,对中文文本中的搭配错误识别率高,能有效识别利用局部的上下文没有办法识别的错词和需要远距离搭配特征才能判断的错词。

    基于模式匹配的汉语错别字识别方法及系统

    公开(公告)号:CN110991166B

    公开(公告)日:2021-07-30

    申请号:CN201911219533.8

    申请日:2019-12-03

    Abstract: 本发明公开了一种基于模式匹配的错别字识别方法,包括步骤:S1.根据语言的结构特征,定义错别字识别模式;S2.基于图存储结构建立错别字识别模式的索引;S3.通过错别字识别模式的索引对待查错文本进行自动查错和自动纠错。本发明方法通过定义错别字识别模式把语法限制和条件函数搭配融合进行错别字识别,能够有效针对违背局部或长距离语法约束条件的错误,具备很好的准确率;本发明系统通过程序实现错别字识别模式的定义和索引的建立以及利用错别字识别模式索引自动对待查错文本查错、纠错;基于图存储结构的灵活性建立索引结构实现对数据的广度优先搜索、深度优先搜索,利于构建完善的数据库(搭配库),继而提高错别字识别的准确度。

    一种基于搭配冲突的中文自动查错方法

    公开(公告)号:CN111079415B

    公开(公告)日:2021-03-26

    申请号:CN201911101660.8

    申请日:2019-11-12

    Abstract: 本发明实施例公开了一种基于搭配冲突的中文自动查错方法,所述方法包括:扫描待查错中文句子,根据搭配检测规则检查句子中的词语的搭配,得到检查结果,根据检查结果标记错误的词语,输出错误的词语,实现自动查错。所述方法还包括根据给定搭配知识库制定搭配检测规则,所述搭配检测规则包括相似词串识别规则、语境搭配规则、搭配冲突规则和搭配强度规则。本发明实施例所述基于搭配冲突的中文自动查错方法,对中文文本中的搭配错误识别率高,能有效识别利用局部的上下文没有办法识别的错词和需要远距离搭配特征才能判断的错词。

    基于模式匹配的汉语错别字识别方法及系统

    公开(公告)号:CN110991166A

    公开(公告)日:2020-04-10

    申请号:CN201911219533.8

    申请日:2019-12-03

    Abstract: 本发明公开了一种基于模式匹配的错别字识别方法,包括步骤:S1.根据语言的结构特征,定义错别字识别模式;S2.基于图存储结构建立错别字识别模式的索引;S3.通过错别字识别模式的索引对待查错文本进行自动查错和自动纠错。本发明方法通过定义错别字识别模式把语法限制和条件函数搭配融合进行错别字识别,能够有效针对违背局部或长距离语法约束条件的错误,具备很好的准确率;本发明系统通过程序实现错别字识别模式的定义和索引的建立以及利用错别字识别模式索引自动对待查错文本查错、纠错;基于图存储结构的灵活性建立索引结构实现对数据的广度优先搜索、深度优先搜索,利于构建完善的数据库(搭配库),继而提高错别字识别的准确度。

Patent Agency Ranking