-
公开(公告)号:CN119513617A
公开(公告)日:2025-02-25
申请号:CN202411577003.1
申请日:2024-11-06
Applicant: 中国标准化研究院 , 国网江苏省电力有限公司 , 国网江苏省电力有限公司电力科学研究院
IPC: G06F18/22 , G06F40/30 , G06F40/284 , G06F40/211 , G06F18/241 , G06N3/0442
Abstract: 本申请公开了一种基于特征蒸馏的概念相似度计算方法和系统,包括:S1获取术语库中两条原始定义;S2对定义分词得到分词结果;S3根据分词结果中计算词汇第一向量,S4判断词汇是否为重要词汇,不为重要词汇的最终向量为第一向量,若是,计算重要词汇的加权向量记为第二向量,将重要词汇第一向量和第二向量相加得到重要词汇最终向量;S5计算定义句向量;计算重要词汇的加权向量包括:查找重要词汇在术语库中对应多个定义,执行S2‑S5计算重要词汇对应定义句向量,将重要词汇对应多条定义句子句向量和权重赋值的乘积相加,得到重要词汇加权向量;S6根据定义句向量计算的概念相似度。通过本申请,提高了语义相似度分析的准确性。
-
公开(公告)号:CN119494322A
公开(公告)日:2025-02-21
申请号:CN202411542249.5
申请日:2024-10-31
Applicant: 中国标准化研究院
IPC: G06F40/16 , G06F40/258 , G06F40/149 , G06F40/166
Abstract: 一种标准术语结构化抽取方法及装置,该方法通过设定处理策略对术语文件进行预处理,获得术语文件的抽取范围;将若干预设规则汇集,构建规则库;将抽取范围内的文本按照设定流程及判断顺序,进行遍历判断规则条件,直至适配规则库中的规则;按照适配规则对抽取范围内的文本进行处理,获得处理后的文本;根据适配规则映射获得相应处理策略;将处理后的文本按照相应处理策略进行解析处理,并构造xml标签进行嵌入,输出结构化术语和定义xml文件。本发明可以有助于提高术语编写的规范性、准确性,提高相关领域术语一致性和协调性,对于加强术语资源的统筹协调、整合、共享与保护,保证我国术语资源的健康、持续发展和长期有效利用具有重要意义。
-
公开(公告)号:CN111709228B
公开(公告)日:2023-11-21
申请号:CN202010576591.2
申请日:2020-06-22
Applicant: 中国标准化研究院
IPC: G06F40/232 , G06F40/242 , G06F40/284
-
公开(公告)号:CN111612340A
公开(公告)日:2020-09-01
申请号:CN202010437558.1
申请日:2020-05-21
Applicant: 中国标准化研究院
IPC: G06Q10/06 , G06F16/33 , G06F40/242 , G06Q30/06
Abstract: 本发明公开了基于大数据的网销商品检验抽样方法,该方法中针对某同类商品的情感得分计算步骤包括:B1)采集网络平台上属于该同类商品的网销商品链接及其对应的包括品牌数据、评论数据、销售量数据在内的数据信息;B2)通过基于评论分析词典的情感倾向分析方法,对步骤B1)采集的各网销商品链接的各条评论进行情感分析,计算得到各网销商品链接下各条评论的情感得分;B3)基于各网销商品链接下各条评论的情感得分,计算得到各网销商品链接的商品情感得分。本发明可以在网销商品各类复杂的情况下,尤其是总体商品总数不确定的情况下,即可获得相对适合的入样概率和抽样数量,使质量监控或抽检工作目标性更强,效率更高,更为科学合理。
-
公开(公告)号:CN113901180A
公开(公告)日:2022-01-07
申请号:CN202010576592.7
申请日:2020-06-22
Applicant: 中国标准化研究院
IPC: G06F16/332 , G06F16/33 , G06F16/36
Abstract: 本发明公开了一种基于元组模型的术语管理方法,其包括如下步骤:采用基于六元组的术语表示结构模型,对术语库中的术语逐一进行描述,以及基于术语库,建立术语定义信息中的词语到术语库中术语的第一映射索引结构的步骤;基于所述术语库,对新输入的术语信息进行检索和查重管理的步骤;基于所述术语库,对术语库中的术语及新增的术语进行协同管理的步骤。本发明一方面能有效的发现重复添加的术语,可有效解决术语录入和维护管理时存在的同名同义、不同名同义等不规范问题,另一方面可有效提升术语管理的效率,利于有效引用术语,并对术语的录入、编写和规范使用均提供有效地支撑。
-
公开(公告)号:CN111079415A
公开(公告)日:2020-04-28
申请号:CN201911101660.8
申请日:2019-11-12
Applicant: 中国标准化研究院
IPC: G06F40/232 , G06F40/284
Abstract: 本发明实施例公开了一种基于搭配冲突的中文自动查错方法,所述方法包括:扫描待查错中文句子,根据搭配检测规则检查句子中的词语的搭配,得到检查结果,根据检查结果标记错误的词语,输出错误的词语,实现自动查错。所述方法还包括根据给定搭配知识库制定搭配检测规则,所述搭配检测规则包括相似词串识别规则、语境搭配规则、搭配冲突规则和搭配强度规则。本发明实施例所述基于搭配冲突的中文自动查错方法,对中文文本中的搭配错误识别率高,能有效识别利用局部的上下文没有办法识别的错词和需要远距离搭配特征才能判断的错词。
-
公开(公告)号:CN111612340B
公开(公告)日:2023-10-17
申请号:CN202010437558.1
申请日:2020-05-21
Applicant: 中国标准化研究院
IPC: G06Q10/0639 , G06F16/33 , G06F40/242 , G06Q30/0601
Abstract: 本发明公开了基于大数据的网销商品检验抽样方法,该方法中针对某同类商品的情感得分计算步骤包括:B1)采集网络平台上属于该同类商品的网销商品链接及其对应的包括品牌数据、评论数据、销售量数据在内的数据信息;B2)通过基于评论分析词典的情感倾向分析方法,对步骤B1)采集的各网销商品链接的各条评论进行情感分析,计算得到各网销商品链接下各条评论的情感得分;B3)基于各网销商品链接下各条评论的情感得分,计算得到各网销商品链接的商品情感得分。本发明可以在网销商品各类复杂的情况下,尤其是总体商品总数不确定的情况下,即可获得相对适合的入样概率和抽样数量,使质量监控或抽检工作目标性更强,效率更高,更为科学合理。
-
公开(公告)号:CN111597315B
公开(公告)日:2024-06-04
申请号:CN202010404933.2
申请日:2020-05-13
Applicant: 中国标准化研究院
IPC: G06F16/332 , G06F16/338 , G06F16/35
Abstract: 本发明公开了一种基于多特征的术语检索方法,该方法包括如下步骤:建立术语的表示模型结构的步骤;基于术语的表示模型,对术语名称进行相似度计算得到术语名称相似度的步骤;基于术语的表示模型,对术语的定义及相关特征进行相似度计算得到术语相关特征相似度的步骤;融合术语名称相似度及术语相关特征相似度,计算得到术语综合相似度的步骤;融合术语名称相似度、术语相关特征相似度及术语综合相似度,进行多特征检索得到相似术语的步骤;对检索得到的相似术语,结合术语综合相似度和术语所属领域信息进行排序的步骤。该方法能有效发现检索出相关术语,并对相似术语集合进行合理排序,满足多种术语检索的应用要求,利于术语的编写和规范使用。
-
公开(公告)号:CN111612339A
公开(公告)日:2020-09-01
申请号:CN202010437544.X
申请日:2020-05-21
Applicant: 中国标准化研究院
IPC: G06Q10/06 , G06F16/33 , G06F40/242 , G06Q30/06
Abstract: 本发明公开了基于大数据的网销商品情感倾向分析方法,该方法中针对某同类商品的情感得分计算步骤包括:B1)采集网络平台上属于该同类商品的网销商品链接及其对应的包括品牌数据、评论数据在内的数据信息;B2)通过基于评论分析词典的情感倾向分析方法,对采集的各网销商品链接的各条评论进行情感分析,计算得到各网销商品链接下各条评论的情感得分;B3)基于各网销商品链接下各条评论的情感得分,计算得到各网销商品链接的商品情感得分;B4)结合得到的各网销商品链接的商品情感得分和品牌数据,计算该同类商品下各品牌的情感得分。本发明将用户的定性评论,转化为表示商品质量优劣的情感得分,可供客户选择时参考,更具有可区分性。
-
公开(公告)号:CN110991166A
公开(公告)日:2020-04-10
申请号:CN201911219533.8
申请日:2019-12-03
Applicant: 中国标准化研究院
IPC: G06F40/232 , G06F40/295
Abstract: 本发明公开了一种基于模式匹配的错别字识别方法,包括步骤:S1.根据语言的结构特征,定义错别字识别模式;S2.基于图存储结构建立错别字识别模式的索引;S3.通过错别字识别模式的索引对待查错文本进行自动查错和自动纠错。本发明方法通过定义错别字识别模式把语法限制和条件函数搭配融合进行错别字识别,能够有效针对违背局部或长距离语法约束条件的错误,具备很好的准确率;本发明系统通过程序实现错别字识别模式的定义和索引的建立以及利用错别字识别模式索引自动对待查错文本查错、纠错;基于图存储结构的灵活性建立索引结构实现对数据的广度优先搜索、深度优先搜索,利于构建完善的数据库(搭配库),继而提高错别字识别的准确度。
-
-
-
-
-
-
-
-
-