-
公开(公告)号:CN111915206A
公开(公告)日:2020-11-10
申请号:CN202010798949.6
申请日:2020-08-11
申请人: 成都市食品药品检验研究院 , 成都数之联科技有限公司
IPC分类号: G06Q10/06 , G06F16/215 , G06F16/242 , G06F16/2458 , G06F16/26 , G06K9/62
摘要: 本发明公开一种识别食品风险传导的方法,首先根据风险传导者品类,关联具有相同主成分的关联品类,然后根据所有关联品类的检测项目计算关联食品品类和组成成分之间的关联矩阵。最后基于得到的关联矩阵分析品类-检测项目风险,得到在不同风险系数下关联食品品类之间的风险传导关系图。本发明能够有效解决现有技术中无法有效量化关联食品风险和风险传导的问题;通过建立基于食品间成分的关联关系,实现了同源食品间风险传导的挖掘分析。有效保证了食品安全识别的精准度。
-
公开(公告)号:CN111680504B
公开(公告)日:2020-11-27
申请号:CN202010798144.1
申请日:2020-08-11
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 翁洋 , 李鑫 , 王竹 , 其他发明人请求不公开姓名
IPC分类号: G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/18
摘要: 本发明公开了法律信息抽取模型及方法及系统及装置及辅助系统,涉及自然语言处理领域,包括:定义裁判文书中需要标注的实体类型;标注选取的若干裁判文书中的实体类型;基于法律分词数据集和实体识别数据集得到训练集;建立裁判文书法律信息抽取模型,利用训练集训练裁判文书法律信息抽取模型;将法律信息待抽取的裁判文书输入训练后的裁判文书法律信息抽取模型,输出裁判文书中的法律信息抽取结果;裁判文书法律信息抽取模型结构包括:词嵌入层、共享‑私有信息抽取器、任务特有CRF层和任务判别器;本发明以公开的裁判文书为起点,最终实现裁判文书中相关重要法律信息要素的抽取。
-
公开(公告)号:CN111459973B
公开(公告)日:2020-10-23
申请号:CN202010548781.3
申请日:2020-06-16
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 王竹 , 李鑫 , 翁洋 , 其他发明人请求不公开姓名
IPC分类号: G06F16/242 , G06F16/2455 , G06Q50/18
摘要: 本发明公开了一种基于案情三元组信息的类案检索方法及系统:标注案情样本库中的案情样本得到标注样本库;将标注样本库输入模型进行训练得到三元组集合,三元组集合中的三元组包括案情实体和案情实体对应的要素;设置抽取案情的三元组评分模型;类案检索时,将待检索的案件的信息输入训练后的模型得到对应三元组集合;利用三元组评分模型对案情数据库中案情的三元组集合评分,将评分最高的一个或多个三元组集合对应的案情作为类案检索结果。本发明一种基于案情三元组信息的类案检索方法及系统,利用法律领域预训练语言模型和排序算法构造类案检索关键衡量标准,从法律专业的角度实现类案精准检索。
-
公开(公告)号:CN111444706A
公开(公告)日:2020-07-24
申请号:CN202010542635.X
申请日:2020-06-15
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 李鑫 , 王竹 , 翁洋 , 其他发明人请求不公开姓名
IPC分类号: G06F40/232 , G06F40/295 , G06F40/247 , G06Q50/18
摘要: 本发明公开了一种基于深度学习的裁判文书文本纠错方法,包括以下步骤:将裁判文书文本中错误检测分为命名实体检测和文本错误检测;进行命名实体检测时,定义专有名词,并检测裁判文书文本中的专有名词得到命名实体检测结果;进行文本错误检测时,利用文本错误模型检测裁判文书文本得到文本错误检测结果;根据关联词条处理文本错误检测结果得到纠错候选集;根据命名实体检测结果和纠错候选集进行纠错。本发明还公开了一种基于深度学习的裁判文书文本纠错系统。本发明对裁判文书全文做实体识别,进行进一步检测以避免上下文不一致,并且避免了传统方法中过纠错和纠错不足的问题。
-
公开(公告)号:CN113779976A
公开(公告)日:2021-12-10
申请号:CN202111132644.2
申请日:2021-09-27
申请人: 成都数之联科技有限公司
IPC分类号: G06F40/253 , G06F40/211 , G06F40/284
摘要: 本发明公开了裁判规则提取方法及系统及装置及介质,涉及自然语言处理信息抽取领域,包括:从若干个历史裁判文书中提取获得裁判因果关系提及;从所述裁判因果关系提及中提取获得裁判因果事件,基于所述裁判因果事件构建裁判因果网络;对所述裁判因果网络进行一般化处理,获得一般裁判规则网络;构建预测模型,将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,所述裁判规则提取模型的输入为裁判文书,输出为裁判规则;获得待处理裁判文书,将所述待处理裁判文书输入所述裁判规则提取模型,输出所述待处理裁判文书对应的裁判规则。本发明实现基于事件因果关系的裁判规则自动提取。
-
公开(公告)号:CN113254644A
公开(公告)日:2021-08-13
申请号:CN202110630284.2
申请日:2021-06-07
申请人: 成都数之联科技有限公司
发明人: 李雨桐 , 其他发明人请求不公开姓名
摘要: 本发明公开了模型训练方法及非投诉工单处理方法及系统及装置及介质,包括:获取历史数据,所述历史数据包括若干项A类数据和若干项B类数据;对与所述A类数据关联的B类数据进行标记为第一标记数据;对与所述A类数据未关联的B类数据进行标记为第二标记数据;对第一标记数据以及第二标记数据进行预处理,得到基础数据,并从所述基础数据中抽取特征数据,所述特征数据的增益大于阈值;利用所述特征数据建立分类模型并训练;通过本方法可以训练的分类模型能够获得可以获得B类数据转为A类数据的概率。
-
公开(公告)号:CN112699218A
公开(公告)日:2021-04-23
申请号:CN202011605780.4
申请日:2020-12-30
申请人: 成都数之联科技有限公司
发明人: 翁洋 , 李鑫 , 王竹 , 其他发明人请求不公开姓名
IPC分类号: G06F16/33 , G06F16/35 , G06F40/126 , G06F40/151 , G06F40/279 , G06F40/30
摘要: 本发明公开了模型建立方法及系统及段落标签获得方法及介质,涉及自然语言处理迁移学习领域,包括:从数据库中收集所有的裁判文书数据获得预训练数据;定义不同类型裁判文书的段落标签;标记不同类型的裁判文书的段落标签,得到训练数据;构建裁判文书结构化模型;预训练模型;利用训练数据训练预训练后的裁判文书结构化模型;调试训练后的裁判文书结构化模型,得到最终的裁判文书结构化模型;其中,裁判文书结构化模型的输入为裁判文书文本数据,且该输入裁判文书的段落添加有任务前缀,裁判文书结构化模型的输出为裁判文书的段落标签文本数据;通过本方法建立的模型在训练后可以对任意类型的裁判文书段落标签进行预测。
-
公开(公告)号:CN112651853A
公开(公告)日:2021-04-13
申请号:CN202011287899.1
申请日:2020-11-17
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 李鑫 , 王竹 , 翁洋 , 其他发明人请求不公开姓名
摘要: 本发明公开了一种基于裁判文书的论辩观点挖掘方法及系统,本发明的方法包括:分段裁判文书,得到原告诉称的段落内容和被告辩称的段落内容;分别将原告诉称的段落内容和被告辩称的段落内容分句;一一匹配原告诉称的分句内容与被告辩称的分句内容,判断原告诉称和被告辩称的两个分句内容是否能够组成辩论对。本发明借助计算机技术以及自然语言处理技术自动识别提取裁判文书中的争议焦点,利用机器学习算法提取裁判文书中的辩论对。
-
公开(公告)号:CN111680504A
公开(公告)日:2020-09-18
申请号:CN202010798144.1
申请日:2020-08-11
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 翁洋 , 李鑫 , 王竹 , 其他发明人请求不公开姓名
IPC分类号: G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/18
摘要: 本发明公开了法律信息抽取模型及方法及系统及装置及辅助系统,涉及自然语言处理领域,包括:定义裁判文书中需要标注的实体类型;标注选取的若干裁判文书中的实体类型;基于法律分词数据集和实体识别数据集得到训练集;建立裁判文书法律信息抽取模型,利用训练集训练裁判文书法律信息抽取模型;将法律信息待抽取的裁判文书输入训练后的裁判文书法律信息抽取模型,输出裁判文书中的法律信息抽取结果;裁判文书法律信息抽取模型结构包括:词嵌入层、共享-私有信息抽取器、任务特有CRF层和任务判别器;本发明以公开的裁判文书为起点,最终实现裁判文书中相关重要法律信息要素的抽取。
-
公开(公告)号:CN113779227B
公开(公告)日:2022-01-25
申请号:CN202111341769.6
申请日:2021-11-12
申请人: 成都数之联科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/186 , G06F40/30 , G06Q50/18
摘要: 本发明公开了案情事实抽取方法及系统及装置及介质,涉及人工智能领域,包括:获得第一训练集,构建第一分类模型,利用第一训练集训练第一分类模型获得触发词识别模型;利用第二训练集训练第一概率预测模型和第二概率预测模型获得论元起点预测模型;获得待处理裁判文书,将待处理裁判文书输入触发词识别模型,获得触发词识别结果;将待处理裁判文书输入论元起点预测模型模型,获得论元的起始位置;基于起始位置获得相应的论元字段;基于触发词识别结果和论元字段获得待处理裁判文书的案情事实,本方法能够实现在从裁判文书中自动抽取案情事实。
-
-
-
-
-
-
-
-
-