-
公开(公告)号:CN113254644B
公开(公告)日:2021-09-17
申请号:CN202110630284.2
申请日:2021-06-07
申请人: 成都数之联科技有限公司
发明人: 李雨桐 , 其他发明人请求不公开姓名
摘要: 本发明公开了模型训练方法及非投诉工单处理方法及系统及装置及介质,包括:获取历史数据,所述历史数据包括若干项A类数据和若干项B类数据;对与所述A类数据关联的B类数据进行标记为第一标记数据;对与所述A类数据未关联的B类数据进行标记为第二标记数据;对第一标记数据以及第二标记数据进行预处理,得到基础数据,并从所述基础数据中抽取特征数据,所述特征数据的增益大于阈值;利用所述特征数据建立分类模型并训练;通过本方法可以训练的分类模型能够获得可以获得B类数据转为A类数据的概率。
-
公开(公告)号:CN113468323A
公开(公告)日:2021-10-01
申请号:CN202110608911.2
申请日:2021-06-01
申请人: 成都数之联科技有限公司
发明人: 李鑫 , 翁洋 , 王竹 , 其他发明人请求不公开姓名
IPC分类号: G06F16/35 , G06F16/332 , G06F40/30 , G06K9/62
摘要: 本发明公开了争议焦点类别及相似判断方法及系统及装置及推荐方法,属于自然语言处理领域,本发明包括数据集构造、模型构建和训练,本发明整体架构使用了召回、精排的双模型,召回模型是对争议焦点直接分类,准确度有限,但是速度快,保障了整体效率;精排模型充分利用了bert的Self‑attention机制对争议焦点对做语义交互,虽然速度稍慢,但是准确率高;因此召回‑精排双模型有效的平衡了速度和精确度。
-
公开(公告)号:CN113282726A
公开(公告)日:2021-08-20
申请号:CN202110582834.8
申请日:2021-05-27
申请人: 成都数之联科技有限公司
发明人: 翁洋 , 李鑫 , 王竹 , 其他发明人请求不公开姓名
IPC分类号: G06F16/332 , G06F16/35 , G06F16/36 , G06F40/279 , G06N3/04 , G06N3/08
摘要: 本发明公开了数据处理方法及系统及装置及介质及数据分析方法,涉及自然语言处理领域,包括:从裁判文书库中筛选出包含预设类型犯罪的裁判文书数据;提取所述裁判文书数据信息中的案情事实数据;建立图神经网络,将所述案情事实数据输入所述图神经网络;在所述图神经网络的节点位置抽取实体信息数据、实体间的关系数据和事件序列信息数据,并转换为结果数据输出,所述结果数据包括(实体1,关系,实体2)三元组和裁判文书所属的犯罪类型;本发明得到的分析统计结果是基于裁判文书库中预设犯罪类型的全量裁判文书数据;通过深度学习的方法进行启发式的信息抽取,使得统计的维度更全面,不易受人为干扰。
-
公开(公告)号:CN112131370B
公开(公告)日:2021-03-12
申请号:CN202011324245.1
申请日:2020-11-23
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 李鑫 , 王竹 , 翁洋 , 其他发明人请求不公开姓名
IPC分类号: G06F16/332 , G06F16/33 , G06F40/30 , G06N5/04
摘要: 本发明公开了问答模型构建方法及系统、问答方法及装置、审判系统,问答模型包括推理路径检索模型和阅读理解模型,方法包括:构造检索推理路径标注数据集;基于检索推理路径标注数据集,构建推理路径检索模型用于从预设信息中检索出推理路径;构造推理路径检索模型的损失函数;利用检索推理路径标注数据集训练推理路径检索模型;基于训练后的推理路径检索模型,得到问题对应的多个推理路径;基于推理路径和答案构建阅读理解模型用于从多个推理路径中选择最佳推理路径和获得答案,本发明实现基于多跳阅读理解的智能问答,不仅可以基于预设信息给出问题的答案,而且可以给出获取答案的推理过程。
-
公开(公告)号:CN111737420A
公开(公告)日:2020-10-02
申请号:CN202010785891.1
申请日:2020-08-07
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 李鑫 , 王竹 , 翁洋 , 其他发明人请求不公开姓名
IPC分类号: G06F16/33 , G06F40/289 , G06F40/30 , G06Q50/18 , G06N20/00
摘要: 本发明公开了一种基于争议焦点的类案检索方法及系统及装置及介质,涉及自然语言处理语义相似度领域,所述方法包括:争议焦点提取处理步骤、分词处理步骤、词向量获得处理步骤、句向量获得处理步骤、最终争议焦点句向量获得处理步骤、存入索引库步骤、待检索的争议焦点对应的最终争议焦点句向量P获取步骤以及相应的检索步骤,获得topK相似争议焦点对应的案例,本发明使用了自然语言处理领域的用来产生词向量的相关模型来构造争议焦点的句向量,该构造方法使用非监督的方式,去除了人工标注相似句子的复杂性,不仅方法简单,同时也是一个基于语义检索、检索速度快和检索结果准确的方法;提高基于争议焦点的类案检索的召回率和精确率。
-
公开(公告)号:CN113779227A
公开(公告)日:2021-12-10
申请号:CN202111341769.6
申请日:2021-11-12
申请人: 成都数之联科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/186 , G06F40/30 , G06Q50/18
摘要: 本发明公开了案情事实抽取方法及系统及装置及介质,涉及人工智能领域,包括:获得第一训练集,构建第一分类模型,利用第一训练集训练第一分类模型获得触发词识别模型;利用第二训练集训练第一概率预测模型和第二概率预测模型获得论元起点预测模型;获得待处理裁判文书,将待处理裁判文书输入触发词识别模型,获得触发词识别结果;将待处理裁判文书输入论元起点预测模型模型,获得论元的起始位置;基于起始位置获得相应的论元字段;基于触发词识别结果和论元字段获得待处理裁判文书的案情事实,本方法能够实现在从裁判文书中自动抽取案情事实。
-
公开(公告)号:CN113282750A
公开(公告)日:2021-08-20
申请号:CN202110582823.X
申请日:2021-05-27
申请人: 成都数之联科技有限公司
发明人: 李鑫 , 翁洋 , 王竹 , 其他发明人请求不公开姓名
摘要: 本发明公开了模型训练方法及系统及装置及介质,涉及自然语言处理领域,包括:从裁判文书库中获取已进行案由归类的裁判文书作为第一裁判文书数据;从所述第一裁判文书数据中提取样本数据,所述样本数据包括法院认定事实和裁判依据中的任意一种或两种;通过所述样本数据输入transformerXL模型进行训练,得到第二裁判文书案由归类模型;本发明通过改进深度学习模型,改进后的模型适用解决裁判文书长文本分类的问题。
-
公开(公告)号:CN112614024A
公开(公告)日:2021-04-06
申请号:CN202011609552.4
申请日:2020-12-30
申请人: 成都数之联科技有限公司
发明人: 翁洋 , 李鑫 , 王竹 , 其他发明人请求不公开姓名
IPC分类号: G06Q50/18 , G06F16/383 , G06F40/194 , G06F40/30 , G06K9/62
摘要: 本发明公开了基于案情事实的法条智能推荐方法及系统及装置及介质,包括:构造训练数据集;利用训练数据集训练法条推荐模型A,获得训练后的法条推荐模型B;获得输入数据,输入数据的格式为:预设案情事实‑预设案情事实对应的法条具体司法解释;将输入数据输入法条推荐模型B,法条推荐模型B输出N条推荐法条,N条推荐法条为所有与预设案情事实对应的法条中按照预设匹配度降序排列的前N的法条,预设匹配度为与预设案情事实对应的法条与预设案情事实的匹配度。本发明能够使基于案情事实的法条推荐的结果更加精准,更加高效地辅助法官判案。
-
公开(公告)号:CN112395426A
公开(公告)日:2021-02-23
申请号:CN202011277803.3
申请日:2020-11-16
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 翁洋 , 王竹 , 李鑫 , 其他发明人请求不公开姓名
IPC分类号: G06F16/36 , G06F16/338 , G06F16/33 , G06Q50/18
摘要: 本发明公开了语义匹配模型训练方法及系统、检索系统、装置、介质,涉及自然语言处理领域,包括:选择包含预设争议焦点的裁判文书作为基础样本;定义单组训练样本为三元组样本Q、D+和D‑,基于该裁判文书对应的Q、D+和D‑得到单组训练样本;基于多个单组训练样本生成训练样本;对每个单组训练样本利用语义匹配模型分别计算Q与D+和D‑的相关性得分,基于相关性得分和损失函数训练语义匹配模型;本发明避免了争议焦点多导致的搜索前争议焦点选择困难的问题;解决了返回裁判文书排序质量低的问题,利用深度语义匹配模型将争议焦点与案情事实结合起来,使得在召回后裁判文书的再排序结果精确度大大提高。
-
公开(公告)号:CN112131370A
公开(公告)日:2020-12-25
申请号:CN202011324245.1
申请日:2020-11-23
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 李鑫 , 王竹 , 翁洋 , 其他发明人请求不公开姓名
IPC分类号: G06F16/332 , G06F16/33 , G06F40/30 , G06N5/04
摘要: 本发明公开了问答模型构建方法及系统、问答方法及装置、审判系统,问答模型包括推理路径检索模型和阅读理解模型,方法包括:构造检索推理路径标注数据集;基于检索推理路径标注数据集,构建推理路径检索模型用于从预设信息中检索出推理路径;构造推理路径检索模型的损失函数;利用检索推理路径标注数据集训练推理路径检索模型;基于训练后的推理路径检索模型,得到问题对应的多个推理路径;基于推理路径和答案构建阅读理解模型用于从多个推理路径中选择最佳推理路径和获得答案,本发明实现基于多跳阅读理解的智能问答,不仅可以基于预设信息给出问题的答案,而且可以给出获取答案的推理过程。
-
-
-
-
-
-
-
-
-