-
公开(公告)号:CN110781650B
公开(公告)日:2020-04-14
申请号:CN202010000336.3
申请日:2020-01-02
申请人: 四川大学 , 成都星云律例科技有限责任公司
发明人: 李鑫 , 王竹 , 翁洋 , 其他发明人请求不公开姓名
IPC分类号: G06F40/166 , G06N3/08 , G06Q50/18 , G06F40/186
摘要: 本发明公开了一种基于深度学习的裁判文书自动生成方法及系统,本发明充分研究不同类型裁判文书案由的通常表述,结合同类型案由的基本情况,根据每种类型案由的要素分类情况标注裁判文书涉及的案由要素,将标注数据划分为训练集和测试集;利用深度学习算法建立序列模型,将LSTM作为模型的编码器和解码器;利用训练集和测试集训练和测试模型,通过案由要素实现裁判文书自动生成,可以有效提高裁判文书制作的效率与准确率,本发明还能够高速有效的生成一篇规范的裁判文书,并且本发明中的裁判文书生成的逻辑更加通顺。
-
公开(公告)号:CN110781254A
公开(公告)日:2020-02-11
申请号:CN202010001253.6
申请日:2020-01-02
申请人: 四川大学 , 成都星云律例科技有限责任公司
发明人: 翁洋 , 李鑫 , 王竹 , 谷松原 , 其他发明人请求不公开姓名
摘要: 本发明公开了一种案情知识图谱自动构建方法及系统及设备及介质,包括:基于专家库预先定义实体关系;采用Bert分类模型训练裁判文书结构化分类模型;采用模型原型Bert+CRF训练实体识别模型;采用模型原型基于Bert的关系抽取模型训练关系抽取模型;构建案情知识图谱;采用CRF改进实体识别基准模型的编码层得到Bert-CRF模型,进一步提升实体识别效果F1值;融合平移嵌入的多任务联合的语义关系抽取模型Bert,提升关系抽取结果F1值。本发明设计了一个融合结构化文本和非结构化文本的案件案情知识图谱自动构建方法,并构建了大规模司法案件的案情知识图谱,为类案精准推送等提供了语义支撑。
-
公开(公告)号:CN110795926B
公开(公告)日:2020-04-07
申请号:CN202010004494.6
申请日:2020-01-03
申请人: 四川大学 , 成都星云律例科技有限责任公司
发明人: 翁洋 , 王竹 , 李鑫 , 其他发明人请求不公开姓名
IPC分类号: G06F40/194 , G06F16/36
摘要: 本发明公开了一种基于法律知识图谱的裁判文书相似性判断方法及系统,所述方法包括:获得裁判文书A和裁判文书B;分别构建裁判文书A的案由对应的法律知识图谱A'和裁判文书B的案由对应的法律知识图谱B';分别将法律知识图谱A'转换为向量A'',将法律知识图谱B'转换为向量B'';比较向量A''和向量B'',得到裁判文书A和裁判文书B之间的相似性判断结果;本发明方法和系统通过知识嵌入算法将原有的法律知识图谱由不易计算的图状结构转换为数学向量表示,支撑裁判文书基于语义相似性的两两对比,便于更加准确和高效地判断裁判文书之间相似性。
-
公开(公告)号:CN110795926A
公开(公告)日:2020-02-14
申请号:CN202010004494.6
申请日:2020-01-03
申请人: 四川大学 , 成都星云律例科技有限责任公司
发明人: 翁洋 , 王竹 , 李鑫 , 其他发明人请求不公开姓名
IPC分类号: G06F40/194 , G06F16/36
摘要: 本发明公开了一种基于法律知识图谱的裁判文书相似性判断方法及系统,所述方法包括:获得裁判文书A和裁判文书B;分别构建裁判文书A的案由对应的法律知识图谱A'和裁判文书B的案由对应的法律知识图谱B';分别将法律知识图谱A'转换为向量A'',将法律知识图谱B'转换为向量B'';比较向量A''和向量B'',得到裁判文书A和裁判文书B之间的相似性判断结果;本发明方法和系统通过知识嵌入算法将原有的法律知识图谱由不易计算的图状结构转换为数学向量表示,支撑裁判文书基于语义相似性的两两对比,便于更加准确和高效地判断裁判文书之间相似性。
-
公开(公告)号:CN110781650A
公开(公告)日:2020-02-11
申请号:CN202010000336.3
申请日:2020-01-02
申请人: 四川大学 , 成都星云律例科技有限责任公司
发明人: 李鑫 , 王竹 , 翁洋 , 其他发明人请求不公开姓名
IPC分类号: G06F40/166 , G06N3/08 , G06Q50/18 , G06F40/186
摘要: 本发明公开了一种基于深度学习的裁判文书自动生成方法及系统,本发明充分研究不同类型裁判文书案由的通常表述,结合同类型案由的基本情况,根据每种类型案由的要素分类情况标注裁判文书涉及的案由要素,将标注数据划分为训练集和测试集;利用深度学习算法建立序列模型,将LSTM作为模型的编码器和解码器;利用训练集和测试集训练和测试模型,通过案由要素实现裁判文书自动生成,可以有效提高裁判文书制作的效率与准确率,本发明还能够高速有效的生成一篇规范的裁判文书,并且本发明中的裁判文书生成的逻辑更加通顺。
-
公开(公告)号:CN115630160A
公开(公告)日:2023-01-20
申请号:CN202211568275.6
申请日:2022-12-08
申请人: 四川大学
IPC分类号: G06F16/35 , G06F40/216 , G06F40/289 , G06N20/00
摘要: 本发明公开了一种基于半监督共现图模型的争议焦点聚类方法及系统,获取第一数据集,所述第一数据集为争议焦点短文本;对所述第一数据集进行预处理,获得第二数据集,并基于所述第二数据集,构建半监督共现图模型;按照词频由高到低的方法,从所述半监督共现图模型中提取主题词群;根据争议焦点的类别,对所述主题词群进行类别分配。本发明的有益效果为通过采用半监督共现图模型的方法对争议焦点的文本数据进行处理,提避免了文本数据出现的稀疏性以及高维性,提高了对争议焦点处理的准确性。
-
公开(公告)号:CN111680504B
公开(公告)日:2020-11-27
申请号:CN202010798144.1
申请日:2020-08-11
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 翁洋 , 李鑫 , 王竹 , 其他发明人请求不公开姓名
IPC分类号: G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/18
摘要: 本发明公开了法律信息抽取模型及方法及系统及装置及辅助系统,涉及自然语言处理领域,包括:定义裁判文书中需要标注的实体类型;标注选取的若干裁判文书中的实体类型;基于法律分词数据集和实体识别数据集得到训练集;建立裁判文书法律信息抽取模型,利用训练集训练裁判文书法律信息抽取模型;将法律信息待抽取的裁判文书输入训练后的裁判文书法律信息抽取模型,输出裁判文书中的法律信息抽取结果;裁判文书法律信息抽取模型结构包括:词嵌入层、共享‑私有信息抽取器、任务特有CRF层和任务判别器;本发明以公开的裁判文书为起点,最终实现裁判文书中相关重要法律信息要素的抽取。
-
公开(公告)号:CN111459973B
公开(公告)日:2020-10-23
申请号:CN202010548781.3
申请日:2020-06-16
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 王竹 , 李鑫 , 翁洋 , 其他发明人请求不公开姓名
IPC分类号: G06F16/242 , G06F16/2455 , G06Q50/18
摘要: 本发明公开了一种基于案情三元组信息的类案检索方法及系统:标注案情样本库中的案情样本得到标注样本库;将标注样本库输入模型进行训练得到三元组集合,三元组集合中的三元组包括案情实体和案情实体对应的要素;设置抽取案情的三元组评分模型;类案检索时,将待检索的案件的信息输入训练后的模型得到对应三元组集合;利用三元组评分模型对案情数据库中案情的三元组集合评分,将评分最高的一个或多个三元组集合对应的案情作为类案检索结果。本发明一种基于案情三元组信息的类案检索方法及系统,利用法律领域预训练语言模型和排序算法构造类案检索关键衡量标准,从法律专业的角度实现类案精准检索。
-
公开(公告)号:CN111444706A
公开(公告)日:2020-07-24
申请号:CN202010542635.X
申请日:2020-06-15
申请人: 四川大学 , 成都数之联科技有限公司
发明人: 李鑫 , 王竹 , 翁洋 , 其他发明人请求不公开姓名
IPC分类号: G06F40/232 , G06F40/295 , G06F40/247 , G06Q50/18
摘要: 本发明公开了一种基于深度学习的裁判文书文本纠错方法,包括以下步骤:将裁判文书文本中错误检测分为命名实体检测和文本错误检测;进行命名实体检测时,定义专有名词,并检测裁判文书文本中的专有名词得到命名实体检测结果;进行文本错误检测时,利用文本错误模型检测裁判文书文本得到文本错误检测结果;根据关联词条处理文本错误检测结果得到纠错候选集;根据命名实体检测结果和纠错候选集进行纠错。本发明还公开了一种基于深度学习的裁判文书文本纠错系统。本发明对裁判文书全文做实体识别,进行进一步检测以避免上下文不一致,并且避免了传统方法中过纠错和纠错不足的问题。
-
公开(公告)号:CN115630160B
公开(公告)日:2023-07-07
申请号:CN202211568275.6
申请日:2022-12-08
申请人: 四川大学
IPC分类号: G06F16/35 , G06F40/216 , G06F40/289 , G06N20/00
摘要: 本发明公开了一种基于半监督共现图模型的争议焦点聚类方法及系统,获取第一数据集,所述第一数据集为争议焦点短文本;对所述第一数据集进行预处理,获得第二数据集,并基于所述第二数据集,构建半监督共现图模型;按照词频由高到低的方法,从所述半监督共现图模型中提取主题词群;根据争议焦点的类别,对所述主题词群进行类别分配。本发明的有益效果为通过采用半监督共现图模型的方法对争议焦点的文本数据进行处理,提避免了文本数据出现的稀疏性以及高维性,提高了对争议焦点处理的准确性。
-
-
-
-
-
-
-
-
-