一种案情知识图谱自动构建方法及系统及设备及介质

    公开(公告)号:CN110781254A

    公开(公告)日:2020-02-11

    申请号:CN202010001253.6

    申请日:2020-01-02

    IPC分类号: G06F16/28 G06Q50/18

    摘要: 本发明公开了一种案情知识图谱自动构建方法及系统及设备及介质,包括:基于专家库预先定义实体关系;采用Bert分类模型训练裁判文书结构化分类模型;采用模型原型Bert+CRF训练实体识别模型;采用模型原型基于Bert的关系抽取模型训练关系抽取模型;构建案情知识图谱;采用CRF改进实体识别基准模型的编码层得到Bert-CRF模型,进一步提升实体识别效果F1值;融合平移嵌入的多任务联合的语义关系抽取模型Bert,提升关系抽取结果F1值。本发明设计了一个融合结构化文本和非结构化文本的案件案情知识图谱自动构建方法,并构建了大规模司法案件的案情知识图谱,为类案精准推送等提供了语义支撑。

    一种基于法律知识图谱的裁判文书相似性判断方法及系统

    公开(公告)号:CN110795926B

    公开(公告)日:2020-04-07

    申请号:CN202010004494.6

    申请日:2020-01-03

    IPC分类号: G06F40/194 G06F16/36

    摘要: 本发明公开了一种基于法律知识图谱的裁判文书相似性判断方法及系统,所述方法包括:获得裁判文书A和裁判文书B;分别构建裁判文书A的案由对应的法律知识图谱A'和裁判文书B的案由对应的法律知识图谱B';分别将法律知识图谱A'转换为向量A'',将法律知识图谱B'转换为向量B'';比较向量A''和向量B'',得到裁判文书A和裁判文书B之间的相似性判断结果;本发明方法和系统通过知识嵌入算法将原有的法律知识图谱由不易计算的图状结构转换为数学向量表示,支撑裁判文书基于语义相似性的两两对比,便于更加准确和高效地判断裁判文书之间相似性。

    一种基于法律知识图谱的裁判文书相似性判断方法及系统

    公开(公告)号:CN110795926A

    公开(公告)日:2020-02-14

    申请号:CN202010004494.6

    申请日:2020-01-03

    IPC分类号: G06F40/194 G06F16/36

    摘要: 本发明公开了一种基于法律知识图谱的裁判文书相似性判断方法及系统,所述方法包括:获得裁判文书A和裁判文书B;分别构建裁判文书A的案由对应的法律知识图谱A'和裁判文书B的案由对应的法律知识图谱B';分别将法律知识图谱A'转换为向量A'',将法律知识图谱B'转换为向量B'';比较向量A''和向量B'',得到裁判文书A和裁判文书B之间的相似性判断结果;本发明方法和系统通过知识嵌入算法将原有的法律知识图谱由不易计算的图状结构转换为数学向量表示,支撑裁判文书基于语义相似性的两两对比,便于更加准确和高效地判断裁判文书之间相似性。

    一种基于半监督共现图模型的争议焦点聚类方法及系统

    公开(公告)号:CN115630160A

    公开(公告)日:2023-01-20

    申请号:CN202211568275.6

    申请日:2022-12-08

    申请人: 四川大学

    摘要: 本发明公开了一种基于半监督共现图模型的争议焦点聚类方法及系统,获取第一数据集,所述第一数据集为争议焦点短文本;对所述第一数据集进行预处理,获得第二数据集,并基于所述第二数据集,构建半监督共现图模型;按照词频由高到低的方法,从所述半监督共现图模型中提取主题词群;根据争议焦点的类别,对所述主题词群进行类别分配。本发明的有益效果为通过采用半监督共现图模型的方法对争议焦点的文本数据进行处理,提避免了文本数据出现的稀疏性以及高维性,提高了对争议焦点处理的准确性。

    法律信息抽取模型及方法及系统及装置及辅助系统

    公开(公告)号:CN111680504B

    公开(公告)日:2020-11-27

    申请号:CN202010798144.1

    申请日:2020-08-11

    摘要: 本发明公开了法律信息抽取模型及方法及系统及装置及辅助系统,涉及自然语言处理领域,包括:定义裁判文书中需要标注的实体类型;标注选取的若干裁判文书中的实体类型;基于法律分词数据集和实体识别数据集得到训练集;建立裁判文书法律信息抽取模型,利用训练集训练裁判文书法律信息抽取模型;将法律信息待抽取的裁判文书输入训练后的裁判文书法律信息抽取模型,输出裁判文书中的法律信息抽取结果;裁判文书法律信息抽取模型结构包括:词嵌入层、共享‑私有信息抽取器、任务特有CRF层和任务判别器;本发明以公开的裁判文书为起点,最终实现裁判文书中相关重要法律信息要素的抽取。

    一种基于案情三元组信息的类案检索方法及系统

    公开(公告)号:CN111459973B

    公开(公告)日:2020-10-23

    申请号:CN202010548781.3

    申请日:2020-06-16

    摘要: 本发明公开了一种基于案情三元组信息的类案检索方法及系统:标注案情样本库中的案情样本得到标注样本库;将标注样本库输入模型进行训练得到三元组集合,三元组集合中的三元组包括案情实体和案情实体对应的要素;设置抽取案情的三元组评分模型;类案检索时,将待检索的案件的信息输入训练后的模型得到对应三元组集合;利用三元组评分模型对案情数据库中案情的三元组集合评分,将评分最高的一个或多个三元组集合对应的案情作为类案检索结果。本发明一种基于案情三元组信息的类案检索方法及系统,利用法律领域预训练语言模型和排序算法构造类案检索关键衡量标准,从法律专业的角度实现类案精准检索。

    一种基于深度学习的裁判文书文本纠错方法及系统

    公开(公告)号:CN111444706A

    公开(公告)日:2020-07-24

    申请号:CN202010542635.X

    申请日:2020-06-15

    摘要: 本发明公开了一种基于深度学习的裁判文书文本纠错方法,包括以下步骤:将裁判文书文本中错误检测分为命名实体检测和文本错误检测;进行命名实体检测时,定义专有名词,并检测裁判文书文本中的专有名词得到命名实体检测结果;进行文本错误检测时,利用文本错误模型检测裁判文书文本得到文本错误检测结果;根据关联词条处理文本错误检测结果得到纠错候选集;根据命名实体检测结果和纠错候选集进行纠错。本发明还公开了一种基于深度学习的裁判文书文本纠错系统。本发明对裁判文书全文做实体识别,进行进一步检测以避免上下文不一致,并且避免了传统方法中过纠错和纠错不足的问题。

    一种基于半监督共现图模型的争议焦点聚类方法及系统

    公开(公告)号:CN115630160B

    公开(公告)日:2023-07-07

    申请号:CN202211568275.6

    申请日:2022-12-08

    申请人: 四川大学

    摘要: 本发明公开了一种基于半监督共现图模型的争议焦点聚类方法及系统,获取第一数据集,所述第一数据集为争议焦点短文本;对所述第一数据集进行预处理,获得第二数据集,并基于所述第二数据集,构建半监督共现图模型;按照词频由高到低的方法,从所述半监督共现图模型中提取主题词群;根据争议焦点的类别,对所述主题词群进行类别分配。本发明的有益效果为通过采用半监督共现图模型的方法对争议焦点的文本数据进行处理,提避免了文本数据出现的稀疏性以及高维性,提高了对争议焦点处理的准确性。