模型训练方法及非投诉工单处理方法及系统及装置及介质

    公开(公告)号:CN113254644B

    公开(公告)日:2021-09-17

    申请号:CN202110630284.2

    申请日:2021-06-07

    IPC分类号: G06F16/35 G06Q10/06 G06Q30/00

    摘要: 本发明公开了模型训练方法及非投诉工单处理方法及系统及装置及介质,包括:获取历史数据,所述历史数据包括若干项A类数据和若干项B类数据;对与所述A类数据关联的B类数据进行标记为第一标记数据;对与所述A类数据未关联的B类数据进行标记为第二标记数据;对第一标记数据以及第二标记数据进行预处理,得到基础数据,并从所述基础数据中抽取特征数据,所述特征数据的增益大于阈值;利用所述特征数据建立分类模型并训练;通过本方法可以训练的分类模型能够获得可以获得B类数据转为A类数据的概率。

    数据处理方法及系统及装置及介质及数据分析方法

    公开(公告)号:CN113282726A

    公开(公告)日:2021-08-20

    申请号:CN202110582834.8

    申请日:2021-05-27

    摘要: 本发明公开了数据处理方法及系统及装置及介质及数据分析方法,涉及自然语言处理领域,包括:从裁判文书库中筛选出包含预设类型犯罪的裁判文书数据;提取所述裁判文书数据信息中的案情事实数据;建立图神经网络,将所述案情事实数据输入所述图神经网络;在所述图神经网络的节点位置抽取实体信息数据、实体间的关系数据和事件序列信息数据,并转换为结果数据输出,所述结果数据包括(实体1,关系,实体2)三元组和裁判文书所属的犯罪类型;本发明得到的分析统计结果是基于裁判文书库中预设犯罪类型的全量裁判文书数据;通过深度学习的方法进行启发式的信息抽取,使得统计的维度更全面,不易受人为干扰。

    问答模型构建方法及系统、问答方法及装置、审判系统

    公开(公告)号:CN112131370B

    公开(公告)日:2021-03-12

    申请号:CN202011324245.1

    申请日:2020-11-23

    摘要: 本发明公开了问答模型构建方法及系统、问答方法及装置、审判系统,问答模型包括推理路径检索模型和阅读理解模型,方法包括:构造检索推理路径标注数据集;基于检索推理路径标注数据集,构建推理路径检索模型用于从预设信息中检索出推理路径;构造推理路径检索模型的损失函数;利用检索推理路径标注数据集训练推理路径检索模型;基于训练后的推理路径检索模型,得到问题对应的多个推理路径;基于推理路径和答案构建阅读理解模型用于从多个推理路径中选择最佳推理路径和获得答案,本发明实现基于多跳阅读理解的智能问答,不仅可以基于预设信息给出问题的答案,而且可以给出获取答案的推理过程。

    一种基于争议焦点的类案检索方法及系统及装置及介质

    公开(公告)号:CN111737420A

    公开(公告)日:2020-10-02

    申请号:CN202010785891.1

    申请日:2020-08-07

    摘要: 本发明公开了一种基于争议焦点的类案检索方法及系统及装置及介质,涉及自然语言处理语义相似度领域,所述方法包括:争议焦点提取处理步骤、分词处理步骤、词向量获得处理步骤、句向量获得处理步骤、最终争议焦点句向量获得处理步骤、存入索引库步骤、待检索的争议焦点对应的最终争议焦点句向量P获取步骤以及相应的检索步骤,获得topK相似争议焦点对应的案例,本发明使用了自然语言处理领域的用来产生词向量的相关模型来构造争议焦点的句向量,该构造方法使用非监督的方式,去除了人工标注相似句子的复杂性,不仅方法简单,同时也是一个基于语义检索、检索速度快和检索结果准确的方法;提高基于争议焦点的类案检索的召回率和精确率。

    模型训练方法及系统及装置及介质

    公开(公告)号:CN113282750A

    公开(公告)日:2021-08-20

    申请号:CN202110582823.X

    申请日:2021-05-27

    IPC分类号: G06F16/35 G06K9/62

    摘要: 本发明公开了模型训练方法及系统及装置及介质,涉及自然语言处理领域,包括:从裁判文书库中获取已进行案由归类的裁判文书作为第一裁判文书数据;从所述第一裁判文书数据中提取样本数据,所述样本数据包括法院认定事实和裁判依据中的任意一种或两种;通过所述样本数据输入transformerXL模型进行训练,得到第二裁判文书案由归类模型;本发明通过改进深度学习模型,改进后的模型适用解决裁判文书长文本分类的问题。

    基于案情事实的法条智能推荐方法及系统及装置及介质

    公开(公告)号:CN112614024A

    公开(公告)日:2021-04-06

    申请号:CN202011609552.4

    申请日:2020-12-30

    摘要: 本发明公开了基于案情事实的法条智能推荐方法及系统及装置及介质,包括:构造训练数据集;利用训练数据集训练法条推荐模型A,获得训练后的法条推荐模型B;获得输入数据,输入数据的格式为:预设案情事实‑预设案情事实对应的法条具体司法解释;将输入数据输入法条推荐模型B,法条推荐模型B输出N条推荐法条,N条推荐法条为所有与预设案情事实对应的法条中按照预设匹配度降序排列的前N的法条,预设匹配度为与预设案情事实对应的法条与预设案情事实的匹配度。本发明能够使基于案情事实的法条推荐的结果更加精准,更加高效地辅助法官判案。

    语义匹配模型训练方法及系统、检索系统、装置、介质

    公开(公告)号:CN112395426A

    公开(公告)日:2021-02-23

    申请号:CN202011277803.3

    申请日:2020-11-16

    摘要: 本发明公开了语义匹配模型训练方法及系统、检索系统、装置、介质,涉及自然语言处理领域,包括:选择包含预设争议焦点的裁判文书作为基础样本;定义单组训练样本为三元组样本Q、D+和D‑,基于该裁判文书对应的Q、D+和D‑得到单组训练样本;基于多个单组训练样本生成训练样本;对每个单组训练样本利用语义匹配模型分别计算Q与D+和D‑的相关性得分,基于相关性得分和损失函数训练语义匹配模型;本发明避免了争议焦点多导致的搜索前争议焦点选择困难的问题;解决了返回裁判文书排序质量低的问题,利用深度语义匹配模型将争议焦点与案情事实结合起来,使得在召回后裁判文书的再排序结果精确度大大提高。

    问答模型构建方法及系统、问答方法及装置、审判系统

    公开(公告)号:CN112131370A

    公开(公告)日:2020-12-25

    申请号:CN202011324245.1

    申请日:2020-11-23

    摘要: 本发明公开了问答模型构建方法及系统、问答方法及装置、审判系统,问答模型包括推理路径检索模型和阅读理解模型,方法包括:构造检索推理路径标注数据集;基于检索推理路径标注数据集,构建推理路径检索模型用于从预设信息中检索出推理路径;构造推理路径检索模型的损失函数;利用检索推理路径标注数据集训练推理路径检索模型;基于训练后的推理路径检索模型,得到问题对应的多个推理路径;基于推理路径和答案构建阅读理解模型用于从多个推理路径中选择最佳推理路径和获得答案,本发明实现基于多跳阅读理解的智能问答,不仅可以基于预设信息给出问题的答案,而且可以给出获取答案的推理过程。