一种面向裁判文书的质量检测及评估方法及系统

    公开(公告)号:CN112365372B

    公开(公告)日:2024-01-12

    申请号:CN202011072091.1

    申请日:2020-10-09

    摘要: 本发明涉及裁判文书质量评估技术领域,尤其涉及一种面向裁判文书的质量检测及评估方法及系统。其方法包括步骤:S1.输入待评估裁判文书X;S2.提取待评估裁判文书X中的各信息项,所述信息项中包含对应的多个信息点;S3.根据步骤S2中提取的信息项对所述待评估裁判文书X的语言规范性、法律引用规范性、说理规范性以及案件信息与适用法条的关联度进行检测与评估;S4.根据检测与评估结果对待评估裁判文书X的质量进行评分。该发明优点在于文书质量评估方面涉及广泛、细致、严谨且灵活,并且给出了各个指标的具体地量化计算方法,使裁判文书的质量评估更加具化。

    一种基于特征迁移和自适应学习的人民调解案例分类系统及方法

    公开(公告)号:CN109446332B

    公开(公告)日:2023-08-25

    申请号:CN201811590326.9

    申请日:2018-12-25

    摘要: 本发明涉及一种基于特征迁移和自适应学习的人民调解案例分类系统及方法,本发明系统包括数据采集模块、特征提取模块、特征迁移模块、网络训练模块,系统结构简单,应用范围广;本发明方法包括构造字符向量表,辅助数据向量化处理,人民调解数据向量化处理,将向量化后的辅助数据输入到神经网络中,提取辅助数据特征,将提取的辅助数据通用特征迁移到新的神经网络中,向量化后的人民调解数据输入到此神经网络中,训练分类模型。本发明方法可以有效的对所有文本进行转换,不会忽略低频词,维度下降明显,训练速度快,便于后续的在线迭代优化;同时解决了人民调解领域与辅助领域之间的差异性,满足了特定领域的个性化需求。

    一种短文本多标签分类方法

    公开(公告)号:CN111552807B

    公开(公告)日:2023-05-30

    申请号:CN202010303127.6

    申请日:2020-04-17

    摘要: 一种短文本多标签分类方法,其具体步骤如下:S1、将收集的短文本数据进行文本预处理得到文本向量和对应的标签集向量;S2、利用自注意力机制学习文本内部的依赖关系,得到新的文本向量;S3、利用图注意力神经网络学习标签之间的依赖关系,得到新的标签集向量;S4、将新的文本向量和新的标签集向量进行点乘,输出文本标签向量,利用目标函数对文本标签向量与真实标签向量进行对齐训练得到文本多标签分类模型;S5、将待预测文本进行预处理得到文本向量后输入到文本多标签分类模型中预测分类。本发明解决了短文本信息不足而无法准确预测所有标签的问题,提高文本多标签分类的准确性。

    一种基于注意力机制的司法文本分类方法及系统

    公开(公告)号:CN110413783B

    公开(公告)日:2021-12-03

    申请号:CN201910666514.3

    申请日:2019-07-23

    IPC分类号: G06F16/35

    摘要: 本发明涉及一种基于注意力机制的司法文本分类方法及系统,本发明主要包括数据预处理操作,数据向量化处理,利用自注意力机制进行自我学习,利用协同注意力机制明确问题的意图,利用lstm训练文本分类模型。本发明采用多头自注意力机制,扩展模型关注不同位置的能力,解决多主题和中文文本深层语义表达不够全面的问题,使得中文文本所表示的语义信息更加准确和丰富;同时节约了时间成本。

    一种问答检索系统的同义词挖掘方法及装置

    公开(公告)号:CN110442760B

    公开(公告)日:2022-02-15

    申请号:CN201910672217.X

    申请日:2019-07-24

    摘要: 本发明涉及一种问答检索系统的同义词挖掘方法及装置,本发明通过对问答语料分类,按类别进行关键词提取,得到待处理关键词集,同时对垂直领域内的大语料进行词向量训练,并计算词向量的余弦相似度,得到当前类别关键词的广义相关词集合,然后进行词性筛选,得到缩略相关词集,再计算缩略相关词集合内的欧式距离,得到同义词对,并统计同义词对的共现频次,计算同义词的替换概率,最终根据同义词对替换后的检索召回结果,对不满足检索召回阈值的同义词对,进行反馈修正,较好的解决了同义词替换后的语义变形问题,提高了同义词挖掘的准确度以及问答对检索结果的准确性。

    一种面向医疗文本数据的过滤方法及系统

    公开(公告)号:CN112712118B

    公开(公告)日:2024-06-21

    申请号:CN202011605648.3

    申请日:2020-12-29

    摘要: 本发明提供了一种面向医疗文本数据的过滤方法,其具体步骤如下:获取未标注医疗类别标签的医疗记录数据集S,输入训练好的DSSM‑C‑BiLSTM模型,输出数据集S的预测医疗类别标签Label,通过标签Label进行数据过滤;所述DSSM‑C‑BiLSTM模型训练过程如下:(1)收集医疗记录数据集A,并对医疗记录数据集A进行数据预处理,得到数据集B,并将数据集B划分为训练集和测试集;(2)构建DSSM‑C‑BiLSTM模型,将数据集B的训练集输入到DSSM‑C‑BiLSTM模型中进行训练学习,并将数据集B的测试集输入到训练好的DSSM‑C‑BiLSTM模型中,得到医疗类别标签概率;(3)根据预测医疗类别标签和真实医疗类别标签进行模型评价指标计算,当模型评价指标满足条件后,模型训练完成。

    基于小样本学习的智能审判系统

    公开(公告)号:CN112001162B

    公开(公告)日:2024-05-31

    申请号:CN202010758053.5

    申请日:2020-07-31

    摘要: 基于小样本学习的智能审判系统,包括相似案件检索模型,用于根据输入的目标案情和推送法条从案件库中检索出若干个相似案件,形成相似案件集输出,所述案件库存储有案件,所述案件包括案情、法条、审判结果;审判要素推理模型,用于根据输入的目标案情在相似案件集的基础上给出审判要素预测。本发明解决案情、法条的一对多和长短文匹配问题,解决数据标注成本高,且模型无法向新增类型扩展及复用的问题,解决案情审判对象无法结构化,审判错误等问题。

    一种基于全卷积注意力的多元时间序列分类方法及系统

    公开(公告)号:CN112712117B

    公开(公告)日:2024-03-26

    申请号:CN202011601945.0

    申请日:2020-12-30

    摘要: 本发明涉及一种基于全卷积注意力的多元时间序列分类方法及系统,本发明利用图像领域中全卷积的设计思路,使用2D卷积滤波器捕获多元时间序列局部变量特征以学习相邻变量之间的联动关系,同时使用2D卷积滤波器捕获多元时间序列局部时间特征以学习相邻时间之间的趋势信息,减弱突变信息对结果的影响;采用卷积加自注意力模型,多核卷积获取多种局部特征,自注意力模型计算多种局部特征和非局部特征的权重,提供了不同的视角去审视多元时间序列数据;采用注意力模型分别融合对应视角的变量和时间特征,同时学习到变量的全局依赖关系以及时间的全局依赖关系;采用权重矩阵方法融合多视角的特征,学习更全面更准确的时间变量交互特征。