-
公开(公告)号:CN119493884A
公开(公告)日:2025-02-21
申请号:CN202510082874.4
申请日:2025-01-20
Applicant: 贵州大学
IPC: G06F16/903 , G06F16/901 , G06N5/04 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本发明公开了一种结合因果关系的法条推荐方法,涉及法条推荐技术领域,包括以下步骤:步骤1、构建案件事实‑法条有向二分图;步骤2、构建双层图卷积神经网络模型;步骤3、对步骤2构建的双层图卷积神经网络模型进行训练;步骤4、训练过程完成后,通过精准度、准确度、召回率、F1分数评估模型性能,根据评估结果,调整模型超参数;本发明提供的方法通过保留训练集中低频法条及其关联案件事实,再利用图卷积神经网络聚合邻近节点的信息,增强低频法条的特征表示,从而使其语义信息得到有效利用,提高低频法条的推荐成功率。
-
公开(公告)号:CN118966225B
公开(公告)日:2024-12-24
申请号:CN202411423310.4
申请日:2024-10-12
Applicant: 贵州大学
IPC: G06F40/295 , G06F40/30 , G06N3/048 , G06N3/045 , G06N3/08
Abstract: 一种基于混合尺度句子表示的命名实体识别方法,属于自然语言处理和机器学习领域,包括:基于二维句子表示所具有的构建跨度的多尺度表示的能力,构建句子的二维表示;基于尺度空间理论,通过文本缩放操作将原始的二维句子表示转换为混合尺度二维句子表示;构建门控集成模块,集成混合尺度二维句子表示,通过多层感知来计算预测结果,完成针对命名实体的识别和分类。本发明通过设计特定的文本缩放操作生成多个调整大小的句子表示,有效地编码了句子的精细和粗尺度的语义特征;通过结合混合尺度句子表示的门控集成机制提高神经网络的可辩别性,可在二维句子表示中学习多个调整大小的表示,有效地支持识别具有较长或较短长度的命名实体。
-
公开(公告)号:CN118940732B
公开(公告)日:2024-12-24
申请号:CN202411436259.0
申请日:2024-10-15
Applicant: 贵州大学
IPC: G06F40/166 , G06F18/214 , G06Q50/18
Abstract: 本发明涉及智能识别模型应用技术领域,特别涉及一种基于大模型集成优化的合同审查报告生成方法,解决现有技术中的缺少通过自动化流程提高合同审查的效率和准确性的方法以对合同文本的深入分析和审查的技术问题,合同分类过程、意图识别过程,得到的合同类型与合同意图,遍历所述风险点审查库中的每一个所述审核问题,并作为输入传递给多个预训练的大型语言模型,通过集成所述多个预训练的大型语言模型的输出,使用一个投票器来对结果进行汇总和评估,将整合所有风险点的审核结果,形成一份全面的审查报告,可以大大提高模型对法律文档特定部分的理解能力,识别潜在风险和义务等方面。这种方法能够提升模型的精确度和针对性,确保更高的审查质量。
-
公开(公告)号:CN118862861A
公开(公告)日:2024-10-29
申请号:CN202410871616.X
申请日:2024-07-01
Applicant: 贵州大学
IPC: G06F40/205 , G06F40/284 , G06N5/04 , G06N5/022 , G06Q50/18
Abstract: 一种基于反绎提示工程的法律事实认定方法,属于人工智能领域,包括以下步骤:基于案情事实部分、提示词以及法律大语言模型得到初步法律事实认定结果;将上述获得的初步法律事实认定结果以一阶逻辑的形式进行抽象化表示;结合案情知识库与一阶逻辑抽象化表示后的法律事实认定结果进行最小不一致性推理修正并更新提示词;通过动态更新提示词重新推理法律事实认定结果;重复以上步骤,直至一阶逻辑抽象化表示的法律事实认定结果与案情知识库推理产生一致性。本发明解决了现有较小的大语言模型在法律推理中隐式法律知识难以引出和计算资源有限的问题。本发明可以在较小大语言模型的基础上,实现法律事实的更精确推理,节省了计算资源的消耗。
-
公开(公告)号:CN119990131A
公开(公告)日:2025-05-13
申请号:CN202510069993.6
申请日:2025-01-16
Applicant: 贵州大学
IPC: G06F40/295 , G06N3/045 , G06N3/0464 , G06N3/0442
Abstract: 本发明公开了基于二维语义扩张的命名实体识别方法,属于自然语言处理技术领域,包括S1、构建由编码模块、语义聚焦模块和门控集成模块组成的模型架构;S2、通过编码模块将一个原始句子映射为一个二维句子表示;S3、通过语义聚焦模块捕获二维句子表示的局部特征信息和全局语义信息;S4、通过门控集成模块对不同特征信息进行融合,获得最终的特征表示,进行预测;本发明提供的基于二维语义扩张的命名实体识别方法,针对实体语义在跨度中分散、语义模糊的问题,通过语义扩张模块,增强了局部语义信息,实现更精细的特征提取;通过构建了一个轻量级网络架构,用于捕获二维表示的全局信息,进一步提升了特征表示的质量,从而更好的识别长命名实体。
-
公开(公告)号:CN119493884B
公开(公告)日:2025-04-15
申请号:CN202510082874.4
申请日:2025-01-20
Applicant: 贵州大学
IPC: G06F16/903 , G06F16/901 , G06N5/04 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本发明公开了一种结合因果关系的法条推荐方法,涉及法条推荐技术领域,包括以下步骤:步骤1、构建案件事实‑法条有向二分图;步骤2、构建双层图卷积神经网络模型;步骤3、对步骤2构建的双层图卷积神经网络模型进行训练;步骤4、训练过程完成后,通过精准度、准确度、召回率、F1分数评估模型性能,根据评估结果,调整模型超参数;本发明提供的方法通过保留训练集中低频法条及其关联案件事实,再利用图卷积神经网络聚合邻近节点的信息,增强低频法条的特征表示,从而使其语义信息得到有效利用,提高低频法条的推荐成功率。
-
公开(公告)号:CN119441914A
公开(公告)日:2025-02-14
申请号:CN202411556143.0
申请日:2024-11-04
Applicant: 贵州大学
IPC: G06F18/23 , G06N3/0455 , G06N3/0442 , G06N3/0895 , G06N3/094
Abstract: 本发明属于数据分析与应用技术领域,具体涉及一种面向多视图聚类的插用式跨视图预学习方法,包括以下步骤:首先采用多视图自动编码器获得各个视图上原始输入数据的编码表示;然后采用跨视图的对比学习方式引入多视图之间的互补一致性信息;最后联合优化将多视图重构损失和跨视图对比学习损失作为总任务损失进行模型监督。本发明通过引入跨视图对比学习和插用式的预学习方法,充分考虑多视图信息,在特征学习阶段对多视图信息进行全面有效的整合,从而提高模型的表达能力和聚类性能,减少信息丢失现象,实现更准确和稳定的多视图聚类结果。
-
公开(公告)号:CN118967068B
公开(公告)日:2024-12-20
申请号:CN202411455223.7
申请日:2024-10-18
Applicant: 贵州大学
IPC: G06Q10/10 , G06Q50/18 , G06N3/0442 , G06N3/08 , G06F16/33 , G06F16/335
Abstract: 本发明涉及智能文本审核技术领域,特别涉及一种基于要素抽取的智能合同审核方法,解决现有技术中的过度依赖人工规则,缺乏灵活性;未能深入挖掘合同结构与要素之间的深层关系、多阶段处理中易导致错误传播技术问题,具体为拆分合同原文为多个合同模块,使用双向的长短期记忆网络对合同模块中的句子进行特征编码,以将句子转换为向量表示;通过分析合同要素类型和合同模块类型共同出现的频率,通过构建C‑E图获得关系编码表示;结合关系编码表示和句子的向量表示,采用双反馈方案联合训练分类任务和要素抽取任务,抽取合同要素;搜索与合同缺失要素相关的合同要素,使用中文文本相似度评价指标对检索到的文本进行重新排名,输出审核报告。
-
公开(公告)号:CN118917301A
公开(公告)日:2024-11-08
申请号:CN202411411874.6
申请日:2024-10-11
Applicant: 贵州大学
IPC: G06F40/205 , G06F40/30 , G06N3/0464 , G06N3/042 , G06N3/08 , G06F16/35
Abstract: 本发明涉及语言结构学习技术领域,特别是一种面向实体关系抽取的语言结构学习方法及系统,从数据集中提取关系提及语句、实体对以及实体对间的语义关系类别;将实体特征序列与实体标记语句结合得到文本序列,输入神经网络模型;将所述文本序列中的词映射成向量,得到抽象表示矩阵;构建增强特征关联邻接矩阵,作为神经网络模型训练的可变参数;抽象表示矩阵与增强特征关联邻接矩阵进行图卷积操作,并进行残差链接,得到文本语言结构特征;对文本语言结构特征进行全连接操作,通过激活函数和线性分类,输出语义关系分类结果。通过构建特征关联邻接矩阵,在神经网络隐藏层中不断更新矩阵,达到学习语言结构关系的目的,改善实体关系抽取的性能。
-
公开(公告)号:CN119476266B
公开(公告)日:2025-04-15
申请号:CN202510038789.8
申请日:2025-01-10
Applicant: 贵州大学
IPC: G06F40/232 , G06F18/2415 , G06N20/00
Abstract: 本发明公开了一种基于最大熵原理的插用式中文拼写纠错方法,涉及自然语言处理技术领域;S1、给定输入文本序列#imgabs0#和训练标签#imgabs1#;S2、将S1所述输入文本序列#imgabs2#传入PLMs模型或CSC模型得到模型输出结果并计算损失函数;S3、根据S2的模型输出结果通过PPMEP挑选惩罚目标;S4、根据输入文本序列、模型输出结果和S3的惩罚目标应用香农公式计算出用于惩罚的熵正则化项;S5、将S4的熵正则化项和S2的损失函数进行融合并根据最大熵原理进行优化得到新的训练目标;S6、对S5中新的训练目标根据动态递减规则进行权重;本发明采用上述插用式中文拼写纠错方法,可无缝集成至现有模型,并利用最大熵原理优化模型分类概率表示,使得模型的纠正选择更贴合中文拼写纠错语境。
-
-
-
-
-
-
-
-
-