一种基于神经核方法的关系抽取方法

    公开(公告)号:CN118940746A

    公开(公告)日:2024-11-12

    申请号:CN202411431795.1

    申请日:2024-10-14

    Applicant: 贵州大学

    Abstract: 一种基于神经核方法的关系抽取方法,属于自然语言处理领域,包括:关系抽取任务定义和形式化,建立从关系实例集合到关系标签集合的映射;构建神经核方法模型,将输入数据分配给与最接近的标注参考实例相同的类型。本发明在关系抽取任务中引入了三种神经核来演示关系抽取的核替换机制:通过三种神经核的优化,并使用核替换构建复合核,提高了深度神经网络的区分能力。本发明利用神经核方法进行关系抽取,通过结合神经网络和核替换的方法,提高分类准确性。利用神经核方法能自动学习关系实例之间的相似性,避免了现有关系抽取方法中手动设计特征和距离函数可能导致的问题,同时能充分利用深度学习和外部资源,提高关系抽取任务的性能和效果。

    一种多方向梯度特征提取的嵌套命名实体识别方法

    公开(公告)号:CN119990130A

    公开(公告)日:2025-05-13

    申请号:CN202510069987.0

    申请日:2025-01-16

    Applicant: 贵州大学

    Abstract: 本发明属于自然语言处理技术领域,公开了一种多方向梯度特征提取的嵌套命名实体识别方法,包括以下步骤:对文本数据集进行预处理;将预处理的句子输入模型获取词向量的上下文特征;将具有上下文信息特征的句子进行平面化表示;通过逐通道卷积与扩展边缘梯度算子结合的方式,提取多方向实体语义边缘特征;使用逐点卷积进行空间连接得到高阶特征,送入多层感知机,与平面化句子表示的句子进行残差连接,使用Softmax和Argmax预测分类返回索引值,完成候选实体筛选。本发明采用上述一种多方向梯度特征提取的嵌套命名实体识别方法,在平面化句子表示中采用扩展八方向Sobel算子提取实体语义边缘特征,使其更加完整且具有区分度。

    一种基于逻辑上下文学习的时序知识图谱预测方法

    公开(公告)号:CN119962677A

    公开(公告)日:2025-05-09

    申请号:CN202510029185.7

    申请日:2025-01-08

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于逻辑上下文学习的时序知识图谱预测方法,涉及知识图谱领域,包括步骤1、在已知的时序知识图谱中进行基于时间的随机游走得到符合时间约束的时间随机游走路径;步骤2、将得到的符合时间约束的时间随机游走路径抽象为时间逻辑规则;步骤3、计算抽象出的时间逻辑规则的支持度和置信度;步骤4、根据需要预测事件中的关系找到对应的时间逻辑规则并根据支持度对规则进行过滤;步骤5、将过滤后的规则应用于时序知识图谱得到预测尾实体的候选集;步骤6、根据固定格式,把历史事件和候选集转换为输入大语言模型的逻辑上下文;步骤7、大语言模型根据输入的逻辑上下文,重排候选集,预测未来发生事件中可能的尾实体。

    结合提示学习和Qwen大语言模型的裁判文书摘要方法

    公开(公告)号:CN119203968A

    公开(公告)日:2024-12-27

    申请号:CN202411276783.6

    申请日:2024-09-12

    Applicant: 贵州大学

    Abstract: 本发明提供结合提示学习和Qwen大语言模型的裁判文书方法,包括:运用文本解析方法,提取裁判文书数据集中独特结构信息的关键特征词及对应内容;以提示学习为载体,构建包含训练集独特结构信息的提示模板;将所述训练集与所述提示模板相结合,通过所述Qwen大语言模型的微调操作,得到一个针对裁判文书摘要任务的基准大语言模型;使用所述提示模板结合新接受的待处理的裁判文书,构建成问答对数据格式,再利用所述基准大语言模型,自动生成裁判文书摘要,本发明保证在初步阶段不丢失裁判文书关键信息,避免为了减少上下文长度而抽取文本却导致某些关键信息丢失的问题;并且由于提示模板的辅助,能够进一步加强对裁判文书关键信息的感知,减少错误问题。

Patent Agency Ranking