一种多方向梯度特征提取的嵌套命名实体识别方法

    公开(公告)号:CN119990130A

    公开(公告)日:2025-05-13

    申请号:CN202510069987.0

    申请日:2025-01-16

    Applicant: 贵州大学

    Abstract: 本发明属于自然语言处理技术领域,公开了一种多方向梯度特征提取的嵌套命名实体识别方法,包括以下步骤:对文本数据集进行预处理;将预处理的句子输入模型获取词向量的上下文特征;将具有上下文信息特征的句子进行平面化表示;通过逐通道卷积与扩展边缘梯度算子结合的方式,提取多方向实体语义边缘特征;使用逐点卷积进行空间连接得到高阶特征,送入多层感知机,与平面化句子表示的句子进行残差连接,使用Softmax和Argmax预测分类返回索引值,完成候选实体筛选。本发明采用上述一种多方向梯度特征提取的嵌套命名实体识别方法,在平面化句子表示中采用扩展八方向Sobel算子提取实体语义边缘特征,使其更加完整且具有区分度。

    一种基于逻辑上下文学习的时序知识图谱预测方法

    公开(公告)号:CN119962677A

    公开(公告)日:2025-05-09

    申请号:CN202510029185.7

    申请日:2025-01-08

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于逻辑上下文学习的时序知识图谱预测方法,涉及知识图谱领域,包括步骤1、在已知的时序知识图谱中进行基于时间的随机游走得到符合时间约束的时间随机游走路径;步骤2、将得到的符合时间约束的时间随机游走路径抽象为时间逻辑规则;步骤3、计算抽象出的时间逻辑规则的支持度和置信度;步骤4、根据需要预测事件中的关系找到对应的时间逻辑规则并根据支持度对规则进行过滤;步骤5、将过滤后的规则应用于时序知识图谱得到预测尾实体的候选集;步骤6、根据固定格式,把历史事件和候选集转换为输入大语言模型的逻辑上下文;步骤7、大语言模型根据输入的逻辑上下文,重排候选集,预测未来发生事件中可能的尾实体。

    结合提示学习和Qwen大语言模型的裁判文书摘要方法

    公开(公告)号:CN119203968A

    公开(公告)日:2024-12-27

    申请号:CN202411276783.6

    申请日:2024-09-12

    Applicant: 贵州大学

    Abstract: 本发明提供结合提示学习和Qwen大语言模型的裁判文书方法,包括:运用文本解析方法,提取裁判文书数据集中独特结构信息的关键特征词及对应内容;以提示学习为载体,构建包含训练集独特结构信息的提示模板;将所述训练集与所述提示模板相结合,通过所述Qwen大语言模型的微调操作,得到一个针对裁判文书摘要任务的基准大语言模型;使用所述提示模板结合新接受的待处理的裁判文书,构建成问答对数据格式,再利用所述基准大语言模型,自动生成裁判文书摘要,本发明保证在初步阶段不丢失裁判文书关键信息,避免为了减少上下文长度而抽取文本却导致某些关键信息丢失的问题;并且由于提示模板的辅助,能够进一步加强对裁判文书关键信息的感知,减少错误问题。

    一种基于协同异质信息网络的社交推荐方法

    公开(公告)号:CN118410236A

    公开(公告)日:2024-07-30

    申请号:CN202410508454.3

    申请日:2024-04-25

    Applicant: 贵州大学

    Abstract: 一种基于协同异质信息网络的社交推荐方法。图神经网络发展为推荐系统提供了强大的支持,可以从用户‑项目交互图中学习嵌入。然而,目前的方法存在一些局限性,现有的社交感知推荐模型尚未考虑项目间的协作语义。在当前的推荐范式中,如何自动地结合节点间的多种异质语义协作关联性(如用户‑项目交互、用户社交关系、项目‑种类关系)的探索还不够充分。因此,本发明提出了一个集成了隐藏异质关系因子的协同异质信息网络的图神经网络社交推荐系统(CoHet4Rec),为异构类型的用户和项目连接维护因子化表示。此外,在图神经网络架构下设计的异构关系增强消息传播和聚合方法使得我们可以以全自动的方式将语义相关性递归地提取到用户和项目的表示中。

    一种基于DMA模型和特征划分多源文本主题模型聚类方法

    公开(公告)号:CN111813934B

    公开(公告)日:2024-04-30

    申请号:CN202010570956.0

    申请日:2020-06-22

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于DMA模型和特征划分多源文本主题模型聚类方法,所述方法包含有如下步骤:一、从多个来源收集文本集;二、将来自多个数据源的文本信息进行文本预处理;三、基于DMA模型和特征划分构建多源主题模型;四、进行Blocked Gibbs采样并更新参数;五、根据采样结果进行文本聚类。本发明通过更新多源文本的主题‑词分布的先验参数,改善了多源文本的聚类效果;本发明能够自动判别每个数据源文本中簇的数目,而不需要人为提前给定;每个数据源拥有各自的主题分布、主题‑特征词分布以及噪音词分布参数,因此本发明能保留多源文本中每个数据源的主题热点以及用词特点。

    一种结合用户意图的深度半监督文本聚类方法、设备及介质

    公开(公告)号:CN114661903A

    公开(公告)日:2022-06-24

    申请号:CN202210208434.5

    申请日:2022-03-03

    Applicant: 贵州大学

    Abstract: 本发明提出一种结合用户意图的深度半监督文本聚类方法、设备及介质,所述方法包括如下步骤:步骤一:构造意图信息矩阵;步骤二:对文本进行向量映射,通过神经网络对文本向量进行提取特征;步骤三:利用意图信息矩阵优化编码器,进一步得到更好的特征表示;步骤四:利用KL散度辅助优化得到初始聚类结果;步骤五:构建优化函数,利用意图信息引导类簇聚集方向。在给定了约束对监督信息的基础上,充分利用深度神经网络挖掘意图信息,将意图信息融合到特征表示中,同时利用意图信息监督聚类过程,有效解决了半监督文本聚类文本表示差异性、监督力度不够和忽略用户意图的问题,从而提高聚类结果的准确性,得到更适合下游任务的聚类结果。

    一种基于卷积神经网络的分段池化关系抽取方法

    公开(公告)号:CN110516239A

    公开(公告)日:2019-11-29

    申请号:CN201910788092.7

    申请日:2019-08-26

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于卷积神经网络的分段池化关系抽取方法,所述方法包括如下步骤:步骤一:基于预训练词向量和随机词向量以及零向量对文本进行向量映射;步骤二:通过神经网络对向量矩阵进行卷积操作提取特征;步骤3:对卷积后的结果分段池化进一步抽象特征;步骤4:全连接、Softmax层预测结果。在充分利用句子文本完整信息的基础上,采用实体分割策略,引入神经网络技术,充分发挥神经网络分层自动提取高维抽象特征的特点,将提取由实体分割的文本各部分池化特征,并且在一定程度上避免传统机器学习方法产生的特征稀疏问题,从而提高关系抽取的性能。

    一种基于度量学习的多维度文本聚类方法

    公开(公告)号:CN110516068A

    公开(公告)日:2019-11-29

    申请号:CN201910785197.7

    申请日:2019-08-23

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于度量学习的多维度文本聚类方法,它主要包括以下步骤:一从数据集中选取两个维度并进行特征向量化表示;二使用K-Means聚类方法并结合度量矩阵学习分别对两个维度进行初始化聚类;三判断当前的聚类结果是否达到结束条件,若不满足则设置约束对上限常数执行步骤四,否则结束算法,输出聚类结果辅助下游任务;四利用当前维度的聚类结果挑选满足条件的约束对;五将步骤四所生成的约束集合加入到维度的聚类过程中,调节目标函数和度量矩阵的学习,得到两个维度的聚类结果;六重复迭代步骤三至步骤五。此方法基于度量学习的多维度文本聚类算法综合考虑数据在不同特征空间的表现方式,进行多维度辅助聚类,有较好的聚类效果。

Patent Agency Ranking