基于知识约束的两步式辟谣文本生成方法

    公开(公告)号:CN113627146B

    公开(公告)日:2024-05-28

    申请号:CN202110918103.6

    申请日:2021-08-11

    申请人: 厦门大学

    摘要: 基于知识约束的两步式辟谣文本生成方法,涉及自然语言处理领域。针对辟谣文本对外部知识高度依赖以及辟谣长文本生成困难的问题,以谣言为研究对象,基于Transformer的多层解码器架构建立知识文本生成模型,利用知识三元组生成知识文本序列,同时采用pytorch版的GPT2‑ML模型建立辟谣结论生成模型,引入谣言约束和知识约束生成辟谣结论,将生成的知识文本序列和辟谣结论共同组成辟谣文本。两步式辟谣文本方法效果明显优于其他的生成方法,不仅缓解辟谣长文本生成困难的问题,还使生成的辟谣文本更具逻辑性。

    一种基于语法结构与连接信息触发的复杂句情感分析方法

    公开(公告)号:CN114282530A

    公开(公告)日:2022-04-05

    申请号:CN202111597320.6

    申请日:2021-12-24

    申请人: 厦门大学

    摘要: 一种基于语法结构与连接信息触发的复杂句情感分析方法,涉及自然语言处理。包括以下步骤:1)构建连词信息触发的情感层次模型;2)使用迁移学习方法对子句子编码器进行预训练;3)情感划分模块将复杂句子划分为多个简单的情感模块;4)子句编码器对每个情感模块单独进行编码,分别生成情感表达;5)句子编码器融合多个情感模块,并根据基于连接信息触发的注意机制指导多个情感模块的融合。可以准确提取复杂句子中的主要情感表达,并且解决复杂句中因多种情感共现和复杂的句子结构导致的情感模型预测效果不佳的问题。当一个句子中出现多种情感共现时,可以准确找到复杂句中重要的情感部分。

    一种微博谣言传播的分析方法

    公开(公告)号:CN108153884B

    公开(公告)日:2020-11-10

    申请号:CN201711436575.8

    申请日:2017-12-26

    申请人: 厦门大学

    摘要: 一种微博谣言传播的分析方法,涉及社会网络建模与分析。构建微博数据信息数据库,爬取微博用户资料和微博数据,并进行系列数据预处理操作;构建博弈论模型;基于博弈论的仿真,分析微博传播;从微博用户的角度出发,考虑用户对谣言的选择策略,构建出基本的博弈模型和责任均分的博弈模型,把博弈模型和微博谣言传播网络结构相结合,以此模拟谣言的传播过程。可以一定程度上模拟出微博谣言的传播情况,其模拟结果受所处网络结构的影响。

    一种基于多模态一致性的短视频谣言检测方法

    公开(公告)号:CN115965810A

    公开(公告)日:2023-04-14

    申请号:CN202211555818.0

    申请日:2022-12-06

    申请人: 厦门大学

    摘要: 一种基于多模态一致性的短视频谣言检测方法,属于自然语言处理领域。针对谣言视频中存在对于主题的曲解和关键帧的篡改的问题,设计一种基于主题和关键帧的短视频谣言分类模型TKCM;TKCM使用聚合网络获取视频的主题特征、使用注意力网络获取视频的关键帧特征,将两者信息输入模态调节机制调整网络对三种模态的重要性关注度,拼接特征进行短视频谣言检测。针对谣言视频存在不一致问题,提出学习不一致信息的方法,将融入主题、关键帧和不一致性信息的方法ICIM一起用来谣言检测。实验结果表明,在短视频谣言数据集上的F1值比常用的视频分类模型有4%~7%的提升。与融入一致性信息之前的模型相比,在F1值上有2.3%的提升。

    一种基于情感引导的跨模态视频情感分析方法

    公开(公告)号:CN115828891A

    公开(公告)日:2023-03-21

    申请号:CN202211578663.2

    申请日:2022-12-06

    申请人: 厦门大学

    摘要: 一种基于情感引导的跨模态视频情感分析方法,涉及自然语言处理。围绕如何应对跨模态原始数据中的情感信息淡化问题,提出基于增强文本embedding的情感引导机制和基于提示学习Prompt的情感引导机制。根据一个预定义好的情感词典匹配出源数据中的情感内容。基于增强文本embedding的情感引导机制通过对文本模态情感内容的注意力权重进行一定的干预。基于提示学习情感引导机制引入一个带有情感槽位的提示Prompt模版,通过情感预测的辅助任务增加模型对情感信息的学习能力和关注力度。该情感引导机制能达到甚至超越目前主流模型水平,且具有泛化到主流模型上的能力。几种情感引导机制的消融实验结果证明各自的有效性。

    一种微博谣言传播的分析方法

    公开(公告)号:CN108153884A

    公开(公告)日:2018-06-12

    申请号:CN201711436575.8

    申请日:2017-12-26

    申请人: 厦门大学

    IPC分类号: G06F17/30 G06F17/27 G06Q50/00

    摘要: 一种微博谣言传播的分析方法,涉及社会网络建模与分析。构建微博数据信息数据库,爬取微博用户资料和微博数据,并进行系列数据预处理操作;构建博弈论模型;基于博弈论的仿真,分析微博传播;从微博用户的角度出发,考虑用户对谣言的选择策略,构建出基本的博弈模型和责任均分的博弈模型,把博弈模型和微博谣言传播网络结构相结合,以此模拟谣言的传播过程。可以一定程度上模拟出微博谣言的传播情况,其模拟结果受所处网络结构的影响。

    一种基于粗粒度层级结构树的复杂句情感分析方法

    公开(公告)号:CN115730582A

    公开(公告)日:2023-03-03

    申请号:CN202211556149.9

    申请日:2022-12-06

    申请人: 厦门大学

    摘要: 一种基于粗粒度层级结构树的复杂句情感分析方法,涉及自然语言处理领域。解决复杂句情感分析中的多种情感共现问题和连词层级关系问题。包括以下步骤:1)构建连接信息词库;2)提取复杂句中的情感模块;3)构建粗粒度层级结构树生成模型;4)利用图模型对该层级结构树建模;5)将复杂句的特征与粗粒度结构树的表征结合,生成情感表达。可以准确找到复杂句中重要的情感部分,弥补了深度学习在复杂句情感分析上的可解释性差的问题,对模型产生的结果有很好的可视化解释说明。实验表明,在复杂句数据集上的效果明显的超越了现有情感分析方法,并有一定的通用性和跨语言能力。

    一种业务流程异常节点溯源方法

    公开(公告)号:CN112800282B

    公开(公告)日:2022-11-08

    申请号:CN202110054367.1

    申请日:2021-01-15

    申请人: 厦门大学

    摘要: 一种业务流程异常节点溯源方法,涉及流程图的构建与查找。包括以下步骤:1)通过数据仿真构建包含属性图信息的业务流程图;业务流程图中包括节点、节点属性、节点关系,属性图包含节点属性的转换关系;2)根据业务流程图和属性图中节点的属性数据流动关系,结合深度优先遍历搜索算法,基于属性图约束对业务流程图进行剪枝优化,将与异常节点路径上不相关的支路去除,给出起始溯源的具体属性,沿着该属性的方向逆向查找异常点,完成业务流程异常节点溯源。加快网络对异常节点的搜索速度,提升搜索效率,可实现高效异常逆向溯源搜索,为流程推进提供有力保障具有实际意义。

    基于知识约束的两步式辟谣文本生成方法

    公开(公告)号:CN113627146A

    公开(公告)日:2021-11-09

    申请号:CN202110918103.6

    申请日:2021-08-11

    申请人: 厦门大学

    摘要: 基于知识约束的两步式辟谣文本生成方法,涉及自然语言处理领域。针对辟谣文本对外部知识高度依赖以及辟谣长文本生成困难的问题,以谣言为研究对象,基于Transformer的多层解码器架构建立知识文本生成模型,利用知识三元组生成知识文本序列,同时采用pytorch版的GPT2‑ML模型建立辟谣结论生成模型,引入谣言约束和知识约束生成辟谣结论,将生成的知识文本序列和辟谣结论共同组成辟谣文本。两步式辟谣文本方法效果明显优于其他的生成方法,不仅缓解辟谣长文本生成困难的问题,还使生成的辟谣文本更具逻辑性。

    用于中医健康状态分析的四诊表征信息融合方法

    公开(公告)号:CN109087702A

    公开(公告)日:2018-12-25

    申请号:CN201810878380.7

    申请日:2018-08-03

    申请人: 厦门大学

    IPC分类号: G16H50/20 G16H50/70 G06K9/62

    摘要: 用于中医健康状态分析的四诊表征信息融合方法,采集临床就诊患者的望、闻、问、切等信息,用于生成病人的多源信息表示,并标注其隶属的证型类别;利用每个信息源的特征表征及其类别信息分别对测试者的健康状态进行分析,得多个信息源对测试者的辅助决策信息;构建信息融合模型使得决策一致性最大化,用于返回优化的健康状态分析结果;对比测试者的实际健康状态与相应的预测结果来评价所提算法的性能。能检测出测试者当前的健康状态和病变本质,使得测试者能够明自身的体质状况,为制定干预方案提供参考。能提供高精度的健康状态分析结果,为健康保健提供依据。能融合临床就诊患者的四诊表征信息,获得更加准确可靠的状态分析结果。