-
公开(公告)号:CN112052665B
公开(公告)日:2023-06-20
申请号:CN202010956662.1
申请日:2020-09-12
申请人: 广东工业大学
IPC分类号: G06F40/211 , G06F40/284 , G06F40/30 , G06F16/33 , G06F16/35
摘要: 本发明公开了一种远程监督事件抽取方法及其应用,其中所述抽取方法包括:构建待抽取信息的触发词林;构建待抽取信息的知识库;构建待抽取信息的事件数据集;通过神经网络模型进行事件抽取。本发明的抽取方法可对离散化的、碎片化的、和/或无法经过直接的句子抽取获得事件信息的信息进行准确高效的抽取,特别适用于对剧本类信息的事件抽取中。
-
公开(公告)号:CN115841116A
公开(公告)日:2023-03-24
申请号:CN202210835067.1
申请日:2022-07-15
申请人: 广东工业大学 , 广东能哥知识科技有限公司
IPC分类号: G06F40/289 , G06N3/0442 , G06N3/049 , G06N3/08 , G06N3/126
摘要: 本发明提供一种融合遗传算法和元学习的特征学习方法,包括以下步骤:(1)采用预训分词模型对输入文本进行分词;(2)使用预训练词向量对分词结果编码;(3)然后采用遗传算法进行特征筛选;(4)句子级序列编码采用Att‑Bilstm模型;(5)接下来采用最优特征组合作为元学习模型的输入;(6)采用岭回归分类器。本发明提出一种整合基因遗传算法特征提取、小样本学习框架和岭回归分类器的方法;采用遗传算法降低了输入文本的维度,小样本学习框架提升多任务之间快速学习能力,岭回归分类器避免泛化能力不足的弊端。
-
公开(公告)号:CN112989049A
公开(公告)日:2021-06-18
申请号:CN202110343641.7
申请日:2021-03-30
申请人: 广东工业大学
IPC分类号: G06F16/35 , G06F40/211 , G06N3/04
摘要: 本发明提供一种小样本文本分类方法、装置、计算机设备和存储介质,所述方法包括:获取文本数据集并处理,获得小样本文本数据集;对小样本文本数据集中的文本数据预处理;获得预处理后文本数据的词向量和句向量表征形式;以句子为单元划分句子节点,计算句子节点间的权重;遍历所有句子节点,计算每个句子节点的累加权重至收敛;按累加权重的数值从大到小对句子节点进行排序,将前n位的句子节点对应的句向量作为文本摘要;对文本摘要的句向量中词向量加权,获得最终句向量;利用最终句向量对分类器进行训练,利用文本数据对分类器进行性能测试,实现分类。本方法可以在少量样本数据中实现快速学习,对新样本进行分类,分类结果准确,稳定性强。
-
公开(公告)号:CN112015890A
公开(公告)日:2020-12-01
申请号:CN202010928786.9
申请日:2020-09-07
申请人: 广东工业大学
IPC分类号: G06F16/34 , G06F16/33 , G06F40/295 , G06F16/35
摘要: 本发明提供了一种电影剧本摘要的生成方法和装置,方法包括:获取待分析的电影剧本和情节关键字;对待分析的电影剧本进行分析得到初始三元组;采用图卷积神经网络对初始三元组建立图结构;获取结点的特征向量根据特征向量计算各结点的重要性值;根据各重要性值从初始三元组筛选出第一重要三元组;将情节关键字与初始三元组进行文本匹配筛选出第二重要三元组;将第一重要三元组和第二重要三元组进行合并删除重复的三元组,形成最终重要三元组;将最终重要三元组输入至预先训练的神经规划器,得到文本规划;根据文本规划生成引用表达式;将引用表达式输入至神经翻译系统,得到电影剧本摘要。该方法能提高摘要生成的可靠性并且生成速度快。
-
公开(公告)号:CN111881258B
公开(公告)日:2023-06-20
申请号:CN202010738172.4
申请日:2020-07-28
申请人: 广东工业大学
IPC分类号: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/289
摘要: 本发明公开了一种自学习事件抽取方法及其应用,其中所述事件抽取方法先通过事件信息的句向量、每个句向量内包含的候选词‑角色映射对候选词进行自学习筛选,获得触发词集合,本发明可快速、准确地对工业生产异常日志等类信息进行解读,进一步做出合适的决策。
-
-
公开(公告)号:CN111950784B
公开(公告)日:2023-06-09
申请号:CN202010774588.1
申请日:2020-08-04
申请人: 广东工业大学
IPC分类号: G06Q10/04 , G06Q10/0639 , G06Q50/04 , G06N3/0442 , G06N3/08
摘要: 本发明公开了一种融合注意力机制的产能预测方法,其包括:通过经特征筛选后的生产因素数据和其对应的产能数据对CNN模型进行训练和/或测试,在一些具体实施方式中,所述模型为LSTM‑Attention模型。本发明可对工业产品的产能进行准确、高效的预测。
-
公开(公告)号:CN113283667A
公开(公告)日:2021-08-20
申请号:CN202110662940.7
申请日:2021-06-15
申请人: 广东工业大学
摘要: 本申请公开了一种海洋产业发展趋势分析方法,通过网络爬虫技术获取海洋产业的企业数据信息和企业文本信息;采用预置LSNet根据企业数据信息进行未来海洋产业数据预测,得到海洋产业预测结果,预置LSNet包括预置卷积神经网络和预置递归神经网络;通过预置社区发现算法将图结构化的企业文本信息进行分块处理,得到文本信息块;根据企业文本信息和文本信息块计算企业的聚集程度;基于海洋产业预测结果和聚集程度指导企业决策的制定,企业决策包括企业选址、企业投资和企业合作对象选择。本申请能够克服现有技术无法适应新型海洋产业中出现的多种复杂,多维化的产业信息,导致实际分析结果可靠性较差的技术问题。
-
公开(公告)号:CN112001178A
公开(公告)日:2020-11-27
申请号:CN202010875000.1
申请日:2020-08-27
申请人: 广东工业大学
IPC分类号: G06F40/295 , G06N20/00 , G06F40/211 , G06F40/194 , G06F40/216
摘要: 本发明公开了一种长尾实体的识别与消歧方法,其中所述长尾实体的消歧方法包括对识别出的长尾实体进行候选实体替换的过程。本发明可对长尾实体进行准确高效地消歧,可显著提升对文本中不同指称的理解,更好地进行信息跟踪及信息获取。
-
-
-
-
-
-
-
-
-