-
公开(公告)号:CN114692637A
公开(公告)日:2022-07-01
申请号:CN202210288286.2
申请日:2022-03-23
Applicant: 华南理工大学
IPC: G06F40/295 , G06F40/211 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种面向句子级别的关系抽取方法、设备及存储介质,包括获得一个句子,在每个实体的两端分别插入特殊标记,输入预训练语言模型得到该句子每个词的词向量;使用随机初始化的多个关系向量分别对每个词向量计算相关度,进一步计算二分类损失;使用平均池化计算句子向量、实体向量,使用最大池化计算关系向量,将这些特殊输入多分类器得到多分类损失;将句子中的实体一定概率掩藏得到另外一个句子,衡量两个句子输出分布的一致性损失;对上述步骤中的所有损失联合训练。本发明能够有效抽取文本中的关键信息,捕捉文本中实体的联系,从而达到良好的关系抽取性能。
-
公开(公告)号:CN109635946A
公开(公告)日:2019-04-16
申请号:CN201811442502.4
申请日:2018-11-29
Applicant: 华南理工大学
CPC classification number: G06N3/08 , G06K9/6218
Abstract: 本发明公开了一种联合深度神经网络和成对约束的聚类方法,包括下述步骤:给定包括成对约束的数据集;构建两个相同结构的自编码器网络和一个深度神经网络,两个自编码器网络分别输入数据集中的每一个约束对的两个样本,两个自编码器网络的中间输出的差向量,作为深度神经网络的输入;然后训练自编码器网络和深度神经网络;将两个训练过的自编码网络和深度神经网络结合到聚类算法上,使用聚类算法进行聚类任务。本发明联合深度神经网络和数据间的成对约束,通过自编码网络对输入数据进行降维操作和深度神经网络学习特征,同时重构网络模型的损失函数,有效提高了聚类算法的聚类精度。
-
公开(公告)号:CN108415977A
公开(公告)日:2018-08-17
申请号:CN201810131702.1
申请日:2018-02-09
Applicant: 华南理工大学
Abstract: 本发明公开了一个基于深度神经网络及强化学习的生成式机器阅读理解方法,该方法通过结合注意力机制的深层神经网络来对文本和问题进行编码,形成融合了问题信息的文本向量表示之后,再通过单向LSTM解码器进行解码,逐步生成对应的答案文本。本发明公开的阅读理解方法融合了抽取式模型和生成式模型的优点,采用多任务联合优化的方式进行训练,训练过程中同时还使用了强化学习方法,有利于生成更加准确而流畅的答案文本。
-
公开(公告)号:CN111339374A
公开(公告)日:2020-06-26
申请号:CN202010114785.0
申请日:2020-02-25
Applicant: 华南理工大学
IPC: G06F16/901 , G16B25/00 , G16B40/00
Abstract: 本发明公开了一种基于加权三角密度的稠密子图抽取方法,包括步骤:S1、给定一个图数据,建立起图网络;S2、用三角形抽取算法将图网络中的三角形集合抽取出来;S3、根据应用场景对每个三角形进行合适的赋权,定义密度函数;S4、利用赋权好的三角形集合,建立起流网络;S5、利用二分法搜索合适的流网络参数;S6、计算流网络的S集和输入顶点集合交集,得到稠密子图。本发明能够从稀疏的图中,根据图的结构信息抽取出边密度高的子图,并且可以结合节点本身的信息,使得抽取出的子图不仅密度大并且符合应用场景要求,能够应用在蛋白质作用分析等图挖掘应用中。
-
公开(公告)号:CN117891957B
公开(公告)日:2024-05-07
申请号:CN202410289201.1
申请日:2024-03-14
Applicant: 华南理工大学
IPC: G06F16/36 , G06F16/33 , G06N3/0455 , G06N3/0499 , G06N3/08 , G06N5/02
Abstract: 本发明公开了一种基于预训练语言模型的知识图谱补全方法,通过对现有知识图谱进行文件格式处理以及建立实体、关系的编号与名称的映射与格式化,获得适用于模型的知识三元组数据,然后使用预训练语言模型提取三元组中实体与关系的嵌入,进行训练学习。本发明设计了基于相对变换的对抗学习方法以及实体细粒度表示方法,能够显著提高模型的学习效率,进而提高知识图谱补全的效果。
-
公开(公告)号:CN117891957A
公开(公告)日:2024-04-16
申请号:CN202410289201.1
申请日:2024-03-14
Applicant: 华南理工大学
IPC: G06F16/36 , G06F16/33 , G06N3/0455 , G06N3/0499 , G06N3/08 , G06N5/02
Abstract: 本发明公开了一种基于预训练语言模型的知识图谱补全方法,通过对现有知识图谱进行文件格式处理以及建立实体、关系的编号与名称的映射与格式化,获得适用于模型的知识三元组数据,然后使用预训练语言模型提取三元组中实体与关系的嵌入,进行训练学习。本发明设计了基于相对变换的对抗学习方法以及实体细粒度表示方法,能够显著提高模型的学习效率,进而提高知识图谱补全的效果。
-
公开(公告)号:CN116384492A
公开(公告)日:2023-07-04
申请号:CN202310159922.6
申请日:2023-02-23
Applicant: 华南理工大学
IPC: G06N5/025 , G06F40/295 , G06F16/36 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种基于最优传输理论的实体关系抽取方法,包括以下步骤:S1.构建实体关系的定义集,将实体关系的类别定义语句输入BERT模型,利用定义集对BERT模型进行训练,更新BERT模型参数;S2.获取训练集,将训练语句输入BERT模型,利用训练集对BERT模型进行训练,计算训练语句与对应实体关系的类别定义语句之间的最优传输距离,利用最优传输距离更新BERT模型参数,直至训练完成;S3.将待预测语句输入训练好的BERT模型,利用BERT模型对待预测语句的实体关系进行预测,BERT模型输出待预测语句的实体关系。BERT模型学习实体关系类别的具体定义,通过计算语句与对应实体关系的类别定义语句之间的最优传输距离,从而实现对每一类别定义的语义利用,提高实体关系抽取的准确度。
-
公开(公告)号:CN104408072A
公开(公告)日:2015-03-11
申请号:CN201410605262.0
申请日:2014-10-30
Applicant: 广东电网有限责任公司电力科学研究院 , 华南理工大学
IPC: G06F17/30
CPC classification number: G06F17/30988
Abstract: 本发明的目的在于提供一种基于复杂网络理论的适用于分类的时间序列特征提取方法,本方法的步骤包括:首先,将时间序列转化为相应的复杂网络;其次,为了得到适用于分类的特征向量,对所得复杂网络的统计特征进行提取,得到相应的特征向量;最后,将所得特征向量输入分类器,对时间序列进行分类。通过实验验证本发明所提方法的有效性,实验结果表明将该方法所提取特征应用于时间序列分类能够达到较高的准确率。
-
公开(公告)号:CN104361054A
公开(公告)日:2015-02-18
申请号:CN201410604192.7
申请日:2014-10-30
Applicant: 广东电网有限责任公司电力科学研究院 , 华南理工大学
IPC: G06F17/30
CPC classification number: G06F17/30339 , G06F17/30241 , G06F17/30395 , G06F17/30398 , G06F17/30575
Abstract: 本发明的目的在于提供一种电力系统线损重构定位及可视化方法及其系统,该方法包括基于实际地理地图样式—百度地图显示线损的步骤,以及,基于层次检索以及智能检索的线损查询的步骤;所述基于地理地图样式显示线损的步骤是采用GIS技术,以代表电力单位层级关系的放射图以及连接图逐级显示电量和线损;所述基于层次检索以及智能检索的线损查询步骤是以分布式数据库为平台,通过Web端展示,使用鼠标,键盘的简单操作进行线损查询。本发明实现了可视化图形交互方式以及直观的线损可视化效果对比,在宏观层面提供了一个观察某地区线损情况的良好角度,有效地解决了抽象线损数据的基于实际地理位置的可视化问题。
-
公开(公告)号:CN108415977B
公开(公告)日:2022-02-15
申请号:CN201810131702.1
申请日:2018-02-09
Applicant: 华南理工大学
IPC: G06F16/332 , G06F40/289 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一个基于深度神经网络及强化学习的生成式机器阅读理解方法,该方法通过结合注意力机制的深层神经网络来对文本和问题进行编码,形成融合了问题信息的文本向量表示之后,再通过单向LSTM解码器进行解码,逐步生成对应的答案文本。本发明公开的阅读理解方法融合了抽取式模型和生成式模型的优点,采用多任务联合优化的方式进行训练,训练过程中同时还使用了强化学习方法,有利于生成更加准确而流畅的答案文本。
-
-
-
-
-
-
-
-
-