-
公开(公告)号:CN116127321A
公开(公告)日:2023-05-16
申请号:CN202310133118.0
申请日:2023-02-16
申请人: 广东工业大学 , 广东能哥知识科技有限公司
IPC分类号: G06F18/214 , G06F16/951 , G06F16/9535 , G06N3/0464 , G06N3/084
摘要: 本发明公开了一种船舶新闻推送模型的训练方法、推送方法及系统,其中,训练方法包括获取船舶新闻数据集;对所述船舶新闻数据集进行新闻文本得分计算处理,得到训练数据集,所述训练数据集由多个新闻本文及与所述新闻本文相对应的新闻文本得分组成;对所述训练数据集输入船舶新闻推送模型进行训练处理,得到训练好的船舶新闻推送模型。本发明实施例能够通过使用船舶新闻推送模型解决初次阅读船舶新闻时候难以推送恰当新闻的难点,提高了船舶新闻推送的效率,可广泛应用于人工智能技术领域。
-
公开(公告)号:CN116167378A
公开(公告)日:2023-05-26
申请号:CN202310133155.1
申请日:2023-02-16
申请人: 广东工业大学 , 广东能哥知识科技有限公司
IPC分类号: G06F40/295 , G06F40/30 , G06F16/35 , G06N3/0442 , G06N3/094 , G06N3/096
摘要: 本发明公开了一种基于对抗迁移学习的命名实体识别方法及系统,其中,方法包括构建训练数据集;将训练数据集输入预处理模型进行编码处理,得到句子向量表示;将句子向量表示输入双向长短时记忆网络进行特征提取处理,得到特征集合;将私有特征集合输入自注意力层进行依赖关系分析处理,得到命名实体任务表示和中文分词任务表示;将命名实体任务表示和中文分词任务表示输入条件随机场层进行解码处理,得到命名实体序列标签和中文分词序列标签;根据命名实体序列标签和中文分词序列标签结合任务分类器对未训练的命名实体识别模型进行对抗学习训练处理。本发明实施例能够提高命名实体识别的准确率,可广泛应用于人工智能技术领域。
-
公开(公告)号:CN116310452B
公开(公告)日:2024-03-19
申请号:CN202310132746.7
申请日:2023-02-16
申请人: 广东能哥知识科技有限公司 , 广东工业大学
IPC分类号: G06V10/762 , G06V10/54
摘要: 本发明公开了一种多视图聚类方法及系统,其中,方法包括获取单视图数据集;对所述单视图数据集进行特征提取处理,得到多视图数据集;对所述多视图数据集进行张量构建处理,得到多视图张量;根据所述多视图张量对所述多视图数据集的子空间特征与内部相关性进行学习处理,得到优化矩阵;根据混合抽样算法和变体近邻算法对所述优化矩阵进行二分图构建处理,得到聚类二分图;根据所述聚类二分图对所述多视图数据集进行切割处理,得到多视图聚类结果。本发明实施例能够减低噪声点的产生,提高多视图聚类的鲁棒性,可广泛应用于数据挖掘技术领域。
-
公开(公告)号:CN116310452A
公开(公告)日:2023-06-23
申请号:CN202310132746.7
申请日:2023-02-16
申请人: 广东能哥知识科技有限公司 , 广东工业大学
IPC分类号: G06V10/762 , G06V10/54
摘要: 本发明公开了一种多视图聚类方法及系统,其中,方法包括获取单视图数据集;对所述单视图数据集进行特征提取处理,得到多视图数据集;对所述多视图数据集进行张量构建处理,得到多视图张量;根据所述多视图张量对所述多视图数据集的子空间特征与内部相关性进行学习处理,得到优化矩阵;根据混合抽样算法和变体近邻算法对所述优化矩阵进行二分图构建处理,得到聚类二分图;根据所述聚类二分图对所述多视图数据集进行切割处理,得到多视图聚类结果。本发明实施例能够减低噪声点的产生,提高多视图聚类的鲁棒性,可广泛应用于数据挖掘技术领域。
-
公开(公告)号:CN116127017A
公开(公告)日:2023-05-16
申请号:CN202310133135.4
申请日:2023-02-16
申请人: 广东工业大学 , 广东能哥知识科技有限公司
IPC分类号: G06F16/33 , G06F16/36 , G06F18/214
摘要: 本发明公开了一种基于关系特征提取的知识补全方法及系统,其中,方法包括:根据私有特征提取网络对第一参考集进行私有特征提取处理,得到第三参考集;根据共有特征提取网络对第三参考集进行共有特征提取处理,得到第一样本关系特征表示;根据样本关系特征表示,对第一参考集和第二参考集进行参考集分数计算处理,得到参考集损失;根据参考集损失的损失梯度对样本关系特征表示进行更新处理,得到第二样本关系特征表示;根据第二样本关系特征表示,对第一查询集和第二查询集进行查询集分数计算处理,得到查询集损失。本发明实施例能够对实体对蕴含的私有关系特征和共有关系特征进行提取,提高知识补全能力,可广泛应用于人工智能技术领域。
-
公开(公告)号:CN116401143A
公开(公告)日:2023-07-07
申请号:CN202211630770.5
申请日:2022-12-19
申请人: 广东能哥知识科技有限公司 , 广东工业大学
IPC分类号: G06F11/36 , G06F18/214 , G06F18/24 , G06N3/04 , G06N3/08
摘要: 本发明提供的一种基于不平衡数据集的软件测试方法及系统,方法包括以下步骤:获取不平衡的软件缺陷的样本数据,对样本数据进行预处理;根据预处理之后的样本数据的不平衡特性为样本数据中的数据类别设定代价敏感系数;根据包括代价敏感系数的样本数据训练代价敏感核宽度学习系统分类模型;通过网格搜索确定最优惩罚系数,根据最优惩罚系数确定模型的目标参数;根据目标参数构建得到目标分类模型,通过目标分类模型对测试实例进行分类预测,输出预测结果;方案可有效消除软件缺陷数据集极端不平衡的特性对分类性能的影响,提高分类精确度,并且同时解决了特征工程工作中训练繁琐问题,提高了模型的训练效率,可广泛应用于计算机技术领域。
-
公开(公告)号:CN116127921A
公开(公告)日:2023-05-16
申请号:CN202310133432.9
申请日:2023-02-16
申请人: 广东工业大学 , 广东能哥知识科技有限公司
IPC分类号: G06F40/126 , G06F16/35
摘要: 本发明公开了一种实体关系联合三元组的知识抽取方法及系统,其中,方法包括:获取待处理文本;对所述待处理文本进行向量编码处理,得到文本向量表示集合;对所述文本向量表示集合进行关系抽取处理,得到文本关系集合;根据所述文本关系集合对所述文本向量表示集合进行头实体抽取处理,得到头实体集合;根据所述头实体集合对所述文本向量表示集合进行尾实体抽取处理,得到尾实体集合;对所述头实体集合和所述尾实体集合进行双仿射关系抽取处理,得到抽取结果。本发明实施例能够更充分地考虑关系对实体、实体和实体的交互作用,解决实体关系重叠问题,可广泛应用于自然语言处理技术领域。
-
公开(公告)号:CN116090459A
公开(公告)日:2023-05-09
申请号:CN202211648300.1
申请日:2022-12-21
申请人: 广东工业大学 , 广东能哥知识科技有限公司
IPC分类号: G06F40/295
摘要: 本发明公开了一种命名实体识别的数据增强方法及系统,方法包括:获取命名实体识别语料;对命名实体识别语料进行预处理,得到训练数据集;将训练数据集输入未训练的数据增强模型,通过第一数据集对提示生成器进行提示生成处理得到提示参数,并根据提示参数对预训练模型进行更新处理,得到训练完成的数据增强模型;获取标注填充矩阵,并将所述标注填充矩阵输入所述数据增强模型进行数据增强处理,得到数据增强句子;将数据增强句子进行标注转换处理,得到第三数据集;从第三数据集中进行数据抽取到第一数据集中,得到数据增强数据集。本发明实施例能够生成高质量的数据,从而减少噪音,提高模型性能,可广泛应用于人工智能技术领域。
-
公开(公告)号:CN116542320A
公开(公告)日:2023-08-04
申请号:CN202310506290.6
申请日:2023-05-06
申请人: 广东工业大学
摘要: 本发明提供一种基于持续学习的小样本事件检测方法和系统,方法包括:获取事件检测初始数据集并进行预处理,根据预处理后的事件检测初始数据集建立包括若干个阶段的小样本事件检测增量任务集合,建立基于持续学习的小样本事件检测框架,在面对相继到来的新任务的持续学习时,首先学习新类型的原型表示并保存为新类型知识,然后通过经验回放机制、知识蒸馏和旧类型与新类型之间的知识转移来获得新类型的事件检测结果,本发明的方法能够解决传统模型的遗忘问题,同时丰富新类型和旧类型之间的联系,提高事件检测的效率和精度。
-
公开(公告)号:CN114328951A
公开(公告)日:2022-04-12
申请号:CN202111538747.9
申请日:2021-12-15
申请人: 广东工业大学
IPC分类号: G06F16/36 , G06F16/951 , G06F16/955 , G06F40/211 , G06F40/253 , G06F40/289 , G06F40/30
摘要: 本发明涉及一种融合信息获取和三元组抽取的知识图谱构建方法,包括以下步骤:S1:定时利用爬虫技术从指定的网页中爬取海洋相关的包括新闻在内的文本内容;S2:利用自然语言处理工具对文本内容进行实体抽取及关系抽取,得到新闻的三元组,之后将新闻的三元组存储进数据库中;S3:根据数据库中的三元组构建知识图谱,并在数据浏览器中实现知识图谱的可视化;S4:根据可视化的知识图谱获取知识的关联。上述方案中,融合了信息获取和三元组抽取来构建知识图谱,将整个流程构建成为一个端到端的任务,减少用户使用成本;构建出海洋知识图谱,进而从零散数据中发现知识,挖掘事物的关联性,帮助组织机构做出指导性的决策。
-
-
-
-
-
-
-
-
-