-
公开(公告)号:CN118228162B
公开(公告)日:2024-08-20
申请号:CN202410663485.6
申请日:2024-05-27
申请人: 广东省技术经济研究发展中心
IPC分类号: G06F18/2431 , G06F18/22 , G06F18/214 , G06N20/00
摘要: 本申请提供一种基于科技型企业创新资源投入的大数据分析方法及系统,采用需要训练的创新类型识别算法的多标签分类算子确定各评估样本文本对应的第一识别结果和第二识别结果,根据识别结果分别与评估样本文本的创新类型之间的差别,确定第一类型识别误差和第二类型识别误差,将识别误差传入创新类型识别算法的误差合并算子进行误差合并得到第一目标类型识别误差,对创新类型识别算法进行训练,得到目标创新类型识别算法。以上采用误差合并算子完成训练环节,将推理预估与训练误差进行剥离,推理预估与训练误差可以自动进行平衡合并,在样本类型数据量失衡时能有效完成应用,算法同时针对基数大的和基数小的创新类型的文本具有高准确识别性能。
-
公开(公告)号:CN118333033A
公开(公告)日:2024-07-12
申请号:CN202410768253.7
申请日:2024-06-14
申请人: 广东省技术经济研究发展中心
IPC分类号: G06F40/194 , G06F18/211 , G06F18/22
摘要: 本申请提供一种基于深度学习的科技项目创新潜力预估方法及装置,将不同的表征信息对查重的参考粒度不同纳入考虑,对两个科技项目文本分别提取文本表征信息,并分别进行表征信息处理,获得二者的权重,该权重代表对科技项目查重的影响度;接着依据第一表征信息和第二表征信息的权重,对两个科技项目文本表征信息进行表征信息稀疏采样,获得T个第一和第二表征信息;也即通过加入权重的概念,可以明确对科技项目查重的重要程度,以依据权重对两个科技项目文本表征信息中的表征信息进行选取,可以在确保科技项目查重的稳定性的前提下,减少进行与科技项目查重的表征信息的数量,提高科技项目查重的速度。
-
公开(公告)号:CN118333033B
公开(公告)日:2024-08-20
申请号:CN202410768253.7
申请日:2024-06-14
申请人: 广东省技术经济研究发展中心
IPC分类号: G06F40/194 , G06F18/211 , G06F18/22
摘要: 本申请提供一种基于深度学习的科技项目创新潜力预估方法及装置,将不同的表征信息对查重的参考粒度不同纳入考虑,对两个科技项目文本分别提取文本表征信息,并分别进行表征信息处理,获得二者的权重,该权重代表对科技项目查重的影响度;接着依据第一表征信息和第二表征信息的权重,对两个科技项目文本表征信息进行表征信息稀疏采样,获得T个第一和第二表征信息;也即通过加入权重的概念,可以明确对科技项目查重的重要程度,以依据权重对两个科技项目文本表征信息中的表征信息进行选取,可以在确保科技项目查重的稳定性的前提下,减少进行与科技项目查重的表征信息的数量,提高科技项目查重的速度。
-
公开(公告)号:CN118228162A
公开(公告)日:2024-06-21
申请号:CN202410663485.6
申请日:2024-05-27
申请人: 广东省技术经济研究发展中心
IPC分类号: G06F18/2431 , G06F18/22 , G06F18/214 , G06N20/00
摘要: 本申请提供一种基于科技型企业创新资源投入的大数据分析方法及系统,采用需要训练的创新类型识别算法的多标签分类算子确定各评估样本文本对应的第一识别结果和第二识别结果,根据识别结果分别与评估样本文本的创新类型之间的差别,确定第一类型识别误差和第二类型识别误差,将识别误差传入创新类型识别算法的误差合并算子进行误差合并得到第一目标类型识别误差,对创新类型识别算法进行训练,得到目标创新类型识别算法。以上采用误差合并算子完成训练环节,将推理预估与训练误差进行剥离,推理预估与训练误差可以自动进行平衡合并,在样本类型数据量失衡时能有效完成应用,算法同时针对基数大的和基数小的创新类型的文本具有高准确识别性能。
-
-
-